Introduction
Mettre en relation des entités de toute nature est une opération commune et universelle. Le développement rapide des techniques (rebaptisées technologies par tropisme anglophile) n'a-t-il pas transformé notre planète en monde connecté ? Connecter, associer, relier, joindre, etc. sont des opérations incontournables, fondamentales et omniprésentes en informatique et en mathématiques.
Les relations permettent de modéliser des systèmes complexes, de résoudre des problèmes pratiques et de concevoir des algorithmes efficaces. Ce concept est au cœur même des bases de données relationnelles, dans lesquelles les données sont organisées en tables codant des relations entres ensembles de données. Les requêtes sont alors fondées sur des opérations permettant de combiner ces différentes relations. Les réseaux de télécommunication sont modélisés par des graphes dans lesquels les relations entre objets connectés jouent un rôle clef, les algorithmes de routage s'appuyent sur ces relations pour déterminer des chemins optimaux entre deux nœuds selon les débits et/ou la latence d'une connection, etc. Les fonctions constituent souvent des objets élémentaires des langages de programmation et sont à la base de l'apprentissage automatique, etc.
Encore une fois, nous allons commencer par exposer un problème ludique dont l'analyse et la résolution mettrons en évidence l'utilité, la versatilité et la force des concepts introduits dans ce chapitre :
Deux joueurs sont faces à un tas d'allumettes et doivent retirer une, deux ou trois allumettes du tas à tour de rôle jusqu'à ce que le tas soit vide. Le dernier à pouvoir jouer gagne la partie, le perdant est donc celui qui ne peut plus retirer d'allumettes car le tas est vide. Existe-t-il une stratégie gagnante ?
Relations, correspondances
Définitions
On généralise aisément la notion de graphe défini sur le produit cartésien de deux ensembles \(X\) et \(Y\) à un produit cartésien d'un nombre arbitraire d'ensembles \(X_i\).
On parle de relation unaire quand \(q=1\), de relation binaire quand \(q=2\) — auquel cas on retrouve naturellement le vocable usuel de graphe plutôt que \(2\)-graphe — et de relation ternaire quand \(q=3\), etc.
Parmi tous les types de relations, les relations binaires sont les plus utilisées et font l'objet d'une attention toute particulière. On note généralement une relation binaire de manière infixe \(x{\rel}y\), plutôt que préfixe \(\rel(x,y)\), mimant ainsi plus fidèlement l'expression \(x\) est en relation avec \(y\). Une section spécifique de ce chapitre sera consacrée aux relations binaires entre éléments d'un même ensemble, i.e. \(Y=X\).
Le jumelage entre communes françaises et étrangères constitue une relation binaire. Ainsi la ville de La Garde est jumelée avec la ville de Montesarchio en Italie ainsi que la ville de Spa en Belgique. Un jumelage fait correspondre certaines communes françaises à certaines communes étrangères.
Dans le cadre de cette étude, une relation binaire entre deux ensembles \(X\) et \(Y\) est souvent rebaptisée correspondance. À des éléments de \(X\), on fait correspondre des éléments de \(Y\). Sa définition s'appuie directement sur un graphe sans plus faire référence à un prédicat :On représente une correspondance à l'aide d'un diagramme sagittal *(*) En forme de flèche. qui en fournit une interprétation concrète. Les ensembles de départ \(X\) et d'arrivée \(Y\) sont matérialisés par des patates et chaque couple \({\color{#FF8}(x,y)}\) du graphe \({\color{#FF8}G}\) par une flèche reliant \(x\) à \(y\) : \[x\,{\color{#FF8}\rg}\,y.\] La flèche a pour premier mérite de mettre en évidence l'asymétrie de la construction puisque \((x,y)\not=(y,x).\)
Le diagramme sagittal ci-dessus illustre le jumelage de quelques villes. On constate que les villes de Mazaugues et Signes ne sont pas jumelées avec des villes étrangères et que les villes étrangères de Liski et Vegen ne correspondent à aucun jumelage.
En inversant le sens des flèches du diagramme sagittal d'une correspondance \(c=(X,G,Y)\) et en inversant les rôles des ensembles de départ \(X\) et d'arrivée \(Y\), on obtient une nouvelle correspondance appelée correspondance réciproque de \(c\) et on la note \(c^{-1}\).
Images directes et réciproques
Si \(c=(X,G,Y)\) est une correspondance, l'image directe par \(c\) d'une partie \(A\subseteq X\) de l'ensemble de départ, notée \(c(A)\), est le sous-ensemble des éléments de l'ensemble d'arrivée \(Y\) atteints par les éléments de \(A\). Ainsi pour la partie \(A:=\{La\ Garde,\ Nice\}\) de l'exemple introductif, on a
\begin{equation*} c(A)=\{Montesarchio,\ Spa,\ Alicante,\ Cuneo,\ Yalta\}. \end{equation*}Réciproquement, l'image réciproque par \(c\) d'une partie \(B\subset Y\), notée \(c^{-1}(B)\), est l'image directe de \(B\) pour la correspondance réciproque \(c^{-1}\). Toujours avec l'exemple introductif et en considérant \(B:=\{Spa,\ Kronstad\}\), on a
\begin{equation*} c^{-1}(B)=\{La\ Garde,\ Toulon\}. \end{equation*}Plus formellement :
D'après cette définition, on a donc \(\text{Im}(c)=c(X)\). Notons qu'il est bien plus efficace de garder une image mentale d'une correspondance sous forme de diagramme sagittal pour retrouver aisément toutes ces définitions que de les apprendre par cœur. Pour reprendre la métaphore musicale de l'introduction de ce cours, il est beaucoup plus simple de retenir et fredonner la mélodie d'une chanson pour en retrouver la partition plutôt que d'apprendre cette partition.
Composition des correspondances
Le terme de correspondance est familier du lecteur qui a voyagé et a dû changer de train durant son périple. Pour illustrer le propos, on modélise une fiche horaire entre deux villes par une correspondance \(g=(X,{\color{#FF8}G},Y)\) où les ensembles \(X\) et \(Y\) contiennent respectivement les heures de départ et d'arrivée des différents trains reliant les deux villes \(X\) et \(Y\). Si l'on dispose d'une deuxième correspondance \(h=(Y,{\color{#08F}H},Z)\) reliant les villes \(Y\) et \(Z\), on définit implicitement une fiche horaire entre les villes \(X\) et \(Z\) en passant par \(Y\) dont la modélisation mathématique n'est autre que la composition des correspondances \(h\) et \(g\). Il suffit de rabouter les flèches qui arrivent en \(Y\) avec celles qui en partent et d'observer pour chaque élément de \(X\) quels sont les éléments correspondants dans \(Z\) :
Pour filer la métaphore ferrovaire, on observe dans le diagramme ci-dessus qu'il y a deux trains qui partent à \(4\)h de la ville \(X\) et permettent d'arriver à destination à la ville \(Z\) à \(7\)h ou \(10\)h en passant par la ville \(Y\). Il s'agit bien d'une correspondance entre les villes \(X\) et \(Z.\) Il ne reste qu'à la définir formellement.
Avec l'exemple du diagramme sagittal ci-dessus, on a : \begin{align*} {\color{#08F}h}\circ {\color{#FF8}g}\,(\{3\})&=\{7\} & {\color{#08F}h}\circ {\color{#FF8}g}\,(\{7\})&=\{10\} & {\color{#08F}h}\circ {\color{#FF8}g}\,(\{4\})&=\{7,10\} & {\color{#08F}h}\circ {\color{#FF8}g}\,(\{8\})&=\varnothing\\ {\color{#08F}h}\circ {\color{#FF8}g}\,(\{5\})&=\{4\} & {\color{#08F}h}\circ {\color{#FF8}g}\,(\{0\})&=\varnothing & {\color{#08F}h}\circ {\color{#FF8}g}\,(\{1\})&=\{10\} \end{align*}
Fonctions, applications
Fonctions
Une fonction désigne un type de correspondance particulière telle qu'il y a au plus une flèche qui part d'un élément \(x\in X\). C'est la transposition mathématique du terme largement employé dans le langage courant. Le montant à régler au parcmètre est fonction de la durée de stationnement, votre note au contrôle continu de l'ecue de Mathématiques pour l'Informatique est fonction du nombre de bonnes réponses, etc. Dans ce contexte, il ne peut y avoir qu'un seul montant à régler qui correspond avec la durée de stationnement et qu'une seule note qui correspond avec le nombre de bonnes réponses.
Ainsi, l'exemple de la figure 1 n'est pas une fonction car, entre autres, la ville de La Garde est en correspondance avec deux villes étrangères. La condition à respecter pour qu'une correspondance définisse une fonction s'exprime formellement de la manière suivante :
La façon d'exprimer mathématiquement au plus dans l'expression formelle \((\ref{eq:corrfon})\) peut sembler surprenante, mais elle répond bien à la contrainte : si deux couples avec la même première projection \(x\) appartiennent au graphe de la correspondance, alors leurs deuxièmes projections sont nécessairement égales, autrement dit ces deux couples sont égaux.
Nous n'avons pas encore étudié formellement le cardinal \(\#X\) d'un ensemble fini \(X\), mais nous aurions pu définir alors une fonction à l'aide de la propriété suivante plus simple à interpréter : \[ \forall x\in X\ \ f(\{x\})\text{ est fini et}\ \#f(\{x\})\leq 1. \] La propriété \((\ref{eq:corrfon})\) est préférable parce qu'elle permet de définir le concept de fonction sans avoir à mettre en place l'outillage des entiers naturels et de la cardinalité au préalable.
Dans le diagramme ci-dessous nous représentons la fonction qui associe le taux de tva à une activité ou une vente (si elle est assujettie à cette taxe).
Comme on peut le constater par l'absence d'une flèche, les soins d'une carrie dentaire ne sont pas assujetis à la tva (les actes médicaux ne sont pas soumis à cette taxe). On aurait pu rajouter un taux de \(0\%\) dans l'ensemble d'arrivée et inclure le couple \((\text{carrie},0\%)\) au graphe \( G\), mais il est plus cohérent de le modéliser sans cet arc puisque la tva ne s'applique pas aux actes médicaux. On note également que certains taux de tva ne correspondent à aucune activité/vente.
Soit \(x\in X\), d'après la caractérisation d'une fonction \((\ref{eq:corrfon})\), soit l'image directe \(f(\{x\})\) du singleton \(\{x\}\) est l'ensemble vide \(\varnothing\), soit c'est un singleton \(\{y\}\). Ceci justifie la définition suivante :
L'ensemble de définition de la fonction dont le diagramme sagittal est donné en figure 3 est :
\begin{equation} \label{liste} {\mathscr D}(f)=\{glace,\ alcool,\ cinéma,\ smartphone,\ livre\}. \end{equation}Dans l'autre sens, si l'on se donne \(y\in Y\) et que la partie \(f^{-1}(\{y\})\) n'est pas vide, elle n'est pas nécessairement réduite à un unique élément, mais tout élément de la partie \(f^{-1}(\{y\})\) de \(X\) est appelé un antécédent de \(y\).
La fonction \(f\) associée au diagramme de la figure 2 n'est pas définie en carrie. L'image de cinéma est \(2,1\%\), ce que l'on écrit \(f(cinema)=2,1\%\). Il est important de réaliser que la notation \(f(x)\) n'a de sens que si la fonction \(f\) est définie en \(x\), en revanche \(f(\{x\})\) a toujours un sens, c'est l'image directe du singleton \(\{x\}\) par la correspondance \(f\) qui serait égale à l'ensemble vide \(\varnothing\) dans le cas où la fonction n'est pas définie en \(x\). Par définition un élément \(x\in X\) admet au plus une image par la fonction \(f\), mais un élément \(y\in Y\) peut avoir plusieurs antécédents. Par exemple smartphone et alcool sont deux antécédents de \(20\%\). Les valeurs \(15\%\), \(30\%\) et \(75\%\) n'admettent pas d'antécédents.
On utilise souvent l'écriture \(f:X\rightarrow Y\) pour définir une fonction \(f=(X,G,Y)\) même si son graphe \(G\) n'est pas spécifié. Cette omission est justifiée par le fait que \(f\) étant une fonction, elle est définie en tout élément \(x\) de son domaine de définition \({\mathscr D}(f)\) et son graphe \(G\) est par conséquent \[G:=\left\{(x,y)\in X\times Y\such (x\in {\mathscr D}(f))\wedge (y=f(x))\right\}.\]
Parfois l'image \(f(x)\) d'un élément \(x\) de \(X\) par une fonction \(f\) peut être calculée. En effet, nous verrons dans un prochain chapitre que les ensembles peuvent être équipés de lois de composition internes, comme l'addition ou la multiplication sur \(\R\) par exemple. Dans ce cas, cela induit une vision dynamique de la fonction*(*) l'utilisation massive de flèches renforce également cette dynamique., comme s'il s'agissait d'une machine qui traitait la matière première \(\color{#FF8}x\) en entrée et qui fournissait le produit fini \(\color{#BBF}y\) en sortie :
Par exemple la fonction \(f\) qui calcule la circonférence d'un cercle en fonction de son rayon \(r\) est définie par \(f:\R\rg\R\) dont le graphe est l'ensemble des couples \((r,f(r))\) tels que \(f(r)=2\pi r\). Dans de tels cas, on complète souvent l'expression \(f:X\,\rg\,Y\) avec le calcul qu'elle réalise : \begin{align} \label{fonc:circonf} f:{\R}&\longrightarrow {\R}\\ \notag r&\longmapsto 2\pi r \end{align}
Il faut noter la différence entre la flèche qui relie les ensembles de départ et d'arrivée et celle munie d'un talon qui relie un élément de l'ensemble de départ à son image (quand elle existe) dans l'ensemble d'arrivée.
Applications
La fonction définie en \((\ref{fonc:circonf})\) est bien une application, elle est en effet définie en tout nombre réel \(r\). En revanche, la fonction \begin{align} \label{fonc:inverse} f:{\R}&\longrightarrow {\R}\\ \notag x&\longmapsto\frac{1}{x} \end{align} n'est pas une application puisqu'elle n'est pas définie en \(0\). Son domaine de définition est l'ensemble \({\mathscr D}(f)={\R}\setminus\{0\}\). Notons que si cette fonction n'est pas définie en \(0\), ce n'est pas pour un quelconque interdit, mais parce qu'elle est définie via son graphe qui est constitué des couples \((x,y)\in{\R}\times{\R}\) satisfaisant l'équation \(xy=1.\) Ce graphe ne contient donc aucun couple \((x,y)\) tel que \(x=0\) ou \(y=0\).
Soit \(f:X\rg Y\) une application et \(A\) une partie de \(X\). L'application de \(A\rightarrow Y\) qui coïncide avec \(f\) sur \(A\) est appelée restriction de \(f\) à \(A\) et notée \(f{/}_A\).
Il est très facile d'obtenir une application à partir d'une fonction qui n'est pas définie en tout point de son ensemble de départ \(X\). Il suffit de remplacer \(X\) par le domaine de définition \({\mathscr D}(f)\) de cette fonction, autrement dit de considérer sa restriction \(f/_{{\mathscr D}(f)}\). Dans le cas de la fonction de la figure 2, il suffit d'éliminer carrie de l'ensemble \(X\), i.e. le nouvel ensemble de départ est \(X':={\mathscr D}(f)\) :
Quant à la fonction \(f\) définie en \((\ref{fonc:inverse})\), il suffit d'éliminer \(0\) pour en faire une application, il s'agit de la fonction \(g:{\R}^*\rg{\R}\) définie par \(g(x):=\frac{1}{x}.\) Attention, \(g\not=f\). En effet, une fonction est avant tout une correspondance, c'est-à-dire un triplet, or deux triplets sont égaux si et seulement si leurs trois projections sont égales respectivement. Autrement dit deux correspondances sont égales si et seulement si elles ont même ensemble de départ, même ensemble d'arrivée et même graphe.
L'ensemble des applications de \(X\) dans \(Y\) est souvent noté \(Y^X\). Cela peut sembler étrange à première vue, mais nous verrons pourquoi il s'agit d'une bonne notation dans le chapitre consacré à la combinatoire.
La confusion entre fonction et application dans les textes mathématiques est courante et distinguer les deux peut sembler superfétatoire. En effet, quel est l'intérêt de considérer comme ensemble de départ un autre ensemble que l'ensemble de définition d'une fonction puisqu'elle n'est pas définie ailleurs ? Le premier est d'attirer l'attention sur cet ensemble de définition qu'il ne faut surtout pas négliger, et l'autre est que les questions qui vont suivre sur les propriétés remarquables des applications se justifient naturellement en considérant la correspondance réciproque qui peut être ou non une fonction, une application. Quoi qu'il en soit, il est très facile de transformer une fonction en application, il suffit de considérer que son ensemble de départ est son ensemble de définition.
Si la correspondance réciproque \(f^{-1}\) d'une fonction \(f\) est elle-même une fonction, elle est appelée fonction réciproque. La section suivante est consacrée à l'étude des correspondances réciproques et de leur statut.
Injections, surjections, bijections
Quand on se donne une correspondance, il est naturel de s'intéresser à la correspondance réciproque (voir exercice), ne serait-ce que parce que sa construction est extrêmement simple, il suffit d'inverser le sens des flèches et d'échanger le rôle de l'ensemble de départ et de l'ensemble d'arrivée. L'étude de la réversibilité du processus est intéressante, en particulier quand il s'agit d'une fonction calculable.
On réalise immédiatement en construisant la correspondance réciproque de l'application de ce diagramme que celle-ci n'est plus une application, (ni \(30\%\), ni \(75\%\) n'ont d'image), ni même une fonction (deux flèches partent de la valeur \(20\%\)). Quelles sont les conditions que doit satisfaire une application pour que sa correspondance réciproque soit une fonction, ou mieux une application ?
Pour que la correspondance réciproque soit une fonction, il ne faut pas que deux éléments distincts \(x_1\) et \(x_2\) de l'ensemble de départ aient la même image \(y\) (comme smartphone et alcool qui ont la même tva à \(20\%\)), sans quoi la correspondance inverse aurait deux flèches partant de \(y\), l'une vers \(x_1\) et l'autre vers \(x_2\) ce qui est interdit pour une fonction.
Injections
C'est souvent la contraposée de la proposition logique \((\ref{eq:injection})\) qui est utilisée pour démontrer qu'une application est injective, à savoir \begin{equation}\label{eq:injectioncontraposée} \forall (x_1,x_2)\in X\times X\quad (f(x_1)=f(x_2))\Rightarrow (x_1=x_2). \end{equation} il est en effet plus aisé de faire des déductions en partant d'une égalité que de la négation d'une égalité.
Indépendamment de l'étude des correspondances réciproques, l'injectivité est une propriété fort intéressante et souvent nécessaire pour modéliser certaines contraintes. Pour établir une communication téléphonique, on cherche a priori à exclure la possiblité que deux numéros de téléphone soient associés à la même carte sim*(*) Subscriber Identity Module, la table de correspondance dont disposent les opérateurs n'est ni plus ni moins qu'une application injective. De la même manière, deux numéros de sécurité sociale distincts sont associés à des individus distincts, etc.
Soit \(X\) et \(Y\) deux ensembles tels que \(X\subseteq Y\). L'application \(f:X\rg Y\) définie par \(f(x):=x\) est une injection appelée injection canonique. Si \(Y=X\), cette application est appelée application identité de \(X\) et on la note \(\text{Id}_X\).
La correspondance réciproque \(f^{-1}\) d'une injection \(f\) est donc une fonction. Si elle est définie en \(y\in Y\), autrement dit s'il existe \(x\in X\) tel que \(f^{-1}(\{y\})=\{x\}\), alors \(x\) est l'image de \(y\) par \(f^{-1}\) et on la note \(f^{-1}(y)\).
Si l'on veut que cette fonction réciproque soit également une application, il faut que tous les éléments de l'ensemble d'arrivée soient atteints par une flèche de manière à ce que tous les éléments de l'ensemble \(Y\) aient une image pour la correspondance réciproque.
Surjections
Cette propriété peut être satisfaite sans que l'application soit injective, tout élément de l'ensemble d'arrivée peut donc avoir plusieurs antécédents. C'est le cas de l'application à gauche dans la figure ci-dessous, elle est surjective mais pas injective. Celle de droite n'est ni injective ni surjective.
Bijections
On aurait tout aussi bien pu donner la définition suivante : une application \(f\) est bijective si et seulement si sa correspondance réciproque \(f^{-1}\) est une application. L'ensemble des bijections d'un ensemble \(X\) dans lui-même est noté \(S(X)\).
Une bijection associe de manière unique chaque élément d'un ensemble à un autre et réciproquement. Si les ensembles de départ et d'arrivée sont par exemple constitués respectivement par des étudiant⋅e⋅s de sciences et de lettres, disposer d'une bijection revient à créer des couples monogames où chacun⋅e a exactement un⋅e petit⋅e ami⋅e :
Les trois notions, injection, surjection et bijection sont absolument fondamentales en mathématiques et en informatique. Ces objets servent non seulement à la modélisation mais également à compter. L'existence d'une solution à une équation du type \(f(x)=y\) d'inconnue \(x\) est liée à la surjectivité de \(f\) et l'unicité d'une solution à l'injectivité de \(f\). Avant même d'avoir défini ce qu'est un ensemble fini*(*) la compréhension intuitive du concept est suffisante ici., il semble évident que si les ensembles de départ et d'arrivée sont finis et en bijection, ils ont le même nombre d'éléments. Il n'est pas rare que l'on dénombre les éléments d'un ensemble en établissant une bijection avec un autre ensemble dont on connaît le cardinal. Dans le même ordre d'idées et intuitivement, disposer d'une injection (resp. une surjection) entre un ensemble \(X\) et un ensemble \(Y\) impose que l'ensemble \(Y\) est plus grand que \(X\) (resp. plus petit que \(X\)).
Un premier résultat important sur les bijections est lié à la composition des applications.
Supposons à présent que \(f\) et \(g\) soient surjectives. Soit \(z\in Z\), il nous faut montrer qu'il admet un antécédent \(x\in X\) par \(g\circ f\), autrement dit qu'il existe un élément \(x\in X\) tel que \(z=g\circ f(x)\). Comme \(g\) est surjective, on sait que \(z\) admet un antécédent \(y\) par \(g\), c'est-à-dire tel que \(z=g(y)\), mais \(f\) étant surjective également, \(y\) admet lui aussi un antécédent \(x\in X\) pour \(f\), autrement dit \(y=f(x)\). Par conséquent, on a \(z=g(y)=g(f(x))=g\circ f(x)\) et \(g\circ f\) est donc surjective.
Soit \(f:X\rg X\) une application. On peut donc composer \(f\) avec elle même puisque les ensembles de départ et d'arrivée sont confondus. Par convention, on note \(f^n:=f\circ f^{n-1}\) avec \(f^0:=\text{Id}_X\). L'application \(f^n\) est appelée \(n\)-ème itérée de \(f\). Une application bijective \(f:X\rg X\) telle que \(f^2=\text{Id}_X\) est appelée involution ou dite involutive, autrement dit elle est sa propre bijection réciproque. Par exemple l'application \(f:\R^*\rg\R^*\) définie par \(x\mapsto\frac{1}{x}\). Une application \(f:X\rg X\) telle que \(f^2=f\) est dite idempotente. Par exemple la valeur absolue dans \(\R\), en effet \(|\!|x|\!|=|x|\).
Revenons aux images directes et réciproques dans le cas où la correspondance est une fonction \(f:X\rg Y\). Alors l'égalité \((\ref{eq:imdir})\) devient :
\begin{equation} f(A):=\{y\in Y\mid \exists x\in A\ \ y=f(x)\}. \end{equation} et on a \begin{equation} f^{-1}(B):=\{x\in X\mid f(x)\in B\}. \end{equation}On rappelle que \({\mathscr P}(X)\) désigne l'ensemble des parties d'un ensemble \(X\). Soit \({\color{#F88}A:=\{g,b,e\}}\in{\mathscr P}(X)\) et \({\color{#88F}B:=\{0,7,8\}}\in{\mathscr P}(Y)\) pour l'application \(f:X\rg Y\) définie par le diagramme sagittal ci-dessous. On a \(f({\color{#F88}A})=\{5,1\}\) et \(f^{-1}({\color{#88F}B})=\{a,c,d\}\).
De la même manière que l'on transforme facilement une fonction \(f:X\rg Y\) en application en remplaçant son ensemble de départ \(X\) par le domaine de définition \({\mathscr D}(f)\), on transforme une application quelconque en surjection en remplaçant son ensemble d'arrivée \(Y\) par son image \(\text{Im}(f)\).
Dans cette définition, rien ne distingue une famille d'une application, si l'on excepte l'usage des lettres \(I\) et \(X\) pour désigner respectivement l'ensemble de départ et d'arrivée en lieu et place des usuels \(X\) et \(Y\). Il s'agit ici de formaliser l'écriture mathématique indicielle \(x_i\) pour désigner un élément d'un ensemble \(X\). Formellement on définit la famille \(x:I\rg X\) et on écrit simplement \(x_i\) au lieu de \(x(i)\).
Nous n'avons pas encore étudié l'ensemble des entiers naturels, mais il est plus pertinent de ne pas différer les définitions suivantes :
Certains auteurs donnent des définitions différentes des suites. L'existence de plusieurs définitions pour un même objet peut sembler déroutant mais ne pose aucun problème tant que l'on rappelle le sens que l'on donne à cet objet dans un discours mathématique. Ces rappels préalables sont indispensables si la définition utilisée n'est pas celle qui est communément admise.
Ce qui importe dans ces trois notions est l'ordre dans lequel les éléments de ces trois types de familles sont rangés. C'est explicite pour la suite ou la séquence et implicite pour le système puisque si son ensemble d'indexation est fini par définition il est en bijection avec \(\{i\in\N\mid 1\leq i\leq n\}\), ses éléments peuvent donc être ordonné via cette bijection.
Nous avons vu au chapitre dédié à la logique des prédicats et la théorie zf, comment était construit le produit cartésien de deux ensembles \(X\) et \(Y\) et comment on pouvait le généraliser au produit cartésien de \(q > 2\) ensembles \(X_1,X_2,\ldots,X_q\). On peut désormais procéder autrement avec une construction à la fois plus simple et plus générale. C'est tout simplement le produit fini de la séquence \((X_i)_{i\in I}\) d'ensemble d'indexation \(I:=\{1,2,\ldots,q\}\).
Opérations sur les ensembles
Réunion, intersection. Soit \((X_i)_{i\in I}\) une famille d'ensembles. On montre que les deux ensembles suivant existent :
\begin{align} \bigcup_{i\in I}X_i:=&\{x\mid\exists i\in I, x\in X_i\}\\ \bigcap_{i\in I}X_i:=&\{x\mid\forall i\in I, x\in X_i\}\\ \end{align}Il s'agit respectivement de la réunion de la famille \((X_i)_{i\in I}\) et de l'intersection de la famille \((X_i)_{i\in I}\).
Réindexation. Si l'on se donne une application surjective \(\varphi:J\rg I\), on peut faire une réindexation de la famille \((X_i)_{i\in I},\) i.e.
\begin{align} \bigcup_{i\in I}X_i &= \bigcup_{j\in J}X_{\varphi(j)},\\ \bigcap_{i\in I}X_i &= \bigcap_{j\in J}X_{\varphi(j)}. \end{align}Autre opérations. Soit \((X_i)_{i\in I}\) et \((Y_j)_{j\in J}\) deux familles d'ensembles. On a
\begin{align} \left(\bigcup_{i\in I}X_i\right)\cap\left(\bigcup_{j\in J}Y_j\right) &=\bigcup_{(i,j)\in I\times J}\left(X_i\cap Y_is\right),\\ \left(\bigcap_{i\in I}X_i\right)\cup\left(\bigcap_{j\in J}Y_j\right) &=\bigcap_{(i,j)\in I\times J}\left(X_i\cup Y_is\right).\\ \end{align}Soit \((X_i)_{i\in I}\) et \((Y_j)_{j\in I}\) deux familles d'ensembles de même ensemble d'indexation \(I\) telles que \(\forall i\in I\ \ X_i\subseteq Y_i\). Alors
\begin{align} \bigcup_{i\in I}X_i&\subseteq \bigcup_{i\in I}Y_i,\\ \bigcap_{i\in I}X_i&\subseteq \bigcap_{i\in I}Y_i. \end{align}Soit \((X_i)_{i\in I}\) une famille de parties d'un ensemble \(X\). Alors
\begin{align} X\setminus\bigcup_{i\in I}X_i&= \bigcap_{i\in I}(X\setminus X_i),\\ X\setminus\bigcap_{i\in I}X_i&= \bigcup_{i\in I}(X\setminus X_i). \end{align}Image et image inverse. Soit \(f:X\rg Y\) une application, \((X_i)_{i\in I}\) une famille de parties de l'ensemble \(X\) et \((Y_i)_{i\in I}\) une famille de parties de l'ensemble \(Y\). On a
\begin{align} f\left(\bigcup_{i\in I}X_i\right)&= \bigcup_{i\in I}f(X_i),\\ \label{eq:careful}f\left(\bigcap_{i\in I}X_i\right)&\subseteq \bigcap_{i\in I}f(X_i),\\ f^{-1}\left(\bigcup_{i\in I}X_i\right)&=\bigcup_{i\in I}f^{-1}(X_i),\\ f^{-1}\left(\bigcap_{i\in I}X_i\right)&= \bigcap_{i\in I}f^{-1}(X_i). \end{align}L'image inverse d'une réunion (ou d'une intersection) est donc toujours la réunion (ou l'intersection) des images inverses, alors que si l'image d'une réunion est bien la réunion des images, l'image d'une intersection n'est pas l'intersection des images, cf. \((\ref{eq:careful})\).
Étudier un ensemble \(X\) en le découpant en parties cohérentes est très utile. On peut par exemple partitionner la population mondiale selon les pays, partitionner les instruments de musique selon qu'ils sont à vent, à corde ou à percussion, etc. Les trois propriétés mathématiques exigées pour ce découpage sont très naturelles : les parties ne doivent pas être vides, deux parties différentes ne doivent pas contenir d'éléments communs et la réunion de toutes les parties permet de reconstituer l'ensemble \(X\) :
Une famille d'ensembles \((X_i)_{i\in I}\) dont la réunion contient un ensemble \(X\) s'appelle un recouvrement de \(X\) (à la manière des tuiles d'un toit qui le recouvrent et se chevauchent par endroit). Une partition est donc un cas particulier de recouvrement.
Relations binaires sur un ensemble
Comme nous l'avions annoncé dans la première section, une relation binaire sur un ensemble \(X\) est tout simplement une relation binaire qui met en relation des éléments d'un même ensemble \(X\). Ce modèle est si versatile et fécond, qu'il a engendré à lui seul une théorie, la théorie des graphes. Cette théorie connaît des développements permanents, elle est enseignée dans toutes les formations d'informatique et à tous niveaux. C'est l'un des modèles les plus utisés dans cette discipline scientifique, il est donc très important de le comprendre et le maîtriser. Son rôle universel justifie d'en donner une définition spécifique, même s'il s'agit d'un cas particulier de la définition d'une relation \(q\)-aire.
On rappelle que l'on note souvent une relation binaire de manière infixe, i.e. \(x{\rel}y\) au lieu de \(\rel(x,y)\). Une relation binaire n'étant qu'un cas particulier de correspondance, on peut là encore la représenter à l'aide d'un diagramme sagittal qui ne contient cette fois que les flèches reliant les éléments entre eux, autrement dit son graphe. Le dessin de la patate pour représenter l'ensemble de référence \(X\) devient superflu. Notons qu'un couple \((x,x)\) dans ce diagramme est alors représenté par une boucle. Par exemple :
Comme nous l'avions déjà noté dans la section consacrée aux relations \(q\)-aires générales, une relation définit un graphe et réciproquement, ce sont deux façons équivalentes de considérer le même concept mathématique. Dans le cadre de la théorie des graphes, on préfère définir la relation a posteriori et mettre l'accent sur le graphe, d'où la définition suivante employée dans ce cadre.
Il faut noter dans cette définition que \(G\) ne désigne plus l'ensemble des couples définis sur un produit cartésien, rôle dévolu à \(U\), mais le couple constitué de l'ensemble des sommets \(X\) et de l'ensemble des arcs \(U\).
La relation \(\rel\) associée au graphe \(G\) au sens de cette définition est alors caractérisée par la proposition \begin{equation} \forall (x,y)\in X^2\quad x{\rel}y\ssi (x,y)\in U. \end{equation} Les relations binaires, et par conséquent les graphes au sens de la définition ci-dessus, peuvent posséder des propriétés remarquables :
On parlera donc de relation réflexive ou de graphe réflexif, de relation symétrique ou de graphe symétrique, etc.
(1) L'asymétrie est plus contraignante que l'antisymétrie, elle est parfois qualifiée d'antisymétrie forte (par opposition l'antisymétrie est alors qualifiée d'antisymétrie faible). Cette terminologie est malheureuse, en observant la définition de l'antiréflexivité et de l'antitransitivité, il eut été préférable de qualifier l'asymétrie d'antisymétrie et réciproquement.
(2) Dans un graphe asymétrique, il ne peut y avoir de boucles \((x,x)\) alors que c'est possible dans un graphe antisymétrique.
Il faut immédiatement noter que les propriétés 4, 5 et 7 ne sont pas les négations des propriétés 1, 2 et 3 respectivement. Par exemple, la négation de la réflexivité s'écrit :
\begin{equation*} \exists x\in X\ \ \neg (x{\rel}x). \end{equation*}Autrement dit, il suffit d'un unique élément dans \(X\) qui n'est pas en relation avec lui-même pour que la propriété de réflexivité ne soit pas satisfaite, quand bien même tous les autres éléments de \(X\) sont en relation avec eux-mêmes. L'antiréflexivité est bien plus contraignante, et le préfixe anti est là pour le signifier, une relation antiréflexive impose qu'aucun élément ne soit en relation avec lui-même. Similairement, une relation binaire peut ne pas être symétrique (resp. transitive) sans pour autant être antisymétrique (resp. antitransitive).
Il est courant quand on dispose d'une relation binaire \(\rel\) sur un ensemble de considérer sa fermeture transitive. L'idée est simple et naturelle, l'expression les amis de mes amis sont mes amis l'illustre parfaitement. On construit à partir d'une relation \(\rel\) sa fermeture transitive \(\overline{\rel}\) en rajoutant*(*) La construction effective de cette nouvelle relation nécessite d'élaborer un algorithme. au graphe de la relation \(\rel\) les couples \((x,y)\) nécessaires pour que cette nouvelle relation soit transitive.
La définition suivante nous sera utile dans les chapitres à venir, lorsque nous munirons les ensembles de nouveaux outils. Elle dit simplement qu'une application est compatible avec une relation binaire si les images des éléments qui sont en relations sont identiques.
Relations d'équivalence
La relation d'équivalence est une notion déjà parfaitement intégrée par tous et en dehors de tout contexte mathématique. Quand on parle d'un homme, d'une twingo ou d'un tournevis, on ne fait bien sûr pas référence à un(e) homme/voiture/tournevis en particulier, mais à un ensemble dont les éléments ont tous des caractéristiques communes. Le formalisme mathématique tente de saisir l'essence de ce concept en identifiant ce qui le caractérise :
On peut définir aisément une relation sur l'ensemble des voitures, on dira par exemple que deux voitures sont en relation s'il s'agit du même modèle. La relation est évidemment réflexive, une voiture est bien du même modèle qu'elle même. La relation est également symétrique, si la voiture \(x\) est du même modèle que la voiture \(y\), la voiture \(y\) est bien du même modèle que \(x\). Elle est aussi transitive, puisque si la voiture \(x\) est du même modèle que la voiture \(y\), qui elle même est du même modèle que la voiture \(z\), alors la voiture \(x\) est du même modèle que la voiture \(z\). Le lecteur perspicace aura deviné qu'en définissant une relation binaire à partir de caractéristiques communes entre objets, elle sera toujours une relation d'équivalence.
Si \(\rel\) est une relation d'équivalence sur un ensemble \(X\) et \(x\in X\), le sous-ensemble de \(X\) constitué par tous les éléments qui sont en relation avec \(x\) est appelé classe d'équivalence de \(x\), elle est parfois notée \(\overline{x}\) :
\begin{equation} \overline{x}:=\{y\in X\mid x{\rel}y\}. \end{equation}Un élément quelconque d'une classe d'équivalence est appelé représentant de la classe d'équivalence. David Hilbert est un représentant de la classe des hommes, l'Interceptor de Mad Max est un représentant de la classe des Ford Falcon XB. Le tournevis de MacGyver est un représentant de la classe des tournevis. Une classe d'équivalence est un concept abstrait qui n'est pourtant pas si éloigné de notre réalité. En effet, quand nous pensons à une Twingo, l'image mentale que nous en avons n'est pas celle d'un véhicule précis, sauf si nous en possédons une, ce qui nous permet de fixer cette image sur un représentant de cette classe d'équivalence.
L'ensemble des classes d'équivalences d'un ensemble \(X\) pour une relation binaire \(\rel\) est appelé ensemble quotient de \(X\) par \(\rel\) et noté \(X/{\rel}\) comme une division, notation légitimée par le fait que l'on a divisé l'ensemble \(X\) en classes suivant la relation \(R.\) Le théorème suivant montre que partitions et relations d'équivalence sur un ensemble sont deux concepts étroitements liés.
L'application \(\varphi:X\rg X/{\rel}\) définie par \(\varphi(x):=\overline{x}\) qui à un élément \(x\) de \(X\) associe sa classe d'équivalence \(\overline{x}\) est évidemment surjective puisque l'ensemble d'arrivée est constitué de ses images, elle est appelée surjection canonique.
Que doit satisfaire une application \(f:X\rg Y\) pour être compatible avec une relation d'équivalence \(\rel\) (deux éléments de \(X\) en relation doivent posséder la même image) ?
Réciproquement supposons qu'il existe une application \(g:X/{\rel}\rightarrow Y\) telle que \(f=g\circ\varphi\). Montrons que si \(x{\rel}y\) alors \(f(x)=f(y)\). On a \begin{align*} f(x)&=g\circ\varphi(x)\\ &=g(\overline{x})\\ &=g(\overline{y})\quad\text{car}\ x{\rel}y\Rightarrow\overline{x}=\overline{y}\\ &=g\circ\varphi(y)\\ &=f(y) \end{align*}
Malgré les apparences, ce théorème n'a rien de bien compliqué. On a fait des paquets de tous les individus qui ont la même image par \(f\), et l'application \(g\) n'est rien d'autre qu'une version de \(f\) définie sur ces paquets.
Dans la section consacrée aux fonctions et aux applications, nous avons étudié comment transformer une fonction \(f:X\rg Y\) quelconque en application, il suffit de remplacer l'ensemble de départ par le domaine de définition \({\mathscr D}(f)\) de la fonction, puis comment transformer cette application en surjection, il suffit de remplacer l'ensemble d'arrivée par l'image \(f(X)\) de \(f\). Mais comment transformer cette dernière application en injection afin d'obtenir une bijection ?
L'étude que nous venons de mener nous donne la solution, il suffit de regrouper tous les éléments qui ont la même image par \(f\), autrement dit de remplacer les éléments de l'ensemble de départ par leur classe d'équivalence pour la relation d'équivalence \({\color{#88F}x{\rel}y}\iff f(x)=f(y)\) (par construction \(f\) est compatible avec \(\rel\)). Le diagramme sagittal ci-dessous explicite cette construction. Les éléments \(h\) et \(i\) sont écartés de l'ensemble de départ \(X\) pour faire de \(f\) une fonction et \(3\) et \(6\) sont écartés de l'ensemble d'arrivée \(Y\) pour faire de \(f\) une surjection. On obtient les \(3\) classes d'équivalence \(\color{#88F}\{b,g,e\}\), \(\color{#88F}\{c\}\) et \(\color{#88F}\{a,d\}.\)
L'application bijective ainsi construite est notée \({\color{#FF8}\overline{f}}\) et appelée décomposition canonique de \(f\). Les applications qui relient les quatre ensembles \(X\), \(Y\), \(\color{#88F}{X/\rel}\) et \(f(X)\) sont souvent représentées dans un diagramme appelé diagramme commutatif :
\begin{equation}%\require{AMScd} \begin{CD} X @>{f}>> Y\\ @V{\varphi}VV @AAjA \\ {\color{#88F}X/{\rel}} @>>{\color{#FF8}\overline{f}}> f(X) \end{CD} \end{equation}Dans un diagramme commutatif, plusieurs chemins peuvent relier deux ensembles et les différentes compositions d'applications suivant ces chemins différents sont égales. Ici deux chemins relient \(X\) à \(Y\), le premier est constitué d'une seule flèche, celle étiquetée \(f\), et l'autre est constitué de trois flèches étiquetées \(\varphi\), \(\color{#FF8}\overline{f}\) et \(j\) l'injection canonique. On a donc \(f=j\circ{\color{#FF8}\overline{f}}\circ \varphi.\)
Relations d'ordre
Trier des objets est une opération très courante, même pour un être humain, mais de toutes les opérations réalisées par les ordinateurs, c'est celle qui occupe de loin la plus grande part du temps cpu mondial. Trier des objets n'est possible que si l'on dispose d'un critère pour les comparer.
On note souvent \(\preceq\) ou \(\preccurlyeq\) une relation d'ordre sur un ensemble \(X\) et le couple \((X,\preceq)\) est appelé un ensemble ordonné. Si \(\preceq\) est une relation d'ordre sur un ensemble \(X\), on dit que deux éléments \(x\) et \(y\) sont comparables si et seulement si \(x\preceq y\) ou \(y\preceq x\). Si tous les éléments de \(X\) sont deux-à-deux comparables, la relation est dite d'ordre total sinon d'ordre partiel. La relation binaire \(\prec\) définie sur \(X\) par \(x\prec y\) si et seulement si \(x\preceq y\) et \(x\not=y\) est appelée ordre strict associé à \(\preceq\). Attention ! l'ordre strict n'est pas une relation d'ordre.*(*) La terminologie est ici particulièrement maladroite.
Soit \(a\) et \(b\) deux éléments d'un ensemble totalement ordonné \((X,\preceq)\) tels que \(a\preceq b\). On définit les intervalles suivants :
\begin{align*} [a,b]&:=\{x\in X\mid a\preceq x\ \text{et}\ x\preceq b\},\\ ]a,b]&:=\{x\in X\mid a\prec x\ \text{et}\ x\preceq b\},\\ [a,b[&:=\{x\in X\mid a\preceq x\ \text{et}\ x\prec b\},\\ ]a,b[&:=\{x\in X\mid a\prec x\ \text{et}\ x\prec b\}.\\ \end{align*}Ces intervalles sont dits respectivement fermé, semi-ouvert à gauche, semi-ouvert à droite et ouvert. On définit également les demi-droites :
\begin{align*} [a,\rg[&:=\{x\in X\mid a\preceq x\},\\ ]a,\rg[&:=\{x\in X\mid a\prec x\},\\ ]\leftarrow,b]&:=\{x\in X\mid x\preceq b\},\\ ]\leftarrow,b[&:=\{x\in X\mid x\prec b\}. \end{align*}Dans le cas particulier où la relation d'ordre est l'ordre naturel sur \(\N\), les simplets crochets sont souvent remplacés par les doubles crochets \(\llbracket\) et \(\rrbracket\).
Certaines relations d'ordre sont tellement utilisées qu'elles bénéficient d'un symbole spécifique. C'est le cas de l'ordre naturel défini sur l'ensemble \({\N}\) des entiers naturels qui est noté \(\leq\) ou \(\leqslant\). Il s'agit d'une relation d'ordre total. C'est précisément par analogie avec l'ordre naturel que le symbole générique \(\preceq \) a été choisi pour représenter une relation d'ordre quelconque. On dira d'ailleurs de deux éléments \(x\) et \(y\) tels que \(x\preceq y\) que \(x\) est plus petit que \(y\). Il faut néanmoins garder à l'esprit que cette analogie ne concerne que la terminologie, on peut parfaitement définir d'autres relations binaires \(\preceq\) sur l'ensemble des entiers naturels telles \(x\preceq y\) alors que \(x > y\) pour l'ordre strict \( > \) associé à l'ordre naturel \(\leq\), (cf. par exemple la relation de divisibilité dans cet exercice).
On démontre aisément que l'inclusion \(\subseteq\) définie sur l'ensemble \({\mathscr P}(X)\) des parties d'un ensemble \(X\) est une relation d'ordre. L'ordre strict associé est noté \(\subset\). La terminologie héritée de l'ordre naturel ne prête pas à confusion ici puisqu'il est d'usage de dire que l'ensemble \(A\) est plus petit que l'ensemble \(B\) si \(A\subseteq B\).
La relation d'inclusion définie sur des ensembles est une relation d'ordre partiel. Considérons par exemple l'ensemble \(X:=\{a,b,c\}\). L'ensemble de ses parties est
\begin{equation} \label{parties3} {\mathscr P}(X)=\big\{\varnothing,\{a\},\{b\},\{c\},\{a,b\},\{a,c\},\{b,c\},X\big\}. \end{equation}On ne peut pas comparer les parties \(\{a,b\}\) et \(\{c\}\) avec la relation d'inclusion par exemple, aucun des deux n'est inclus dans l'autre. Quand on dispose d'une relation d'ordre sur un ensemble fini comme ici, on représente le graphe de la relation à l'aide d'un diagramme appelé diagramme de Hasse#(#) Helmut Hasse est un mathématicien allemand. de la relation :
Le diagramme de Hasse d'une relation d'ordre est construit de bas en haut. Si l'on a \(x\preceq y\), on dessine un arc reliant le sommet \(x\) vers le sommet \(y\) qui est placé au dessus de \(x\). On ne représente aucune des relations que l'on peut déduire par transitivité. Dans l'exemple ci-dessus, l'ensemble vide \(\varnothing\) est inclus dans toutes les parties de \(X\), mais on ne trace que les trois arcs le reliant aux trois singletons, puisque les autres arcs peuvent être déduits par transitivité. Ce diagramme permet dans une certaine mesure de visualiser la relation étudiée et mettre en évidence quelques éléments remarquables que nous allons étudier dans la suite.
Cette représentation n'a d'intérêt que pour une relation d'ordre partielle. En effet si la relation d'ordre est totale, le diagramme sera constitué de tronçons verticaux reliant les différents éléments de l'ensemble \(X\). Par exemple pour l'ensemble \(X:=\{0,1,2,3\}\) muni de l'ordre naturel :
Quand on dispose d'une relation d'ordre \(\preceq\) sur un ensemble \(X\), certains éléments de l'ensemble peuvent posséder des propriétés remarquables.
Il n'existe pas nécessairement de minorant ou de majorant à une partie d'un ensemble, par exemple la demi-droite \([0,\rightarrow[\) de \(\R\) n'admet pas de majorant, et \(\Z\) n'admet pas de minorant.
Dans l'exemple de la figure 13, le plus petit élément et le plus grand élément de \({\mathscr P}(X)\) pour l'inclusion existent, il s'agit respectivement de \(\text{min}\ {\mathscr P}(X)=\varnothing\) et \(\text{max}\ {\mathscr P}(X)=X\). L'ensemble des entiers naturels \({\N}\) admet un plus petit élément pour l'ordre naturel, il s'agit de \(0\). En revanche \({\N}\) n'admet pas de plus grand élément par essence, c'est l'une des trois propriétés qui le caractérisent comme nous le verrons au chapitre suivant.
Nous avons vu qu'un ensemble ordonné n'admet pas néessairement de plus petit ou de plus grand élément, a fortiori si la relation d'ordre est partielle puisque tous les éléments ne sont pas comparables. Cependant, on peut se demander s'il existe des éléments qui soient plus petits ou plus grands que tous ceux avec qui la comparaison est possible ?
Il existe des moyens conventionnels de définir de nouvelles relations d'ordre à partir d'une ou plusieurs relations d'ordre prédéfinies. Quand on se donne une relation d'ordre \(\preceq\) sur un ensemble \(X\), la relation d'ordre notée \(\succeq\) définie par \(x\succeq y\iff y\preceq x\) est appelée l'ordre opposé de l'ordre \(\preceq\). Quand on restreint une relation d'ordre définie sur un ensemble \(X\) à une partie \(Y\subseteq X\), la relation ainsi crée s'appelle l'ordre induit par l'ordre \(\preceq\) sur \(Y\). Si l'on se donne une famille \((X_i,\preceq_i)_{i\in I}\) d'ensembles ordonnés, la relation \(\preceq\) définie sur l'ensemble produit \(X:=\prod_{i\in I}X_i\) par
\begin{equation} (x_i)_{i\in I}\preceq (y_i)_{j\in I}\iff \forall i\in I\ \ x_i\preceq_i y_i. \end{equation}est une relation d'ordre appelée l'ordre produit des relations \(\preceq_i\). Les relations d'ordre \(\preceq_i\) peuvent être totales sans que l'ordre produit \(\preceq\) le soit. Considérons par exemple l'ordre produit sur l'ensemble des couples d'entiers naturels munis chacun de l'ordre naturel : \[(x,y)\preceq (x',y')\iff (x\leq x')\wedge (y\leq y').\] Les couples \((1,2)\) et \((2,1)\) ne sont pas comparables. Pour obtenir une relation d'ordre total sur ce produit cartésien il faut fournir un peu plus d'efforts.
Limitons nous au cas fini où l'ensemble d'indexation est \(I:=\llbracket 1,\,n\rrbracket\) avec \(n\) un entier naturel non-nul. On définit une relation binaire \(\preceq\) entre deux \(n\)-uplets \((x_i)_{i\in I}\) et \((y_i)_{i\in I}\) par \((x_i)_{i\in I}\preceq (y_i)_{i\in I}\) si et seulement s'il existe un rang \(k\in\llbracket 1,\,n-1\rrbracket\) tel que leurs \(i\)-èmes projections coïncident pour tout \(i\in \llbracket 1,\,k-1\rrbracket\) et que \(x_k\prec_k y_k\) ou que leurs \(i\)-èmes projections sont toutes égales sauf pour \(i=n\) où \(x_n\preceq_n y_n\). Il s'agit d'une relation d'ordre total appelée ordre lexicographique.
Malgré une définition qui semble alambiquée, c'est une relation bien connue du lecteur. Si les ensembles \(X_i\) désignent tous le même alphabet latin muni de l'ordre alphabétique, il s'agit de l'ordre du dictionnaire. C'est également l'ordre qui est utilisé pour ranger les nombres réels quand ils sont représentés sous forme décimale.
Pour réaliser des tris comparatifs, il est nécessaire que la relation d'ordre utilisée pour comparer les objets soit totale.
Soit \((X,\preceq)\) un ensemble ordonné et \(A\subseteq X\). S'il existe un élément \(m\in X\) tel que
\begin{equation} \forall x\in A\ \ a\preceq x\quad(\text{resp.}\ x\preceq a) \end{equation}on dit que \(a\) est un minorant (resp. majorant) de \(A\) et que \(A\) est une partie minorée (resp. majorée). Une partie \(A\) à la fois minorée et majorée, est appelée partie bornée. Si l'ensemble des minorants d'une partie \(A\) admet un plus grand élément, on l'appelle la borne inférieure de \(A\), notée \(\text{inf}\;A\). Si l'ensemble des majorants d'une partie \(A\) admet un plus petit élément, on l'appelle la borne supérieure de \(A\), notée \(\text{sup}\;A\). La borne inférieure de \(A\) appartient à \(A\) si et seulement si \(A\) admet un plus petit élément et dans ce cas \(\text{inf}\;A = \text{min}\;A\). De même, la borne supérieure de \(A\) appartient à \(A\) si et seulement si \(A\) admet un plus grand élément et dans ce cas \(\text{sup}\;A = \text{max}\;A\).
Soit \(f:X\rg Y\) une application à valeurs dans un ensemble ordonné \((Y,\preceq)\) et \(A\subseteq X\). On parlera du minimum et du maximum de \(f\) sur \(A\) en lieu et place de \(\text{min}\ f(A)\) et \(\text{max}\ f(A)\), s'ils existent. De même on parlera de la borne inférieure et de la borne supérieure de \(f\) pour \(\text{inf}\ f(A)\) et \(\text{sup}\ f(A)\), s'ils existent. On les note respectivement
\begin{equation} \underset{x\in A}{\text{min}}\ f(x),\quad\underset{x\in A}{\text{max}}\ f(x),\quad \underset{x\in\ A}{\text{inf}}\ f(x),\quad\underset{x\in\ A}{\text{sup}}\ f(x). \end{equation}Attention, la négation de la croissance n'est pas la décroissance ! En effet une application peut très bien croître par moment et décroître par d'autres. Si l'on remplace dans la définition les relations d'ordre \(\preceq_X\) et \(\preceq_Y\) par leurs ordres stricts \(\prec_X\) et \(\prec_Y\) on parle d'application strictement croissante et strictement décroissante. Une application qui est croissante ou décroissante (resp. strictement croissante ou décroissante) est dite application monotone (resp. application strictement monotone).
Relations de précédence
Dans les systèmes multiprocesseurs multiprogrammés, on modélise le fonctionnement des processus par un ensemble \(\mathscr T\) de tâches à réaliser. Ces tâches sont représentées par des couples \(T=(d,f)\) dont la première projection \(d\) est l'instant où la tâche \(T\) débute son exécution et la seconde projection \(f\) est l'instant où elle finit son exécution. Certaines tâches ne peuvent débuter leur exécution qu'une fois que d'autres tâches ont fini la leur. Ces différentes contraintes temporelles sont modélisées par une relation binaire \(\propto\) définie sur l'ensemble \(\mathscr T\) des tâches à réaliser. Si \(T\) et \(T'\) sont deux tâches, on interprète \(T\propto T'\) par la tâche \(T\) termine son exécution avant que la tâche \(T'=(d',f')\) ne débute la sienne, i.e.
\[d'\geq f.\]On dit alors que la tâche \(T\) précède la tâche \(T'\) ou que la tâche \(T'\) succède la tâche \(T\).
Si deux tâches \(T\) et \(T'\) sont telles que l'exécution de l'une ne nécessite pas l'exécution de l'autre au préalable, i.e. telles que \(\neg (T\propto T')\wedge\neg(T'\propto T)\), on dit que ce sont des tâches parallélisables et on écrit \(T\;\Vert\;T'.\) La relation \(\propto\) est antiréflexive, en effet une tâche \(T\) ne peut pas terminer son exécution avant même d'avoir commencé, elle est antisymétrique et bien sûr transitive.
Le graphe d'une relation de précédence est représenté par un diagramme qui omet tous les arcs que l'on peut déduire par transitivité. Deux questions classiques sont étudiées dans les cours de systèmes d'exploitation des formations en informatique :
Le premier cas correspond à la situation où les différentes tâches sont exécutées par un unique processeur, le deuxième cas si le système alloue plusieurs processeurs pour exécuter des tâches en parallèle. Considérons par exemple la relation de précédence définie sur l'ensemble \({\mathscr T}:=\{T_1,T_2,\ldots,T_9\}\) par la fermeture transitive \(\overline{G}\) du graphe
\begin{align*} G:=\Big\{(T_7,T_4),\ (T_4,T_1),\ &(T_1,T_2),\ (T_2,T_3),\ (T_4,T_5),\\ &(T_5,T_2),\ (T_5,T_6),\ (T_8,T_5),\ (T_8,T_9),\ (T_9,T_6) \Big\}. \end{align*}Son diagramme de précédence est représenté ci-dessous. Seuls les numéros des tâches sont indiqués :
Pour organiser un séquencement de ces \(9\) tâches, que ce soit de manière séquentielle ou parallèle, il faut bien sûr commencer par des tâches \(T\) qui n'ont aucun arc incident vers le sommet correspondant dans le diagramme, c'est-à-dire telles qu'il n'existe aucune tâche \(T'\) telle que \(T'\propto T\). Il n'y a que les tâches \(\color{#88F}T_7\) et \(\color{#88F}T_8\) qui ne sont précédées par aucune tâche.
Un ordonnancement séquentiel possible (il n'y pas nécessairement unicité) comme solution du premier problème est :
\begin{equation*} {\color{#88F}T_7}\rg T_4\rg {\color{#88F}T_8}\rg T_5\rg T_1\rg T_9\rg T_6\rg T_2\rg T_3. \end{equation*}Nous verrons au chapitre consacré à la combinatoire qu'une telle solution constitue une permutation de l'ensemble \(\{1,2,\ldots,9\}\). L'ordonnancement parallèle solution du second problème est :
\begin{equation*} ({\color{#88F}T_7}\;\Vert\;{\color{#88F}T_8})\rg (T_4\;\Vert\;T_9)\rg (T_5\;\Vert\;T_1)\rg (T_2\;\Vert\;T_6)\rg T_3. \end{equation*}Ces solutions sont faciles à trouver à la main sur une instance aussi petite que celle de cet exemple, mais dans toute leur généralité ces problèmes nécessitent d'élaborer des algorithmes pour les résoudre et on souhaite qu'ils soient efficaces.
D'autres questions sont soulevées par les relations de précédences. Il ne faut pas que dans un graphe de précédence apparaisse un circuit, c'est-à-dire une séquence \(T_{i_1},T_{i_2},\ldots,T_{i_k}\) de tâches telle que
\begin{equation} \label{circuit} \forall j\in \llbracket 1,\,k-1\rrbracket\ \ T_{i_j}\propto T_{i_{j+1}}\ \ \text{et}\ \ T_{i_k}\propto T_{i_1}. \end{equation}Plus simplement, la condition \((\ref{circuit})\) exprime qu'il ne faut jamais être en mesure de partir d'une tâche \(T\) du graphe et d'y revenir en suivant des flèches. La raison est simple, si un tel circuit existe, alors par transitivité de la relation \(\propto\), on a \(T\propto T\) ce qui contredit l'antiréflexivité.
Comment savoir s'il existe des circuits dans un graphe ? Est-on capable de les trouver rapidement ? C'est ce genre de questions qui sont étudiées en théorie des graphes et on en saisit bien l'utilité.
Résolution du problème introductif
Modélisation avec les graphes
La modélisation de ce problème*(*) appelé Jeu de Nim, se fait dans le cadre de la théorie des graphes, l'objet graphe est donc relatif à cette définition.
Notons \(n\) le nombre d'allumettes sur le tas au début de la partie et considérons le graphe \(G:=(X,U)\) d'ensemble de sommets \(X:=\ab{0}{n}\) et d'arcs \[U:=\{(k,\ell)\in X\times X\such 1\leq k-\ell\leq 3\}.\] Autrement dit, \(X\) contient toutes les valeurs possibles du nombre d'allumettes sur le tas lors du déroulement des parties et on relie une valeur \(k\) à une valeur \(\ell\) si et seulement s'il s'agit d'un coup autorisé.
Chaque sommet \(k\) de ce graphe code une position du jeu et un joueur dans cette position doit choisir parmi les \(3\) coups possibles \((k,k+1)\), \((k,k+2)\) et \((k,k+3)\), celui ou ceux qui peuvent l'amener à une victoire, si un tel coup existe.
Il n'est pas difficile de constater que si un joueur est en position \(\color{yellow}3\), \(\color{yellow}2\) ou \(\color{yellow}1\), il peut toujours amener le joueur adverse dans la position perdante \(0\) puisqu'il peut retirer \(1\), \(2\) ou \(3\) allumettes. Mais pour être certain d'être dans l'une de ces trois positions gagnantes, il fallait nécessairement que le joueur adverse soit en position \(\color{red}4\) au préalable, elle aussi perdante par conséquent, et ainsi de suite. Cette analyse empirique montre qu'un joueur dans l'une des positions en jaune peut toujours amener le joueur adverse sur l'une des positions perdantes en rouge. Par conséquent, le joueur qui connaît cette stratégie et qui commence cette partie est sûr de gagner, sinon il faut qu'il compte sur l'ignorance du joueur adverse pour pouvoir se retrouver sur une position gagnante avant que toutes les allumettes soient retirées.
Le graphe \(G=(X,U)\) définit indirectement la correspondance \((X,U,X)\) que nous noterons encore \(G\) par abus de langage. Observons les propriétés de la partie \(A:=\color{red}\{0,4,8\}\). Aucune flèche ne permet de relier deux sommets de \(A\), on dit dans ce cas que \(A\) est indépendante du graphe \(G\) : \begin{equation} \forall (x,y)\in A^2\ \ (x,y)\not\in U. \end{equation} D'autre part, tout sommet hors de \(A\) est relié à un sommet de \(A\), et on dit alors que \(A\) est une absorbante du graphe \(G\) : \begin{equation} \forall y\not\in A\ \exists x\in A\ \ (y,x)\in U \end{equation} Une partie \(A\) de \(X\) à la fois indépendante et absorbante est appelée noyau du graphe \(G\)
Notons qu'un graphe n'admet pas nécessairement de noyau, mais s'il en admet un celui-ci est unique, ce qui permet de parler du noyau d'un graphe. Le cas échéant, on dispose d'une stratégie générale pour gagner à tous les jeux similaires. Par exemple, deux personnes veulent cueillir des fleurs à tour de rôle sur une rangée de \(n\) fleurs, mais ils ne peuvent qu'en couper une à chaque fois et il est interdit de cueillir une fleur à côté d'une fleur qui a été coupée. La cueillette s'arrête quand il n'est plus possible de cueillir de fleur. Quel stratégie faut-il adopter pour être le dernier à cueillir une fleur ? Autre exemple : deux joueurs sont faces à plusieurs tas de pièces et peuvent retirer chacun leur tour un nombre arbitraire de pièces mais d'un seul tas, qui peut en revanche être différent à chaque tour de jeu. Comment éviter d'être celui qui ne pourra plus retirer de pièce ?
La question qui se pose à présent est de déterminer comment calculer le noyau d'un tel graphe autrement que de manière empirique ?
Fonctions de Grundy
Le mathématicien britannique Patrick Grundy s'est intéressé à ce type de problèmes et a développé l'outillage nécessaire en théorie des graphes pour les analyser et identifier les positions gagnantes et perdantes. Dans le graphe modélisant les différentes configurations du jeu des allumettes et les transitions qui les relient, on constate aisément que l'on peut regrouper les sommets suivant leur statut dans le déroulement du jeu : les sommets \(0\), \(4\) et \(8\) qui sont les positions perdantes, les sommets \(1\), \(5\) et \(9\) qui permettent de les atteindre en retirant \(1\) allumette, les sommets \(2\), \(6\) en retirant \(2\) allumettes et les sommets \(3\) et \(7\) en retirant \(3\) allumettes. Il y a donc \(4\) groupes de positions différents dans le graphe.
Plus généralement, s'il y a \(m\) groupes de positions différentes, une fonction de Grundy \(g\) fournit simplement pour un sommet \(x\in X\) du graphe, le numéro \(g(x)\) de son groupe, sachant que les groupes sont numérotés de \(0\) à \(m-1\) et que la valeur nulle est attribuée aux sommets du noyau du graphe.On comprend aisément l'intérêt d'une telle fonction, les positions gagantes/perdantes sont déterminées par la valeur de leur fonction de Grundy. Reste à déterminer les conditions qu'un graphe doit satisfaire pour qu'il admette une fonction de Grundy et, le cas échéant, comment construire cette fonction.
Travaux pratiques
L'objectif de ce TP est de transposer en Python quelques manipulations vues en cours sur les correspondances, fonctions et applications.
En séance
Une correspondance \(c:=(X,G,Y)\) est codée dans un fichier texte contenant un couple du graphe \(G\) par ligne. Cliquez sur ce lien et sauvegardez cet fichier dans le répertoire où vous écrirez vos scripts.
Un couple \((x,y)\) est codé par la séquence x > y. Une ligne contenant > y sans premier membre (resp. x > sans second membre) code un élément de l'ensemble d'arrivée (resp. de départ) qui n'est pas en relation avec un élément de l'ensemble de départ (resp. d'arrivée). Cela permet de déterminer tous les éléments des ensembles de départ \(X\) et d'arrivée \(Y\) de la correspondance, y compris ceux qui ne sont pas en relation.
On rappelle que l'on peut découper une chaîne de caractères chaine suivant un séparateur sep (une chaîne de caractère également, par défaut un espace) grâce à la méthode split(sep) qui renvoie la liste des sous-chaînes séparées par la chaîne sep. Ici on obtient la liste constitué des deux termes du couple en utilisant le symbole > comme séparateur :
couple = chaine.rstrip().split(">")
def Formater(X): return str(X).replace("'",'') def Afficher(names, c): print(names[0],":") for i in range(3): print("\t"+names[i+1]+" = ",Formater(c[i])) print()
Indication : Utilisez le dictionnaire de c et vérifier que pour toute entrée, sa valeur contient au plus un élément.
Indication : appliquer littéralement la définition du cours.
Indication : On supposera que l'ensemble d'arrivée de la correspondance \(f\) est égal à l'ensemble de départ de \(g\).
Compléments hors séance