Relations, applications

Introduction

Mettre en relation des entités de toute nature est une opération commune et universelle. Le développement rapide des techniques (ou technologies par tropisme anglophile) n'a-t-il pas transformé notre planète en monde connecté ? Connecter, associer, relier, joindre, etc. sont des opérations incontournables, fondamentales et omniprésentes en informatique et en mathématiques.

Les relations permettent de modéliser des systèmes complexes, de résoudre des problèmes pratiques et de concevoir des algorithmes efficaces. Ce concept est au cœur même des bases de données relationnelles, dans lesquelles les données sont organisées en tables codant des relations entres ensembles de données. Les requêtes sont alors fondées sur des opérations permettant de combiner ces différentes relations. Les réseaux de télécommunication sont modélisés par des graphes dans lesquels les relations entre objets connectés jouent un rôle clef, les algorithmes de routage s'appuyent sur ces relations pour déterminer des chemins optimaux entre deux nœuds selon les débits et/ou la latence d'une connection, etc. Les fonctions constituent souvent des objets élémentaires des langages de programmation et sont à la base de l'apprentissage automatique, etc.

Le jeu des allumettes

Encore une fois, nous allons commencer par exposer un problème dont l'analyse et la résolution mettrons en évidence l'utilité, la versatilité et la force des concepts introduits dans ce chapitre :

Règle du jeu des allumettes : deux joueurs doivent retirer à tour de rôle, au moins une allumette et au plus 3 allumettes d'un tas qui contient 15 allumettes au départ. Le joueur qui retire les dernières allumettes gagne la partie.

Ce jeu se généralise à un tas de \(n\) allumettes au départ et un nombre maximal \(a\) d'allumettes à retirer par chacun des joueurs (avec \(1\leqslant a \lt n\)). L'application ci-dessous vous permet de jouer contre la machine :

Une variante du jeu consiste à déclarer perdant celui qui retire les dernières allumettes.

Question :

Existe-t-il une stratégie gagnante à ce jeu ?

Les fonctions et les graphes seront au centre de la résolution de ce problème. Commençons par le modèle séminal de ce chapitre qui est la correspondance.

Relations, correspondances

Définitions

On généralise aisément la notion de graphe défini sur le produit cartésien de deux ensembles \(X\) et \(Y\) au produit cartésien d'un nombre arbitraire d'ensembles \(X_i\) :

Soit \(q\) un entier non-nul et \(X:=X_1\times\cdots\times X_q\) le produit cartésien de \(q\) ensembles \(X_i\). Toute partie \(G\subseteq X\) est appelée \(q\)-graphe défini sur \(X.\)

Soit \(X:=X_1\times\cdots\times X_q\). On appelle relation \(q\)-aire sur \(X,\) tout prédicat \(\rel\) à \(q\) variables \(x_i\in X_i\) où \(1\leqslant i\leqslant q.\) Le \(q\)-graphe de la relation \(\rel\) est défini par \begin{equation} G:=\{(x_1,\ldots,x_q)\in X\such \rel(x_1,\ldots,x_q)\} \end{equation} et pour tout \((x_1,\ldots,x_q)\in G,\) les \(q\) projections \(x_i\) sont dites en relation par \(\rel\).

On parle de relation unaire quand \(q=1\), de relation binaire quand \(q=2\) — auquel cas on retrouve naturellement le vocable usuel de graphe plutôt que \(2\)-graphe — et de relation ternaire quand \(q=3\), etc.

(1) Les couples*Au sens propre et au sens de la théorie des ensembles \((h,f)\in H\times F\) formés par un homme et une femme, définissent une relation binaire entre des éléments particuliers de l'ensemble \(H\) des hommes et de l'ensemble \(F\) des femmes (modèle canonique de la Manif pour tous…)
(2) Pour ceux qui ont une vision du monde moins hétéronormée, on préférera définir comme modèle pour le couple une relation binaire sur le produit cartésien \(U\times U\) d'un même ensemble \(U\) d'êtres humains.
(3) Pour filer la métaphore familiale, la relation de parentalité est un exemple de relation ternaire entre hommes (ensemble \(H\)), femmes (ensemble \(F\)) et enfants (ensemble \(E\)) définie sur le produit cartésien \(H\times F\times E\) ou sur le produit cartésien \(U\times U\times E\).
(4) La possibilité ou non d'assembler deux pièces d'un puzzle définit une relation binaire entre les pièces du puzzle sur le produit cartésien \(P \times P\) où \(P\) désigne l'ensemble des pièces du jeu.
(5) Le jumelage entre communes françaises et étrangères constitue une relation binaire. Ainsi la ville de La Garde est jumelée avec la ville de Montesarchio en Italie ainsi que la ville de Spa en Belgique.

Relations \(q\)-aires et \(q\)-graphes sont deux facettes d'une même pièce. Il est clair que la donnée d'un \(q\)-graphe défini sur un produit cartésien \(X:=X_1\times\cdots\times X_q\) d'ensembles \(X_i\), définit indirectement une relation \(q\)-aire \(\rel\) sur ces ensembles. En effet si \(G\subseteq X\), on lui associe naturellement la relation \(q\)-aire définie sur \(X\) par \[\forall (x_1,x_2,\ldots,x_q)\in X\quad \rel(x_1,x_2,\ldots,x_q)\Leftrightarrow (x_1,x_2,\ldots,x_q)\in G.\]

Parmi tous les types de relations, les relations binaires sont les plus utilisées et font l'objet d'une attention toute particulière. On note généralement une relation binaire de manière infixe \(x{\rel}y\), plutôt que préfixe \(\rel(x,y)\), mimant ainsi plus fidèlement l'expression \(x\) est en relation avec \(y\). Une section spécifique de ce chapitre sera consacrée aux relations binaires entre éléments d'un même ensemble, i.e. \(Y=X\).

Dans le cadre de cette étude, une relation binaire entre deux ensembles \(X\) et \(Y\) est souvent rebaptisée correspondance : à des éléments de \(X\), on fait correspondre des éléments de \(Y\). Sa définition s'appuie directement sur un graphe sans plus faire référence à un prédicat :

Soit \(X\) et \(Y\) deux ensembles et \({\color{#FD4}G}\subseteq X\times Y\). Le triplet \(c:=(X,{\color{#FD4}G},Y)\) est appelé correspondance d'ensemble de départ \(X\), d'ensemble d'arrivée \(Y\) et de graphe \({\color{#FD4}G}\).

On représente souvent une correspondance à l'aide d'un diagramme sagittal (i.e. en forme de flèche) qui en fournit une interprétation concrète. Les ensembles de départ \(X\) et d'arrivée \(Y\) sont matérialisés par des patates et chaque couple \({\color{#FD4}(x,y)}\) du graphe \({\color{#FD4}G}\) par une flèche reliant \(x\) à \(y\) : \[x\;{\color{#FD4}\longrightarrow}\;y.\] La flèche a pour premier mérite de mettre en évidence l'asymétrie de la construction puisque \((x,y)\not=(y,x).\)

Diagramme sagittal du jumelage de certaines villes.

Le diagramme sagittal ci-dessus illustre le jumelage de quelques villes. On constate que les villes de Mazaugues et Signes ne sont pas jumelées avec des villes étrangères et que les villes étrangères de Liski et Vegen ne correspondent à aucun jumelage. Tous les éléments de l'ensemble de départ \(X\) n'ont donc pas nécessairement de correspondant(s) dans l'ensemble d'arrivée \(Y\) et réciproquement tous les éléments de \(Y\) n'ont pas nécessairement de correspondant(s) dans \(X\). Ceci nous amène à définir les sous-ensembles de \(X\) et de \(Y\) suivants :

Soit \(c:=(X,{\color{#FD4}G},Y)\) une correspondance. On appelle ensemble de définition ou domaine de définition de \(c,\) la première projection de son graphe \(\text{pr}_1(G)\) notée \(\text{Def}(c)\) (ou \({\mathscr D}(c)\)) et ensemble image de \(c\), la deuxième projection de son graphe \(\text{pr}_2(G)\) notée \(\text{Im}(c)\).

On considère la correspondance \(c\) définie par son diagramme sagittal en figure 1.

Décrivez son ensemble de départ, son ensemble d'arrivée, son graphe \(G\) ainsi que son ensemble de définition et son image en extension. NB. Contentez vous des initales de chaque ville (elles sont toutes différentes dans leurs ensembles respectifs).

Une fois que vous aurez terminé l'étude de la section 3, comment interprétez vous le Nota Bene de la question précédente en terme de correspondance ?

Dans l'ordre, nous avons les ensembles suivants : \begin{align*} X&=\{L, T ,S , M ,N\}\\ Y&=\{A, S, C ,M,L,Y,N,V,K\}\\ {\color{#FD4}G}&={\color{#FD4}\{(L,M),(L,S),(T,N),}{\color{#FD4}(T,K),(N,A),(N,C),(N,Y)\}}\\ \text{Def}(c)&=\{L,T,N\}\\ \text{Im}(c)&=\{M,A,S,C,M,Y,N,K\} \end{align*}

L'application qui à une ville de \(X\) (idem pour \(Y\))) associe l'initiale de son nom dans l'ensemble \(A\) des lettres de l'alphabet est injective.

Nous avons noté \((X,{\color{#FD4}G},Y)\) une correspondance alors que dans la littérature mathématique, une correspondance est souvent codée par un triplet \((X,Y,{\color{#66F}G})\) (on pourrait également considérer le codage \(({\color{#F66}G},X,Y)\)). Formellement, ces différentes écritures définissent des strutures distinctes, mais le triplet joue simplement le rôle d'une boite à trois casiers pour y ranger les données nécessaires à la modélisation de l'objet, ces trois structures sont donc équivalentes et interchangeables (formellement ces structures sont isomorphes). Le choix de la position infixe est didactique : il souligne que le graphe \(\color{#FD4}G\) décrit les flèches situées entre les ensembles \(X\) et \(Y\) dans le diagramme. L'écriture postfixe, plus courante dans la littérature, s'explique par notre lecture de gauche à droite, où l'on présente d'abord les ensembles, puis la relation qui les relie.

En inversant le sens des flèches du diagramme sagittal d'une correspondance \(c=(X,G,Y)\) et en échangeant les rôles des ensembles de départ \(X\) et d'arrivée \(Y\), on obtient une nouvelle correspondance appelée correspondance réciproque de \(c\) et on la note \(c^{-1}\).

Le choix de la notation \(c^{-1}\), qui n'a rien d'un quotient dans ce contexte, sera légitimé une fois étudiées la loi de composition des correspondances et ultérieurement les propriétés structurelles des lois de composition dans le chapitre consacré aux groupes.

Écrivez formellement la définition de la correspondance réciproque \(c^{-1}\) d'une correspondance \(c=(X,G,Y)\).

Soit \(c=(X,G,Y)\) une correspondance. On appelle correspondance réciproque de la correspondance \(c,\) la correspondance notée \(c^{-1}:=(Y,G^{-1},X)\) où \(G^{-1}\) est le graphe défini par \[G^{-1}:=\{(y,x)\in Y\times X\such (x,y)\in G\}.\]

Dans le plan réel \(\R\times\R\), on considère un cercle de rayon \(r\) et de centre \(C\), i.e. l'ensemble des points du plan réel qui sont à distance \(r\) du point \(C\). Définissez formellement la correspondance \(c\) dont le graphe est ce cercle. Quelle est sa correspondance réciproque ?

Si l'on note \(C=(x_C,y_C)\), il s'agit de la correspondance \(c=(\R,G,\R)\) dont le graphe est défini par \[ G:=\{(x,y)\in\R\times\R\mid d((x,y),(x_C,y_C)) = r\}. \] On vérifie aisément que \[ G^{-1}:=\{(x,y)\in\R\times\R\mid d((x,y),(y_C,x_C)) = r\}. \]

L'application ci-dessous vous permet de visualiser le diagramme sagittal d'une correspondance \(c=(X,{\color{#EF4}G},Y)\) pour des ensembles finis \(X\) et \(Y\) de votre choix. Les propriétés de la correspondance (elles seront introduites dans la suite de l'exposé) y sont résumées :

Images directes et réciproques

Si \(c=(X,G,Y)\) est une correspondance, l'image directe par \(c\) d'une partie \(A\subseteq X\) de l'ensemble de départ, notée \(c(A)\), est le sous-ensemble des éléments de l'ensemble d'arrivée \(Y\) atteints par les éléments de \(A\). Ainsi pour la partie \(A:=\{La\ Garde,\ Nice\}\) de l'exemple introductif, on a

\begin{equation*} c(A)=\{Montesarchio,\ Spa,\ Alicante,\ Cuneo,\ Yalta\}. \end{equation*}

Réciproquement, l'image réciproque par \(c\) d'une partie \(B\subset Y\), notée \(c^{-1}(B)\), est l'image directe de \(B\) pour la correspondance réciproque \(c^{-1}\). Toujours avec l'exemple introductif et en considérant \(B:=\{Spa,\ Kronstad\}\), on a

\begin{equation*} c^{-1}(B)=\{La\ Garde,\ Toulon\}. \end{equation*}

Plus formellement :

Soit \(c=(X,G,Y)\) une correspondance et \(A\) une partie de \(X\). On appelle image directe de \(A\) par \(c,\) le sous-ensemble de \(Y\) noté \(c(A)\) et défini par \begin{equation} \label{eq:imdir} c(A):=\{y\in Y\mid \exists x\in A\ (x,y)\in G\}. \end{equation}

Soit \(c=(X,G,Y)\) une correspondance et \(B\) une partie de \(Y\). On appelle image réciproque de \(B\) par \(c,\) l'image directe de \(B\) pour la correspondance réciproque \(c^{-1}\) de \(c\) : \begin{equation} c^{-1}(B):=\{x\in X\mid \exists y\in B\ (x,y)\in G\}. \end{equation} Si \(B\) est réduit à un singleton \(\{y\}\), tout élément \(x\in c^{-1}(B)\) est appelé antécédent de \(y\).

D'après cette définition, on a donc \(\text{Im}(c)=c(X)\). Notons qu'il est bien plus efficace de garder une image mentale d'une correspondance sous forme de diagramme sagittal pour retrouver aisément toutes ces définitions que de les apprendre par cœur. Pour reprendre la métaphore musicale de l'introduction de ce cours, il est beaucoup plus simple de retenir et fredonner la mélodie d'une chanson pour en retrouver la partition plutôt que d'apprendre cette partition.

Quel est le graphe de la correspondance réciproque de la correspondance définie dans cet exercice ?

Composition des correspondances

Le terme de correspondance est familier du lecteur qui a voyagé et a dû changer de train durant son périple. Pour illustrer le propos, on modélise une fiche horaire entre deux villes par une correspondance \(g=(X,{\color{#FD4}G},Y)\) où les ensembles \(X\) et \(Y\) contiennent respectivement les heures de départ et d'arrivée des différents trains reliant les deux villes \(X\) et \(Y\). Si l'on dispose d'une deuxième correspondance \(h=(Y,{\color{#08F}H},Z)\) reliant les villes \(Y\) et \(Z\), on définit implicitement une fiche horaire entre les villes \(X\) et \(Z\) en passant par \(Y\) dont la modélisation mathématique n'est autre que la composition des correspondances \(h\) et \(g\). Il suffit de rabouter les flèches qui arrivent en \(Y\) avec celles qui en partent et d'observer pour chaque élément de \(X\) quels sont les éléments correspondants dans \(Z\) :

Diagramme sagittal de \(2\) correspondances \(\color{#FD4}g\) et \(\color{#08F}h\).

Pour filer la métaphore ferrovaire, on observe dans le diagramme ci-dessus qu'il y a deux trains qui partent à \(4\)h de la ville \(X\) et permettent d'arriver à destination à la ville \(Z\) à \(7\)h ou \(10\)h en passant par la ville \(Y\). Il s'agit bien d'une correspondance entre les villes \(X\) et \(Z.\) Il ne reste qu'à la définir formellement.

Soit \(g=(X,{\color{#FD4}G},Y)\) et \(h=(Y,{\color{#08F}H},Z)\) deux correspondances. On appelle composition des correspondances \(h\) et \(g,\) la correspondance \(f=(X,{\color{orange}F},Z)\) dont le graphe est défini par \begin{equation} {\color{orange}F}:=\{{\color{orange}(x,z)}\in X\times Z\such\exists y\in Y\ \ ({\color{orange}x},y)\in{\color{#FD4}G}\ \wedge\ (y,{\color{orange}z})\in {\color{#08F}H}\}. \end{equation} On note cette correspondance \(h\circ g\) (que l'on lit \(h\) rond \(g\)) et \begin{equation} \forall A\subseteq X\quad {\color{#08F}h}\circ {\color{#FD4}g}\,(A)= {\color{#08F}h}\big({\color{#FD4}g}\,(A)\big). \end{equation}

Pour les fonctions dont le diagramme sagittal est décrit dans la figure précédente, on a : \begin{align*} {\color{#08F}h}\circ {\color{#FD4}g}\,(\{3\})&=\{7\} & {\color{#08F}h}\circ {\color{#FD4}g}\,(\{7\})&=\{10\} & {\color{#08F}h}\circ {\color{#FD4}g}\,(\{4\})&=\{7,10\} & {\color{#08F}h}\circ {\color{#FD4}g}\,(\{8\})&=\varnothing\\ {\color{#08F}h}\circ {\color{#FD4}g}\,(\{5\})&=\{4\} & {\color{#08F}h}\circ {\color{#FD4}g}\,(\{0\})&=\varnothing & {\color{#08F}h}\circ {\color{#FD4}g}\,(\{1\})&=\{10\} \end{align*}

Il ne faut pas être perturbé par l'ordre dans lequel on écrit la composition \(h\circ g\) alors que la correspondance \(g\) agit avant la correspondance \(h\). Cette tension est lié au fait que les occidentaux lisent/écrivent de gauche à droite et que les expressions suivent habituellement la chronologie des processus qu'elles décrivent. Comme la notation des correspondances est préfixe et que la correspondance \(h\) s'applique après la correspondance \(g\), elle agit sur \(g(A)\) on l'écrit \(h(g(A))=(h\circ g)(A)\). Si les correspondances avaient été notées de manière postfixe, i.e. \((A)g\) au lieu de \(g(A)\), tout rentrerait dans l'ordre…

Soit \(f=(X,G,Y)\), \(g=(Y,H,Z)\) et \(h=(Z,I,T)\) trois correspondances. Vérifiez que \begin{equation} h\circ(g\circ f)=(h\circ g)\circ f. \end{equation} Cette propriété est appelée associativité de la composition.

Quel est le graphe de la correspondance \(c\circ c\) où \(c\) est la correspondance définie dans cet exercice ?

Soit \(f=(X,G,Y)\) et \(g=(Y,H,Z)\) deux correspondances. Démontrez que \[(g \circ f)^{-1} = f^{-1}\circ g^{-1}.\]

Fonctions, applications

Fonctions

Une fonction désigne un type de correspondance particulière telle qu'il y a au plus une flèche qui part d'un élément \(x\in X\). C'est la transposition mathématique du terme largement employé dans le langage courant : le montant à régler au parcmètre est fonction de la durée de stationnement, votre note au contrôle continu de l'ue de Mathématiques pour l'Informatique est fonction du nombre de bonnes réponses, etc. Dans ce contexte, il ne peut y avoir qu'un seul montant à régler qui correspond avec la durée de stationnement et qu'une seule note associée au nombre de bonnes réponses.

Ainsi, l'exemple de la figure 1 n'est pas une fonction car, entre autres, la ville de La Garde est en correspondance avec deux villes étrangères. La condition à respecter pour qu'une correspondance définisse une fonction s'exprime formellement de la manière suivante :

Une correspondance \(f=(X,G,Y)\) est appelée correspondance fonctionnelle ou fonction si et seulement si elle satisfait la condition suivante : \begin{equation} \label{eq:corrfon} \forall (x,y_1,y_2)\in X\times Y^2\quad \big((x,y_1)\in G\ \wedge\ (x,y_2)\in G\big)\Rightarrow (y_1=y_2). \end{equation}

La façon d'exprimer mathématiquement au plus une flèche dans la proposition \((\ref{eq:corrfon})\) ci-dessus peut sembler surprenante, mais elle répond bien à la contrainte : si deux couples avec la même première projection \(x\) appartiennent au graphe de la correspondance, alors leurs deuxièmes projections sont nécessairement égales, autrement dit ces deux couples sont égaux.

Nous n'avons pas encore étudié formellement le cardinal \(\#X\) d'un ensemble fini \(X\), mais nous aurions pu définir alors une fonction à l'aide de la propriété suivante plus simple à interpréter : \[ \forall x\in X\ \ f(\{x\})\text{ est fini et}\ \#f(\{x\})\leqslant 1. \]

La définition d'une fonction via l'assertion \((\ref{eq:corrfon})\) est préférable car elle ne nécessite pas l'outillage des entiers naturels et de la cardinalité.

Exprimez formellement qu'une correspondance n'est pas fonctionnelle en écrivant la négation de l'expression \((\ref{eq:corrfon})\). Réécrivez la définition d'une fonction en remplaçant l'expression \((\ref{eq:corrfon})\) par sa contraposée.

La négation de la proposition \((\ref{eq:corrfon})\) est \[ \exists (x,y_1,y_2)\in X\times Y^2\quad \big((x,y_1)\in G\ \wedge\ (x,y_2)\in G\big)\wedge (y_2 \neq y_1). \] La contraposée de la proposition \((\ref{eq:corrfon})\) est \[ \forall (x,y_1,y_2)\in X\times Y^2\quad (y_1\not = y_2)\Rightarrow\big((x,y_1)\not\in G\ \vee\ (x,y_2)\not\in G\big). \]

Dans le diagramme ci-dessous nous représentons la fonction qui associe le taux de tva à une activité ou une vente (si elle est assujettie à cette taxe).

Diagramme sagittal d'une fonction \(f=(X,{\color{#FD4}G},Y)\).

Comme on peut le constater par l'absence d'une flèche, les soins d'une carrie dentaire ne sont pas assujetis à la tva (les actes médicaux ne sont pas soumis à cette taxe). On aurait pu rajouter un taux de \(0\%\) dans l'ensemble d'arrivée et inclure le couple \((\text{carrie},0\%)\) au graphe \( G\), mais il est plus cohérent de le modéliser sans cet arc puisque la tva ne s'applique pas aux actes médicaux. On note également que certains taux de tva ne correspondent à aucune activité/vente.

Soit \(x\in X\), d'après la caractérisation d'une fonction \((\ref{eq:corrfon})\), soit l'image directe \(f(\{x\})\) du singleton \(\{x\}\) est l'ensemble vide \(\varnothing\), soit c'est un singleton \(\{y\}\). Ceci justifie la définition suivante :

Soit \(f:X\to Y\) une fonction, \(x\in\text{Def}(f)\) et \(y\in Y\) tel que \(f(\{x\})=\{y\}.\) Comme \(y\) est unique, on dit que \(f\) est définie en \(x\) et que \(\color{#FD4}y\) est l'image de \(x\) par \(f\) notée \(\color{#FD4}f(x)\).

L'ensemble de définition de la fonction dont le diagramme sagittal est donné en figure 3 est :

\begin{equation} \label{liste} \text{Def}(f)=\{glace,\ alcool,\ cinéma,\ smartphone,\ livre\}. \end{equation}

Dans l'autre sens, si l'on se donne \(y\in Y\) et que la partie \(f^{-1}(\{y\})\) n'est pas vide, elle n'est pas nécessairement réduite à un unique élément, \(y\) peut donc posséder plusieurs antécédents.

La fonction \(f\) associée au diagramme de la figure 2 n'est pas définie en carrie. L'image de cinéma est \(2,1\%\), ce que l'on écrit \(f(cinema)=2,1\%\). Il est important de réaliser que la notation \(f(x)\) n'a de sens que si la fonction \(f\) est définie en \(x\), en revanche \(f(\{x\})\) a toujours un sens, c'est l'image directe du singleton \(\{x\}\) par la correspondance \(f\) qui serait égale à l'ensemble vide \(\varnothing\) dans le cas où la fonction n'est pas définie en \(x\). Par définition un élément \(x\in X\) admet au plus une image par la fonction \(f\), mais un élément \(y\in Y\) peut avoir plusieurs antécédents. Par exemple smartphone et alcool sont deux antécédents de \(20\%\). Les valeurs \(15\%\), \(30\%\) et \(75\%\) n'admettent pas d'antécédents.

Le lecteur averti pourrait contester ce modèle mathématique simplifié en avançant que la tva de certains produits dépend du lieu de consommation. En effet, la tva appliquée à une glace est différente selon qu'elle est consommée sur place \((5,5\%)\) ou emportée \((10\%)\). Autrement dit, il faudrait deux flèches pour la glace, une vers la valeur \(5,5\%\), l'autre vers \(10\%,\) le bon modèle mathématique serait alors la correspondance. Ce modèle serait tout de même incomplet, puisque l'information codant le fait que la glace est consommée ou non sur place n'est pas intégrée au modèle. Ce type de modélisation sera étudié en détail dans l'enseignement de théorie des graphes de la licence.

On utilise souvent l'écriture \(f:X\rightarrow Y\) pour définir une fonction \(f=(X,G,Y)\) même si son graphe \(G\) n'est pas spécifié. Cette omission est justifiée par le fait que \(f\) étant une fonction, elle est définie en tout élément \(x\) de son domaine de définition \(\text{Def}(f)\) et son graphe \(G\) est par conséquent \[G:=\left\{(x,y)\in X\times Y\such (x\in \text{Def}(f))\wedge (y=f(x))\right\}.\]

Parfois l'image \(f(x)\) d'un élément \(x\) de \(X\) par une fonction \(f\) peut être calculée. En effet, nous verrons dans un prochain chapitre que les ensembles peuvent être équipés de lois de composition internes, comme l'addition ou la multiplication sur \(\R\) par exemple. Dans ce cas, cela induit une vision dynamique de la fonction* l'utilisation massive de flèches renforce également cette dynamique., comme s'il s'agissait d'une machine qui traitait la matière première \(\color{#FD4}x\) en entrée et qui fournissait le produit fini \(\color{#BBF}y\) en sortie :

Vision schématique d'une fonction calculable.

La fonction \(f:\R\to\R\) qui calcule la circonférence d'un cercle en fonction de son rayon \(r\) dont le graphe est l'ensemble des couples \((r,f(r))\) tels que \(f(r)=2\,\pi\,r\). On complète alors l'écriture \(f:X\to Y\) avec l'expression du calcul qu'elle effectue : \begin{align} \label{fonc:circonf} f:{\R}&\longrightarrow {\R}\\ \notag r&\longmapsto 2\pi r \end{align} Il faut noter la différence entre la flèche qui relie les ensembles de départ et d'arrivée et celle munie d'un talon qui relie un élément de l'ensemble de départ à son image (quand elle existe) dans l'ensemble d'arrivée.

Il n'est pas toujours possible de calculer une fonction, c'est-à-dire d'exprimer l'image d'un élément par un processus calculatoire. La théorie de la calculabilité enseignée en master d'informatique a précisément pour objectif d'étudier cette question et d'en tirer des conséquences sur ce que nous pouvons réaliser ou non avec des ordinateurs.

Comme nous l'avions annoncé dans le chapitre dédié à la théorie des ensembles, on peut désormais présenter une autre écriture en compréhension, fondée sur la notion d'image d'une fonction \(f:X\to Y\) :

\[ \{f(x)\such x\in A\} \] où \(A\subseteq\text{Def}(f)\). Cette écriture est synonyme de \[ \{y\in Y\such \exists x\in A\ y=f(x)\}. \] Par commodité, pour un prédicat \(P(x)\), on combine souvent les deux écritures et \[\{f(x)\such (x\in A)\land P(x)\}\] recode \[ \{y\in Y\such \exists x\in A\ (y=f(x))\land P(x)\}. \]

Parfois la fonction est implicite dans la description : \(\{7n\such n\in \N\}\) décrit l'ensemble des entiers naturels multiples de \(7\) où l'on fait implicitement référence à l'application \(f:\N\to\N\) définie par \(f(n)=7n\).

(1) Les fonctions des langages de programmation sont la transposition directe de leurs homologues mathématiques (quand elles sont calculables). Ainsi la fonction \(f:\R\to\R\) définie par \((\ref{fonc:circonf})\) se définit en Python par :

    def circonference(r: float) -> float:
    return 2 * Math.pi * r

Dans cette définition Python, on a explicitement fixé les ensembles de départ (type r: float) et d'arrivée (type -> float) ce qui n'est pas exigé car Python détermine le type de chaque paramètre à la volée.

(2) Certains langages de programmation autorisent une écriture analogue à l'écriture en compréhension pour définir de nouveaux objets. Par exemple en Python, l'ensemble suivant (type set) :

    E = {n - 1 for n in range(13) if (n % 3 == 0)}

est défini en compréhension.Si \(P(n)\) désigne le prédicat \(n\) est multiple de \(3\), c'est-à-dire \(\exists k\in\N\ \ n=3k\), cet ensemble correspond à la construction mathématique :

\[E:=\{n - 1\such (n\in \ab{0}{12})\,\wedge\,(\exists k\in\N\ n=3k)\}\] où la fonction est implicitement définie par \(n\mapsto n-1.\) Ce procédé de construction en compréhension est également opérationnel pour des listes ou des tuples.

On considère la fonction \(f:\R\rightarrow\R\) définie par \(f(x):=1/x\). Quel est son domaine de définition ? Même question pour \(g(x):=\sqrt{x}\). Même question pour \(g\circ f\) et \(f\circ g\).

Applications

Une fonction \(f=(X,G,Y)\) telle que \(\text{Def}(f)=X\), est appelée application de \(X\) dans \(Y.\) L'ensemble des applications de \(X\) dans \(Y\) est noté \(Y^X.\)

La notation \(Y^X\) peut sembler étrange à première vue. Nous verrons pourquoi il s'agit d'une bonne notation dans le chapitre consacré à la combinatoire.

La fonction définie en \((\ref{fonc:circonf})\) est aussi une application, elle est en effet définie en tout nombre réel \(r,\) son domaine de définition \(\R\) est égal à son ensemble de départ. En revanche, la fonction \begin{align} \label{fonc:inverse} f:{\R}&\longrightarrow {\R}\\ \notag x&\longmapsto 1/x \end{align} n'est pas une application puisqu'elle n'est pas définie en \(0\). Son domaine de définition est l'ensemble \(\text{Def}(f)={\R}\setminus\{0\}\). Notons que si cette fonction n'est pas définie en \(0\), ce n'est pas pour un quelconque interdit, mais parce qu'elle est définie via son graphe qui est constitué des couples \((x,y)\in{\R}\times{\R}\) solution de l'équation \[xy=1.\] Ce graphe ne contient donc aucun couple \((x,y)\) tel que \(x=0\) ou \(y=0\).

Exprimez le graphe \(G\) de la fonction définie en \((\ref{fonc:inverse})\) sans utiliser d'écriture en compréhension.

Le jeu d'opérations élémentaires sur les ensembles dont on dispose est suffisament riche pour le faire sans utiliser la logique des prédicats : il suffit de retirer de l'ensemble \(\R\times\R\) de tous les couples de réels, ceux dont la première ou la deuxième projection est nulle : \[ G=({\color{lightblue}\R\times\R})\;{\color{green}\setminus}\;\big(({\color{orange}\{0\}}\times\R)\;{\color{red}\cup}\;(\R\times{\color{orange}\{0\}})\big).\]

On dit que deux applications \(f:X\to Y\) et \(g:X'\to Y'\) coïncident sur une partie \(A\subseteq X\cap X'\) si elles sont égales en tout élément de \(A\) : \begin{equation} \forall x\in A\quad f(x)=g(x). \end{equation}

Soit \(f:X\to Y\) une application et \(A\) une partie de \(X\). L'application de \(A\rightarrow Y\) qui coïncide avec \(f\) sur \(A\) est appelée restriction de \(f\) à \(A\) et notée \(f{/}_A\).

Il est très facile d'obtenir une application à partir d'une fonction qui n'est pas définie en tout point de son ensemble de départ \(X\). Il suffit de remplacer \(X\) par le domaine de définition \(\text{Def}(f)\) de cette fonction, autrement dit de considérer sa restriction \(f/_{\text{Def}(f)}\). Dans le cas de la fonction de la figure 2, il suffit d'éliminer carrie de l'ensemble \(X\), i.e. le nouvel ensemble de départ est \(X':=\text{Def}(f)\) :

Diagramme sagittal de l'application obtenue par restriction de cette fonction à son domaine de définition.

Quant à la fonction \(f\) définie en \((\ref{fonc:inverse})\), il suffit d'éliminer \(0\) pour en faire une application, il s'agit de la fonction \(g:{\R}^*\to{\R}\) définie par \(g(x):=\frac{1}{x}.\) Attention, \(g\not=f\). En effet, une fonction est avant tout une correspondance, c'est-à-dire un triplet, or deux triplets sont égaux si et seulement si leurs trois projections sont égales respectivement. Autrement dit deux correspondances sont égales si et seulement si elles ont même ensemble de départ, même ensemble d'arrivée et même graphe

Soit \(X,Y,X',Y'\) des ensembles tels que \(X\subseteq X'\) et \(Y\subseteq Y'\). On considère deux applications \(f:X\to Y\) et \(g:X'\to Y'\).

Quelle définition proposez-vous pour exprimer que \(g\) est un prolongement de \(f\) selon votre acception du terme prolongement ?

On dit que \(g\) est un prolongement de \(f\) si et seulement si \(g\) coïncide avec \(f\) sur \(X\).

Fonctions et applications sont deux concepts très voisins en théorie des ensembles. Historiquement le terme fonction était plutôt utilisé pour exprimer qu'une quantité physique variait selon une autre quantité physique (autrement dit les fonctions numériques de \({\R}\) dans \({\R}\)) alors que le terme application avait une connotation plus géométrique, comme une carte. Le terme anglo-saxon map qui est la traduction du mot application est explicite à ce sujet.

La confusion entre fonction et application dans les textes mathématiques est courante et distinguer les deux peut sembler superfétatoire. En effet, quel est l'intérêt de considérer comme ensemble de départ un autre ensemble que l'ensemble de définition d'une fonction puisqu'elle n'est pas définie ailleurs ? Le premier est d'attirer l'attention sur cet ensemble de définition qu'il ne faut surtout pas négliger, et l'autre est que les questions qui vont suivre sur les propriétés remarquables des applications se justifient naturellement en considérant la correspondance réciproque qui peut être ou non une fonction, voire une application. Quoi qu'il en soit, il est très facile de transformer une fonction en application, il suffit de considérer que son ensemble de départ est son ensemble de définition.

Si la correspondance réciproque \(f^{-1}\) d'une fonction \(f\) est elle-même une fonction, elle est appelée fonction réciproque. La section suivante est consacrée à l'étude des correspondances réciproques et de leur statut.

Les correspondances réciproques des correspondances des figures 1 & 2 définissent-elles des fonctions ? La fonction de \({\R}\) dans \({\R}\) définie par \(x\mapsto x^2\) est-elle une application ? Sa correspondance réciproque est-elle une fonction ?

Injections

Quand on se donne une correspondance, il est naturel de s'intéresser à la correspondance réciproque (voir exercice), ne serait-ce que parce que sa construction est extrêmement simple, il suffit d'inverser le sens des flèches et d'échanger le rôle de l'ensemble de départ et de l'ensemble d'arrivée. L'étude de la réversibilité du processus est intéressante, en particulier quand il s'agit d'une fonction calculable.

On réalise immédiatement en construisant la correspondance réciproque de l'application de ce diagramme que celle-ci n'est même plus une fonction (deux flèches partent de la valeur \(20\%\)). Quelles sont les conditions que doit satisfaire une application pour que sa correspondance réciproque soit une fonction, ou mieux une application ?

Pour que la correspondance réciproque soit une fonction, il ne faut pas que deux éléments distincts \(x_1\) et \(x_2\) de l'ensemble de départ aient la même image \(y\) (comme smartphone et alcool qui ont la même tva à \(20\%\)), sans quoi la correspondance inverse aurait deux flèches partant de \(y\), l'une vers \(x_1\) et l'autre vers \(x_2\).

Une application \(f:X\to Y\) est dite injective, ou injection, si deux éléments distincts dans \(X\) ont des images distinctes dans \(Y\) : \begin{equation} \label{eq:injection} \forall (x_1,x_2)\in X\times X\quad (x_1\not=x_2)\Rightarrow (f(x_1)\not=f(x_2)). \end{equation} Dans ce cas on écrit \(f:X\inj Y\).

C'est la contraposée de la proposition logique \((\ref{eq:injection})\) qui est généralement utilisée pour démontrer qu'une application est injective, à savoir \begin{equation} \forall (x_1,x_2)\in X\times X\quad (f(x_1)=f(x_2))\Rightarrow (x_1=x_2). \end{equation} Il est en effet beaucoup plus simple de réaliser des déductions logiques en partant d'une égalité.

Indépendamment de l'étude des correspondances réciproques, l'injectivité est une propriété souvent indispensable pour modéliser certaines contraintes. Pour le routage des informations entre machines sur un même réseau informatique, on exclut la possibilité que deux ordinateurs aient la même adresse IP. On peut décliner cet exemple à l'envi : deux personnes différentes ont des numéros de sécurité sociale différents, deux smartphones ont des numéros d'appel différents, etc.

À gauche une application injective, à droite non.

Soit \(X\) et \(Y\) deux ensembles tels que \(X\subseteq Y\). L'application \(f:X\to Y\) définie par \(f(x):=x\) est une injection appelée injection canonique. Si \(Y=X\), cette application est dite identité (ou identique) de \(X\) et on la note \(\text{Id}_X\).

La correspondance réciproque \(f^{-1}\) d'une injection \(f\) est donc une fonction. Si elle est définie en \(y\in Y\), autrement dit s'il existe \(x\in X\) tel que \(f^{-1}(\{y\})=\{x\}\), alors \(x\) est l'image de \(y\) par \(f^{-1}\) et on la note \(f^{-1}(y)\).

Si l'on veut que cette fonction réciproque soit également une application, il faut que tous les éléments de l'ensemble d'arrivée soient atteints par une flèche de manière à ce que tous les éléments de l'ensemble \(Y\) aient une image pour la correspondance réciproque.

Soit \(f:X\to Y\) une application.

Exprimer qu'une application n'est pas injective en calculant la négation de la proposition \((\ref{eq:injection})\).

L'application qui associe au nom d'une personne ses initiales est-elle injective ?

Surjections

Une application \(f:X\to Y\) est dite surjective, ou appelée surjection, si tout élément \(y\in Y\) admet (au moins) un antécédent : \begin{equation} \label{eq:surjection} \forall y\in Y\ \ \exists x\in X\quad y=f(x). \end{equation} Dans ce cas on écrit \(f:X\surj Y\).

Cette propriété peut être satisfaite sans que l'application soit injective, tout élément de l'ensemble d'arrivée peut donc avoir plusieurs antécédents. C'est le cas de l'application à gauche dans la figure ci-dessous, elle est surjective mais pas injective. Celle de droite n'est ni injective ni surjective.

À gauche une application surjective, à droite non. Aucune n'est injective.

Démontrez qu'une application \(f:X\to Y\) est surjective si et seulement si l'image de cette application est égale à l'ensemble d'arrivée : \(\text{Im}(f)=Y\).

Bijections

Une application \(f:X\to Y\) est dit bijective, ou appelée bijection, si elle est injective et surjective. Dans ce cas on écrit \(f:X\bij Y\). L'ensemble des bijections de \(X\) dans \(X\) est noté \(S(X)\).

On aurait tout aussi bien pu donner la définition suivante : une application \(f\) est bijective si et seulement si sa correspondance réciproque \(f^{-1}\) est une application.

Une bijection associe de manière unique chaque élément d'un ensemble à un autre et réciproquement. Si les ensembles de départ et d'arrivée sont, par exemple, constitués respectivement par des étudiant⋅e⋅s de sciences et de lettres, disposer d'une bijection revient à créer des couples monogames où chacun⋅e a exactement un⋅e petit⋅e ami⋅e :

Diagramme sagittal d'une application bijective.

Les trois notions, injection, surjection et bijection sont incontournables et omniprésentes en mathématiques et en informatique. Ces objets servent non seulement à la modélisation mais également à compter. L'existence d'une solution à une équation du type \(f(x)=y\) d'inconnue \(x\) est liée à la surjectivité de \(f\) et l'unicité d'une solution à l'injectivité de \(f\). Parfois, certains auteurs parlent de fonctions injectives ou de fonctions surjective, sans qu'elles soit nécessairement des applications, ils font alors référence à la restriction de la fonction à son domaine de définition.

Avant même d'avoir défini ce qu'est un ensemble fini* la compréhension intuitive du concept est suffisante ici., il semble évident que si les ensembles de départ et d'arrivée sont finis et en bijection, ils ont le même nombre d'éléments. C'est généralement en établissant une bijection d'un ensemble \(X\) avec un ensemble \(Y\) dont on connaît le cardinal que l'on peut dénombrer les éléments de \(X\). Dans le même ordre d'idées et intuitivement, disposer d'une injection (resp. une surjection) entre un ensemble \(X\) et un ensemble \(Y\) impose que l'ensemble \(Y\) est plus grand que \(X\) (resp. plus petit que \(X\)).

Soit \(X\) et \(Y\) deux ensembles. Démontrez que les deux assertions suivantes sont équivalentes 

Il existe une injection de \(X\) dans \(Y\) ;
Il existe une surjection de \(Y\) dans \(X\).

Un premier résultat important sur les bijections est lié à la composition des applications.

La composée de deux applications injectives (resp. surjective, bijective) est injective (resp. surjective, bijective).

Notons \(f:X\to Y\) et \(g:Y\to Z\) ces applications. Dans une premier temps, supposons que \(f\) et \(g\) soient injectives. Soit \(x_1\) et \(x_2\) deux éléments de \(X\) tels que \(g\circ f(x_1)=g\circ f(x_2)\). On a donc \(g(f(x_1))=g(f(x_2))\) ce qui entraîne que \(f(x_1)=f(x_2)\) puisque \(g\) est injective puis que \(x_1=x_2\) puisque \(f\) est injective. Autrement dit \(g\circ f\) est injective.

Supposons à présent que \(f\) et \(g\) soient surjectives. Soit \(z\in Z\), il nous faut montrer qu'il admet un antécédent \(x\in X\) par \(g\circ f\), autrement dit qu'il existe un élément \(x\in X\) tel que \(z=g\circ f(x)\). Comme \(g\) est surjective, on sait que \(z\) admet un antécédent \(y\) par \(g\), c'est-à-dire tel que \(z=g(y)\), mais \(f\) étant surjective également, \(y\) admet lui aussi un antécédent \(x\in X\) pour \(f\), autrement dit \(y=f(x)\). Par conséquent, on a \(z=g(y)=g(f(x))=g\circ f(x)\) et \(g\circ f\) est donc surjective.

Soit \(f:X\to Y\) et \(g:Y\to Z\) deux applications. Montrez que si \(g\circ f\) est injective alors \(f\) est nécessairement injective et que si \(g\circ f\) est surjective alors \(g\) est nécessairement surjective.

Notons \(f:X\to Y\) et \(g:Y\to Z\) ces applications. Supposons que \(g\circ f\) soit injective. Alors pour tout \((x,x')\in X^2\) tel que \(x\not=x'\), on a \(g(f(x))\not= g((f(x'))\) ce qui impose que \(f(x)\not = f(x')\) c'est-à-dire que \(f\) soit injective. Supposons que \(g\circ f\) soit surjective. Alors pour tout \(z\in Z\), il existe \(x\in X\) tel que \(g(f(x))=z\), donc \(z\) admet au moins \(f(x)\) comme antécédent par \(g\) qui est par conséquent surjective.

Une application \(f:X\to Y\) est bijective si et seulement s'il existe une application \(g:Y\to X\) telle que \begin{equation} \label{eq:gof} g\circ f = \text{Id}_X\ \ \text{et}\ \ f\circ g = \text{Id}_Y. \end{equation} Dans ce cas, l'application \(g\) est unique, il s'agit de l'application réciproque \(f^{-1}\) de \(f\) appelée bijection réciproque.

S'il existe \(g:Y\to X\) qui satisfait \((\ref{eq:gof})\), alors d'après la proposition précédente, \(f\) est surjective comme \(\Id_Y\) et elle est injective comme \(\Id_X\) donc bijective. Symétriquement \(g\) est bijective. D'autre part, si \(f:X\to Y\) est bijective, alors il existe une application \(g:Y\to X\) qui satisfait \((\ref{eq:gof})\), c'est l'application qui a tout élément de \(Y\) associe son unique antécédent par \(f\). On conclut avec l'unicité, considérons deux applications \(g_1\) et \(g_2\) qui satisfont \((\ref{eq:gof})\), alors \begin{align*} g_1\circ f\circ g_2&=\Id_X\circ g_2=g_2\\ g_1\circ f\circ g_2&=g_1\circ \Id_Y=g_1 \end{align*} Et on en déduit que \(g_1=g_2\).

Soit \(f:X\to X\) une application. On peut donc composer \(f\) avec elle même puisque les ensembles de départ et d'arrivée sont confondus. Par convention, on note \(f^n:=f\circ f^{n-1}\) avec \(f^0:=\text{Id}_X\). L'application \(f^n\) est appelée \(n\)-ème itérée de \(f\).

Une application bijective \(f:X\to X\) telle que \(f^2=\text{Id}_X\) est appelée involution ou dite involutive, autrement dit elle est sa propre bijection réciproque. Par exemple l'application \(f:\R^*\to\R^*\) définie par \(x\mapsto\frac{1}{x}\).

Une application \(f:X\to X\) telle que \(f^2=f\) est dite idempotente. Par exemple la valeur absolue dans \(\R\), en effet \(|\!|x|\!|=|x|\).

Soit \(f:X\to Y\) et \(g:Y\to Z\) deux bijections. Démontrez que \begin{equation} \left(g\circ f\right)^{-1} = f^{-1}\circ g^{-1}. \end{equation} Généralisez à la composition de \(n\) applications \(f_1,\,f_2,\ldots,f_n\) où pour tout \(i\in\{1,2,\ldots,n\}\), \(f_i:X_i\to Y_i\) avec \(Y_i=X_{i+1}\) : \begin{equation} \left(f_n\circ f_{n-1}\circ\cdots\circ f_{2}\circ f_1\right)^{-1} = f_1^{-1}\circ f_2^{-1}\circ\cdots\circ f_{n-1}^{-1}\circ f_{n}^{-1}. \end{equation}

Revenons aux images directes et réciproques dans le cas où la correspondance est une fonction \(f:X\to Y\). Alors l'égalité \((\ref{eq:imdir})\) devient :

\begin{equation} f(A):=\{y\in Y\mid \exists x\in A\ \ y=f(x)\}. \end{equation} et on a \begin{equation} f^{-1}(B):=\{x\in X\mid f(x)\in B\}. \end{equation}

On rappelle que \({\mathscr P}(X)\) désigne l'ensemble des parties d'un ensemble \(X\). Soit \({\color{#F88}A:=\{g,b,e\}}\in{\mathscr P}(X)\) et \({\color{#88F}B:=\{0,7,8\}}\in{\mathscr P}(Y)\) pour l'application \(f:X\to Y\) définie par le diagramme sagittal ci-dessous. On a \(f({\color{#F88}A})=\{5,1\}\) et \(f^{-1}({\color{#88F}B})=\{a,c,d\}\).

Diagramme sagittal d'une application \(f:X\to Y.\) L'ensemble \(\color{#F88}A\) est une partie de \(X\) et l'ensemble \(\color{#88F}B\) une partie de \(Y.\)

Avec la fonction définie par le diagramme sagittal de la figure 8, calculez

\(f(X)\),
\(f^{-1}(\{0,-2\})\),
\(f^{-1}(f(\{e,c\}))\),
\(f(f^{-1}(\{5,8\}))\),
\(f^{-1}(\varnothing)\).

Attention à ne pas confondre \(f(\{x\})\) avec \(f(x)\). Par exemple, dans le diagramme de la figure ci-dessus, on a \(f(\{c\})=\{7\}\) et \(f(c)=7.\) Ici, \(f(\{c\})\) désigne l’image directe de l’ensemble \(\{c\}\) (toujours définie, éventuellement vide) par la correspondance \(f\), tandis que \(f(c)\) est l’unique élément contenu dans ce singleton, notation qui n’a de sens que si \(f\) est fonctionnelle.

Dans l'autre sens, il ne faut surtout pas confondre \(f^{-1}(\{y\})\) avec \(f^{-1}(y)\). L'image réciproque \(f^{-1}(\{y\})\) est toujours définie, en revanche \(f^{-1}(y)\) n'a de sens qu'en tant que valeur unique si la correspondance réciproque \(f^{-1}\) de \(f\) est bien une fonction ce qui exige que \(f\) soit injective et que \(y\) appartienne au domaine de définition de \(f^{-1}\).

Cependant, les abus de langage sont légion et il n'est pas rare de lire \(f^{-1}(y)\) au lieu de \(f^{-1}(\{y\})\) quand bien même la fonction n'est pas injective. Tout ceci est sans conséquence pour un mathématicien averti, néanmoins ces confusions, tolérées dans l'argot mathématique, ne le sont plus dans les langages informatiques, les erreurs de type sont détectées à la compilation, sauf conversions de type autorisées.

De la même manière que l'on transforme facilement une fonction \(f:X\to Y\) en application en remplaçant son ensemble de départ \(X\) par le domaine de définition \(\text{Def}(f)\), on transforme une application quelconque en surjection en remplaçant son ensemble d'arrivée \(Y\) par son image \(\text{Im}(f)\) (voir exercice).

Soit \(f:X\to X\) une application. On dit qu'une partie \(A\subseteq X\) est stable par \(f\) si elle vérifie \(f(A)\subseteq A\) et invariante par \(f\) si on a l'égalité \(f(A)=A\). Si \(x\in X\) est tel que \(f(x)=x\), on dit que c'est un point fixe de \(X\) par \(f\).

Soit \(X\) et \(Y\) deux ensembles et \(f\) et \(g\) deux applications de \(X\) dans \(Y\). Tout \(x_0\in X\) tel que \(f(x_0)=g(x_0)\) est appelé solution de l'équation \(f(x)=g(x)\) d'inconnue \(x\).

C'est principalement quand les ensembles sont munis d'opérations algébriques que l'on étudie des équations, par exemple l'addition et la multiplication dans \(\R\). Ces opérations permettent de transformer les expressions de ces applications pour déterminer la ou les solutions si elles existent. Par exemple, si on considère l'application \(f:\R^*\to\R\) définie par \(x\mapsto x^{-1}\) et que l'on cherche ses points fixes, on doit résoudre l'équation \begin{equation} \label{eq:equation} \frac{1}{x}=x \end{equation} et la fonction \(g\) de la définition ci-dessus est l'application identité \(x\mapsto x\) de \(\R\) dans \(\R\). Quelques manipulations algébriques légitimées par les propriétés de l'addition et de la multiplication de l'addition dans \(\R\) (les trouver en guise d'exercice) fournissent successivement les identités équivantes suivantes \begin{align*} \left(\frac{1}{x}=x\right) \ \iff\ \left(1=x^2\right)\ \iff\ \left(x^2-1=0\right)\ \iff\ {\color{steelblue}(x+1)(x-1)=0}. \end{align*}

Dans un anneau intègre et a fortiori dans un corps, un produit de facteurs est nul si et seulement si l'un au moins des facteurs est nul, il y a donc deux solutions à cette dernière équation. Ce sont les deux points fixes de l'application \(f\) et l'ensemble des solutions de l'équation \((\ref{eq:equation})\) est le sous-ensemble \(\{-1,1\}\) de \(\R\).

L'intervalle \([0,1]\) de \(\R\) est-il stable/invariant par l'application définie par \(x\mapsto\frac{1}{2}x\) ? Par l'application définie par \(x\mapsto 2x\) ? Par l'application définie par \(x\mapsto 1-x\) ?

Familles, séquences, suites et indexation

Soit \(I\) et \(X\) deux ensembles. On appelle famille d'éléments d'un ensemble \(X\) et d'ensemble d'indexation \(I\), toute application \(x:I\to X\). L'image d'un élément \(i\in I\) est notée \(x_i\) plutôt que \(x(i)\) et l'ensemble image \(x(I)\) de l'application \(x\) définit l'ensemble des éléments de la famille. On note une telle famille \((x_i)_{i\in I}\).

Dans cette définition, rien ne distingue une famille d'une application, si l'on excepte l'usage des lettres \(I\) et \(X\) pour désigner respectivement l'ensemble de départ et d'arrivée en lieu et place des usuels \(X\) et \(Y\). Il s'agit ici de formaliser l'écriture mathématique indicielle \(x_i\) pour désigner un élément d'un ensemble \(X\) que l'on note \(x_i\) au lieu de \(x(i)\).

Nous n'avons pas encore étudié l'ensemble des entiers naturels \(\N\), mais il est plus pertinent de ne pas différer les définitions suivantes :

On appelle suite d'éléments d'un ensemble \(X,\) toute famille d'éléments de \(X\) indexée par l'ensemble des entiers naturels \(\N.\) Une sous-suite d'une suite \((x_n)_{n\in\N}\) est une suite \((y_n)_{n\in\N}\) telle qu'il existe une application strictement croissante \(\varphi:\N\to\N\) et \(\forall n\in\N\) \(y_n=x_{\varphi(n)}.\)

Plus simplement : on crée une sous-suite en sélectionnant une infinité de termes de la suite de référence.

L'application \(u:\N\to\N\) définie par \(\forall n\in\N\ u_n:=2n+1\) est une suite et l'application \(v:\N\to\N\) définie par \(v_n:=10n+5\) est une sous-suite de la suite \((u_n)_{n\in\N}\)  : \begin{array}{ccccccccccc} i&0&1&2&3&4&5&6&7&8&9&10&11&12&13\\ u_i&1&3&{\color{white}\mathbf5}&7&9&11&13&\color{white}\mathbf{15}&17&19&21&23&\color{white}\mathbf{25}&27\cdots\\ v_i&{\color{white}\mathbf5}&\color{white}\mathbf{15}&\color{white}\mathbf{25}&\color{white}\mathbf{35}&\color{white}\mathbf{45}&\color{white}\mathbf{55}&\cdots\\ \end{array} Prendre l'application croissante \(\varphi(n):=5n+2\).

On appelle système d'éléments d'un ensemble \(X\) toute famille d'éléments de \(X\) dont l'ensemble d'indexation est fini. On appelle séquence ou suite finie d'éléments de \(X\) tout système dont l'ensemble d'indexation est un intervalle \(\llbracket a,b\rrbracket\) de \(\mathbb N\), on la note \((x_i)_{i=a}^{b}\). On appelle sous-séquence d'une séquence \((x_i)_{i=a}^{b}\) toute séquence \((y_j)_{j=c}^{d}\) telle qu'il existe une application strictement croissante \(\varphi:\llbracket c,d\rrbracket\to\llbracket a,b\rrbracket\) vérifiant \(\forall j\in\llbracket c,d\rrbracket,\ y_j=x_{\varphi(j)}\). On appelle facteur d'une séquence toute sous-séquence obtenue à l'aide d'une application strictement croissante dont l'image est un intervalle.

(1) La famille \( (x_i)_{i\in\{\textsf a,\textsf b,\textsf c\}} \) définie par \( x_{\textsf a}=2,\; x_{\textsf b}=5,\; x_{\textsf c}=2 \) est un système.

(2) La famille \( (x_i)_{i=2}^{5}=(7,1,4,1) \) est une séquence d'entiers naturels.

(3) À partir de la séquence \( (x_i)_{i=1}^{5}=(a,b,c,d,e), \) si l'on conserve les indices \(1\), \(3\) et \(5\), on obtient la sous-séquence \( (a,c,e). \)

(4) À partir de la même séquence \( (x_i)_{i=1}^{5}=(a,b,c,d,e), \) si l'on conserve les indices \(2\), \(3\) et \(4\), on obtient le facteur \( (b,c,d). \)

Certains auteurs utilisent des définitions légèrement différentes pour l'un ou l'autre de ces objets. L'existence de plusieurs définitions pour un même objet peut sembler déroutant mais ne pose aucun problème tant que l'on rappelle le sens que l'on donne à cet objet dans un discours mathématique.

Ce qui importe dans ces trois notions est l'ordre dans lequel les éléments de ces trois types de familles sont rangés. C'est explicite pour une séquence ou une suite et pour un système dont l'ensemble d'indexation est totalement ordonné. C'est implicite pour un système dont l'ensemble d'indexation n'est pas ordonné, puisque étant fini, il est en bijection avec \(\{i\in\N\mid 1\leqslant i\leqslant n\}\), ses éléments peuvent donc être ordonnés via cette bijection.

Nous avons vu au chapitre dédié à la logique des prédicats et la théorie zf, comment était construit le produit cartésien de deux ensembles \(X\) et \(Y\) et comment on pouvait le généraliser au produit cartésien de \(q > 2\) ensembles \(X_1,X_2,\ldots,X_q\). On peut désormais procéder autrement avec une construction à la fois plus simple et plus générale. C'est tout simplement le produit fini de la séquence \((X_i)_{i\in I}\) d'ensemble d'indexation \(I:=\{1,2,\ldots,q\}\).

Soit \((X_i)_{i\in I}\) une famille d'ensembles. On appelle ensemble produit de la famille \((X_i)_{i\in I},\) l'ensemble définit ci-dessous et noté \begin{equation} \prod_{i\in I}X_i:=\left\{(x_i)_{i\in I}\mid \forall i\in I\ \ x_i\in X_i\right\}. \end{equation} La fonction \(\text{pr}_i:\prod_{i\in I}X_i\to X_i\) définie par \(\text{pr}_i(x):=x_i\) où \(x:=(x_i)_{i\in I}\) est appelée i-ème projection.

Opérations sur les ensembles

Réunion, intersection

Soit \((X_i)_{i\in I}\) une famille d'ensembles. On montre que les deux ensembles suivant existent : \begin{align*} \bigcup_{i\in I}X_i:=&\{x\mid\exists i\in I\ x\in X_i\} &\bigcap_{i\in I}X_i:=&\{x\mid\forall i\in I\ x\in X_i\}. \end{align*} Il s'agit respectivement de la réunion de la famille \((X_i)_{i\in I}\) et de l'intersection de la famille \((X_i)_{i\in I}\).

Réindexation

Si l'on se donne une application surjective \(\varphi:J\to I\), on peut faire une réindexation de la famille \((X_i)_{i\in I},\) en décrivant ses éléments à l'aide d'un autre ensemble d'indexation \(J\) que \(I.\) Cette opération sert à parcourir les éléments de la famille différemment dans des formules, par exemple : \begin{align*} \bigcup_{i\in I}X_i = \bigcup_{j\in J}X_{\varphi(j)}\quad \bigcap_{i\in I}X_i = \bigcap_{j\in J}X_{\varphi(j)}. \end{align*}

Autres opérations

Soit \((X_i)_{i\in I}\) et \((Y_j)_{j\in J}\) deux familles d'ensembles. On a

\begin{align} \left(\bigcup_{i\in I}X_i\right)\cap\left(\bigcup_{j\in J}Y_j\right) &=\bigcup_{(i,j)\in I\times J}\left(X_i\cap Y_is\right),\\ \left(\bigcap_{i\in I}X_i\right)\cup\left(\bigcap_{j\in J}Y_j\right) &=\bigcap_{(i,j)\in I\times J}\left(X_i\cup Y_is\right).\\ \end{align}

Soit \((X_i)_{i\in I}\) et \((Y_j)_{j\in I}\) deux familles d'ensembles de même ensemble d'indexation \(I\) telles que \(\forall i\in I\ \ X_i\subseteq Y_i\). Alors

\begin{align} \bigcup_{i\in I}X_i&\subseteq \bigcup_{i\in I}Y_i,\\ \bigcap_{i\in I}X_i&\subseteq \bigcap_{i\in I}Y_i. \end{align}

Soit \((X_i)_{i\in I}\) une famille de parties d'un ensemble \(X\). Alors

\begin{align} X\setminus\bigcup_{i\in I}X_i&= \bigcap_{i\in I}(X\setminus X_i),\\ X\setminus\bigcap_{i\in I}X_i&= \bigcup_{i\in I}(X\setminus X_i). \end{align}

Soit \(A\) une partie d'un ensemble \(X\). On appelle fonction indicatrice de \(A\), la fonction \({\mathbb 1}_A:X\to\{0,1\}\) définie par \begin{equation*} {\mathbb 1}_A(x):=\begin{cases}1&\text{si}\ x\in A,\\0&\text{sinon}.\end{cases} \end{equation*}

Images et images réciproques d'une réunion et d'une intersection

Soit \(f:X\to Y\) une application, \((X_i)_{i\in I}\) une famille de parties de l'ensemble \(X\) et \((Y_i)_{i\in I}\) une famille de parties de l'ensemble \(Y\). On a

\begin{align} f\left(\bigcup_{i\in I}X_i\right)&= \bigcup_{i\in I}f(X_i),&\qquad \label{eq:careful}{\color{red}f\left(\bigcap_{i\in I}X_i\right)}&{\color{red}\subseteq \bigcap_{i\in I}f(X_i)}.\\ \notag f^{-1}\left(\bigcup_{i\in I}X_i\right)&=\bigcup_{i\in I}f^{-1}(X_i),&\qquad f^{-1}\left(\bigcap_{i\in I}X_i\right)&= \bigcap_{i\in I}f^{-1}(X_i). \end{align}

L'image réciproque d'une réunion (ou d'une intersection) est donc toujours la réunion (ou l'intersection) des images réciproques. En revanche, si l'image d'une réunion est bien la réunion des images, l'image d'une intersection n'est pas l'intersection des images.

Dans le plan euclidien, tracez les deux demi-droites \(A\) et \(B\) définies par \begin{equation} A:=\{(x,y)\in{\R}\times {\R}\mid x\geqslant 0\ \ y=1\},\quad B:=\{(x,y)\in{\R}\times {\R}\mid x\leqslant 0\ \ y=0\}. \end{equation} Montrez que \(A\cap B=\varnothing\). Considérons l'application \(f:{\R}\times {\R}\to {\R}\times {\R}\) définie par \(f(x,y):=(x,0)\). Calculez \(f(A)\cap f(B)\). Quelle propriété une application \(f\) devrait satisfaire pour que l'inclusion en \((\ref{eq:careful})\) soit une égalité ?

Partition d'un ensemble

Étudier un ensemble \(X\) en le découpant en parties cohérentes est très utile. On peut par exemple partitionner la population mondiale selon les pays, partitionner les instruments de musique selon qu'ils sont à vent, à corde ou à percussion, etc. Les trois propriétés mathématiques exigées pour ce découpage sont très naturelles : les parties ne doivent pas être vides, deux parties différentes ne doivent pas contenir d'éléments communs et la réunion de toutes ces parties est l'ensemble \(X\) tout entier :

On appelle partition d'un ensemble \(X,\) toute famille \((X_i)_{i\in I}\) de parties de \(X\) qui satisfait les trois conditions suivantes :

\(\forall i\in I\quad X_i\neq\varnothing\),
\(\forall (i,j)\in I\times I\quad (i\neq j)\Rightarrow (X_i\cap X_j=\varnothing)\),
\(\displaystyle\bigsqcup_{i\in I}X_i=X\).

Les parties \(X_i\) sont appelées les classes de la partition.

En anticipant sur la section suivante, une partition d'un ensemble \(X\) est intimement liée à une relation d'équivalence sur \(X\). Si \((X_i)_{i\in I}\) est une partition de \(X\), on vérifie aisément que la relation \(\rel\) sur \(X\) définie par \[x\rel y\iff\exists i\in I\ \ (x\in X_i) \wedge (y\in X_i)\] est une relation d'équivalence. Les classes de \(X\) pour cette relation sont évidemment les \(X_i\), d'où la terminologie dans la définition. Réciproquement, si on a une relation d'équivalence \(\rel\) définie sur un ensemble \(X,\) les classes d'équivalences forment une partition de \(X\).

Une famille d'ensembles \((X_i)_{i\in I}\) dont la réunion contient un ensemble \(X\) s'appelle un recouvrement de \(X\) (à la manière des tuiles d'un toit qui le recouvrent et se chevauchent par endroit). Une partition est donc un cas particulier de recouvrement.

Relations binaires sur un ensemble

Définition et propriétés remarquables

Comme nous l'avions annoncé dans la première section, une relation binaire sur un ensemble \(X\) est tout simplement une relation binaire qui met en relation des éléments d'un même ensemble \(X\). Ce modèle est si versatile et fécond, qu'il a engendré à lui seul une théorie, la théorie des graphes. Cette théorie connaît des développements permanents, elle est enseignée dans toutes les formations d'informatique et à tous niveaux. C'est l'un des modèles les plus utisés dans cette discipline scientifique, il est donc très important de le comprendre et le maîtriser. Son rôle universel justifie d'en donner une définition spécifique, même s'il s'agit d'un cas particulier de la définition d'une relation \(q\)-aire.

On appelle relation binaire sur un ensemble \(X,\) tout prédicat \(\rel(x,y)\) à deux variables dans l'ensemble \(X.\) L'ensemble \(\{(x,y)\in X^2\mid \rel(x,y)\}\) est appelé le graphe de la relation binaire \(\rel\).

On rappelle que l'on note souvent une relation binaire de manière infixe, i.e. \(x{\rel}y\) au lieu de \(\rel(x,y)\). Les relations binaires ne sont que des cas particuliers de correspondances, on les représente également par leurs diagrammes sagittaux, en se contentant cette fois des flèches qui relient les éléments entre eux, autrement dit du graphe. Le schéma de la patate pour représenter l'ensemble de référence \(X\) devient superflu. Un couple \((x,x)\) dans ce diagramme est alors représenté par une boucle.

Par exemple :

Graphe d'une relation binaire sur l'ensemble \(X:=\{a,b,c,d,e,f,g,h,i\}\).

Décrivez en extension le graphe \(\color{#88F}G\) de la relation binaire décrite dans le diagramme sagittal ci-dessus.

C'est l'ensemble \[G:=\{(a,b),(a,c),(b,b),(b,e),(d,d),(e,f),(f,e),(g,g),(g,h),(h,g),(i,i)\}.\]

Comme nous l'avions déjà noté dans la section consacrée aux relations \(q\)-aires générales, une relation définit un graphe et réciproquement, ce sont deux façons équivalentes de considérer le même concept mathématique. Dans le cadre de la théorie des graphes, on préfère définir la relation a posteriori et mettre l'accent sur le graphe, d'où la définition suivante employée dans ce cadre :

On appelle graphe orienté, tout couple \(G:=(X,U)\) où \(X\) est un ensemble dont les éléments sont appelés sommets de \(G\) et \(U\subseteq X\times X\) dont les couples sont appelés arcs de \(G\).

Si \((x,y)\) est un arc du graphe, les sommets \(x\) et \(y\) sont dits adjacents, où \(y\) est le successeur de \(x\) et \(x\) prédécesseur de \(y\). Un chemin est une suite de sommets reliés par un arc, un circuit est un chemin qui revient à son sommet initial. Un graphe est dit cyclique ou acyclique selon qu'il contient ou non des circuits.

Il faut noter dans cette définition que \(G\) ne désigne plus l'ensemble des couples définis sur un produit cartésien, rôle dévolu à \(U\), mais le couple constitué de l'ensemble des sommets \(X\) et de l'ensemble des arcs \(U\). Le graphe est dit fini ou infini suivant la cardinalité de l'ensemble de ses sommets.

La relation \(\rel\) associée au graphe \(G\) au sens de cette définition est alors caractérisée par la proposition suivante : \begin{equation} \forall (x,y)\in X^2\quad x{\rel}y\ssi (x,y)\in U. \end{equation} Les relations binaires, et par conséquent les graphes orientés, peuvent posséder des propriétés remarquables :

Soit \(\rel\) une relation binaire définie sur un ensemble \(X\). On définit les propriétés suivantes :

Réflexivité : \(\forall x\in X\quad x{\rel}x\) ;
Symétrie : \(\forall (x,y)\in X^2\quad x{\rel}y\Rightarrow y{\rel}x\) ;
Transitivité : \(\forall (x,y,z)\in X³\quad(x{\rel}y\ \wedge\ y{\rel}z)\Rightarrow x{\rel}z\).
Antiréflexivité : \(\forall x\in X\quad\neg (x{\rel}x)\) ;
Antisymétrie : \(\forall (x,y)\in X^2\quad(x{\rel}y\ \wedge\ y{\rel}x)\Rightarrow x = y\) ;
Asymétrie : \(\forall (x,y)\in X^2\quad x{\rel}y\ \Rightarrow\ \neg (y{\rel}x)\) ;
Antitransitivité : \(\forall (x,y,z)\in X^3\quad(x{\rel}y\ \wedge\ y{\rel}z)\ \then \neg (x{\rel}z)\).

On parlera donc de relation réflexive ou de graphe réflexif, de relation symétrique ou de graphe symétrique, etc.

L'asymétrie est plus contraignante que l'antisymétrie, elle est parfois qualifiée d'antisymétrie forte (par opposition l'antisymétrie est alors qualifiée d'antisymétrie faible). Dans un graphe asymétrique, il ne peut y avoir de boucle \((x,x)\) alors que c'est possible dans un graphe antisymétrique.

Il faut remarquer que les propriétés 4, 5 et 7 ne sont pas les négations des propriétés 1, 2 et 3 respectivement. Par exemple, la négation de la réflexivité s'écrit : \begin{equation*} \exists x\in X\ \ \neg (x{\rel}x). \end{equation*} Autrement dit, il suffit d'un unique élément dans \(X\) qui n'est pas en relation avec lui-même pour que la propriété de réflexivité ne soit pas satisfaite, quand bien même tous les autres éléments de \(X\) sont en relation avec eux-mêmes. L'antiréflexivité est bien plus contraignante, et le préfixe anti est là pour le signifier, une relation antiréflexive impose qu'aucun élément ne soit en relation avec lui-même. Similairement, une relation binaire peut ne pas être symétrique (resp. transitive) sans pour autant être antisymétrique (resp. antitransitive).

Écrivez la négation logique de chacune des propriétés 2 à 7.

Quelles propriétés sont satisfaites par la relation binaire définie par le diagramme sagittal précédent ?

Pour chacune des propriétés 1, 2 et 3, trouvez un exemple de relation binaire sur un ensemble à deux éléments, qui satisfait :

Une seule des trois propriétés,
Deux des trois propriétés,
Les trois propriétés.

et dessiner son graphe.

Faites de même avec une relation sur un ensemble à trois éléments. Listez toutes les relations binaires sur une ensemble à 1 élement. Quelles propriétés satisfont ces relations ?

Il est courant quand on dispose d'une relation binaire \(\rel\) sur un ensemble de considérer sa fermeture transitive. L'idée est simple et naturelle, l'expression les amis de mes amis sont mes amis l'illustre parfaitement. On construit à partir d'une relation \(\rel\) sa fermeture transitive \(\overline{\rel}\) en rajoutant* La construction effective de cette nouvelle relation nécessite d'élaborer un algorithme. au graphe de la relation \(\rel\) les couples \((x,y)\) nécessaires pour que cette nouvelle relation soit transitive.

La définition suivante nous sera utile dans les chapitres à venir, lorsque nous munirons les ensembles de nouveaux outils. Elle dit simplement qu'une application est compatible avec une relation binaire si deux éléments en relation ont la même image : le prix du billet de cinéma \(c(x)\) est le même pour deux personnes \(x\) du même âge (la relation).

On dit qu'une application \(f:X\to Y\) est compatible avec une relation binaire \(\rel\) sur \(X\) si et seulement si \begin{equation} \label{eq:appcompatiblerel} \forall(x,y)\in X\quad x{\rel}y\Rightarrow f(x)=f(y). \end{equation}

Relations d'équivalence

La notion de relation d'équivalence est déjà parfaitement intégrée par tous et en dehors de tout contexte mathématique. Dans les phrases Il faut utiliser un tournevis, Mettez un chapeau !, J'achèterai une twingo, les termes tournevis, chapeau et twingo ne font pas référence à un tournevis, un chapeau ou une voiture en particulier, mais à une classe dont les éléments ont des caractéristiques communes. Le formalisme mathématique tente de saisir l'essence de ce concept :

Une relation binaire \(\rel\) définie sur un ensemble \(X,\) à la fois réflexive, symétrique et transitive est appelée relation d'équivalence sur \(X\). L'ensemble \begin{equation} \overline{x}:=\{y\in X\mid x{\rel}y\}. \end{equation} est la classe d'équivalence de \(x\) pour \(\rel\) et tout élément de \(\overline{x}\) est un représentant de cette classe. L'ensemble des classes d'équivalence est appelé ensemble quotient de \(X\) par \(\rel\), on le note \(X/{\rel}\).

On peut définir aisément une relation sur l'ensemble des voitures, on dira par exemple que deux voitures sont en relation s'il s'agit du même modèle. La relation est évidemment réflexive, une voiture est bien du même modèle qu'elle même. La relation est également symétrique, si la voiture \(x\) est du même modèle que la voiture \(y\), la voiture \(y\) est bien du même modèle que \(x\). Elle est aussi transitive, puisque si la voiture \(x\) est du même modèle que la voiture \(y\), qui elle même est du même modèle que la voiture \(z\), alors la voiture \(x\) est du même modèle que la voiture \(z\). Le lecteur perspicace aura deviné qu'en définissant une relation binaire à partir de caractéristiques communes entre objets, elle sera toujours une relation d'équivalence.

Le couple (classe d'équivalence, représentant) est à la théorie des ensembles ce que le couple (classe, instance) est à la programmation orientée objet. L'Interceptor de Mad Max est un représentant (instance) de la classe des Ford Falcon XB.

La terminologie ensemble quotient et le symbole de division sont légitimés par le fait que l'on a divisé l'ensemble \(X\) en classes suivant la relation \(\rel.\) Le théorème suivant montre que partitions et relations d'équivalence sur un ensemble sont deux concepts étroitements liés. Quand plusieurs relations sont en jeu, la classe d'équivalence d'un élément \(x\in X\) pour une relation \(\rel\) est notée \(x/\!_{\rel}\) pour éviter les confusions.

Démontrez que si \(\rel\) est une relation d'équivalence sur un ensemble \(X\) et \(x\in X\), alors \begin{equation} \label{eq:classeeqrep} x{\rel y}\ \Leftrightarrow\ \overline{x} = \overline{y}. \end{equation}

Dans le sens direct, soit \((x,y)\in X^2\) et supposons que \(x\rel y\). Soit \(a\in \overline{x}\), donc \(a\rel x\) et par transitivité de \(\rel\), on en déduit que \(a\rel y\), soit \(a\in\overline{y}\), ce qui prouve que \(\overline{x}\subseteq\overline{y}\). Le raisonnement est symétrique pour démontrer que \(\overline{y}\subseteq\overline{x}\) et l'axiome d'extension permet de conclure. Pour l'implication réciproque, si \(\overline{x} = \overline{y}\) alors \(x\in\overline{y}\then x\rel y.\)

Soit \(X\) un ensemble. Si \(\rel\) est une relation d'équivalence définie sur \(X\) alors l'ensemble quotient \(X/{\rel}\) est une partition de \(X\). Réciproquement, si \(P\subseteq{\mathscr P}(X)\) est une partition de \(X\), alors il existe une unique relation d'équivalence \(\rel\) sur \(X\) telle que \(X/{\rel}=P\). Elle est définie par \begin{equation} x{\rel}y\;\iff\;\exists C\in P\ \ (x\in C)\ \wedge\ (y\in C). \end{equation}

Démontrez ce théorème.

L'application \(\varphi:X\to X/{\rel}\) définie par \(\varphi(x):=\overline{x}\) qui, à un élément \(x\) de \(X\), associe sa classe d'équivalence \(\overline{x}\) est évidemment surjective puisque l'ensemble d'arrivée est constitué de ses images. Elle est appelée surjection canonique.

L'ensemble quotient \(X/{\rel}\) est une partie de quel ensemble ?

C'est un sous-ensemble de \({\mathscr P}(X)\).

Que doit satisfaire une application \(f:X\to Y\) pour être compatible avec une relation d'équivalence \(\rel\) ?

Soit \(f:X\to Y\) une application, \(\rel\) une relation d'équivalence définie sur \(X\) et \(\varphi:X\to X/{\rel}\) la surjection canonique. L'application \(f\) est compatible avec \(\rel\) si et seulement s'il existe une application \({\color{#88F}g}:X/{\rel}\to Y\) telle que \(f=g\circ\varphi\) : \begin{equation}%\require{AMScd} \begin{CD} X @>{f}>> Y\\ @V{\varphi}VV {\color{#88F}\nearrow g} \\ X/{\rel} \end{CD} \end{equation} Dans ce cas \(g\) est unique, on dit qu'elle est déduite de \(f\) par passage au quotient \(X/{\rel}.\)

Montrons que la condition est nécessaire. Par hypothèse pour tout couple \(x,y)\) tel que \(x{\rel}y\) on a \(f(x)=f(y)\), autrement dit la correspondance \(g\) d'ensemble de départ \(X/{\rel}\) et d'arrivée \(Y\) qui associe \(f(x)\) à la classe \(\overline{x}\) est une application puisque \(f(x)\) ne dépend pas du représentant \(x\) de la classe, on peut donc écrire \(g(\overline{x}):=f(x)\).

Réciproquement supposons qu'il existe une application \(g:X/{\rel}\rightarrow Y\) telle que \(f=g\circ\varphi\). Montrons que si \(x{\rel}y\) alors \(f(x)=f(y)\). On a \begin{align*} f(x)&=g\circ\varphi(x)\\ &=g(\overline{x})\\ &=g(\overline{y})\quad\text{car}\ x{\rel}y\Rightarrow\overline{x}=\overline{y}\\ &=g\circ\varphi(y)\\ &=f(y) \end{align*}

Malgré les apparences, ce théorème n'a rien de bien compliqué. On a fait des paquets de tous les individus qui ont la même image par \(f\), et l'application \(g\) n'est rien d'autre qu'une version de \(f\) définie sur ces paquets.

Dans la section consacrée aux fonctions et aux applications, nous avons étudié comment transformer une fonction \(f:X\to Y\) quelconque en application, il suffit de remplacer l'ensemble de départ par le domaine de définition \(\text{Def}(f)\) de la fonction, puis comment transformer cette application en surjection, il suffit de remplacer l'ensemble d'arrivée par l'image \(f(X)\) de \(f\). Mais comment transformer cette dernière application en injection afin d'obtenir une bijection ?

L'étude que nous venons de mener nous donne la solution, il suffit de regrouper tous les éléments qui ont la même image par \(f\), autrement dit de remplacer les éléments de l'ensemble de départ par leur classe d'équivalence pour la relation d'équivalence \({\color{#88F}x{\rel}y}\iff f(x)=f(y)\) (par construction \(f\) est compatible avec \(\rel\)). Le diagramme sagittal ci-dessous explicite cette construction. Les éléments \(h\) et \(i\) sont écartés de l'ensemble de départ \(X\) pour faire de \(f\) une fonction et \(3\) et \(6\) sont écartés de l'ensemble d'arrivée \(Y\) pour faire de \(f\) une surjection. On obtient les \(3\) classes d'équivalence \(\color{#88F}\{b,g,e\}\), \(\color{#88F}\{c\}\) et \(\color{#88F}\{a,d\}.\)

Décomposition canonique d'une application \(f:X\to Y.\) Les éléments \(y\in Y\) tels que \(y\not\in f(X)\) sont grisés.

L'application bijective ainsi construite est notée \({\color{#FD4}\overline{f}}\) et appelée décomposition canonique de \(f\). Les applications qui relient les quatre ensembles \(X\), \(Y\), \(\color{#88F}{X/\rel}\) et \(f(X)\) sont souvent représentées dans un diagramme appelé diagramme commutatif :

\begin{equation}%\require{AMScd} \begin{CD} X @>{f}>> Y\\ @V{\varphi}VV @AAjA \\ {\color{#88F}X/{\rel}} @>>{\color{#FD4}\overline{f}}> f(X) \end{CD} \end{equation}

Diagramme commutatif de la décomposition canonique d'une application \(f:X\to Y.\)

Dans un diagramme commutatif, plusieurs chemins peuvent relier deux ensembles et les différentes compositions d'applications suivant ces chemins différents sont égales. Ici deux chemins relient \(X\) à \(Y\), le premier est constitué d'une seule flèche, celle étiquetée \(f\), et l'autre est constitué de trois flèches étiquetées \(\varphi\), \(\color{#FD4}\overline{f}\) et \(j\) l'injection canonique. On a donc \(f=j\circ{\color{#FD4}\overline{f}}\circ \varphi.\)

Relations d'ordre

Définition

Trier des objets est une opération très courante, même pour un être humain, mais de toutes les opérations réalisées par les ordinateurs, c'est celle qui occupe de loin la plus grande part du temps cpu mondial. Trier des objets n'est possible que si l'on dispose d'un critère pour les comparer.

Une relation binaire \(\preccurlyeq\) définie sur un ensemble \(X\) qui est à la fois réflexive, antisymétrique et transitive est appelée relation d'ordre sur \(X\). Le couple \((X,\preccurlyeq)\) constitué d'un ensemble \(X\) muni d'une relation d'ordre \(\preccurlyeq\) est appelé ensemble ordonné.

Soit \(x\) et \(y\) deux éléments d'un ensemble ordonné \((X,\preccurlyeq)\). Si \(x\preccurlyeq y\), on dit que \(x\) est inférieur ou égal à \(y\) pour la relation \(\preccurlyeq\). Si \((x\preccurlyeq y)\vee(y\preccurlyeq x),\) on dit que \(x\) et \(y\) sont comparables pour la relation \(\preccurlyeq\). Si tous les éléments de \(X\) sont comparables deux-à-deux, la relation d'ordre \(\preccurlyeq\) est dite totale, sinon partielle.

Si \(\preccurlyeq\) est une relation d'ordre, la relation \(\succcurlyeq\) définie par \(x\succcurlyeq y\iff y\preccurlyeq x\) est appelée ordre opposé de \(\preccurlyeq\), et si \(x\succcurlyeq y\) on dit que \(x\) est supérieur ou égal à \(y\).

La relation binaire \(\prec\) définie sur \(X\) par \(x\prec y\) si et seulement si \(x\preccurlyeq y\) et \(x\not=y\) est appelée ordre strict associé à \(\preccurlyeq\). On emploie également la terminologie plus petit que/plus grand que pour inférieur/supérieur.

L'ordre strict associé à une relation d'ordre est une relation binaire antiréflexive par construction, ce n'est plus une relation d'ordre. La terminologie mathématique s'avère ici particulièrement maladroite.

De par l'importance de certaines relations d'ordre dans le discours mathématiques, et de l'existence de multiples relations d'ordres définies et utilisées simultanément sur un même ensemble, on leur attribue souvent un symbole et une terminologie spécifiques afin d'éviter toute confusion.

(1) La plus connue est sans conteste la relation d'ordre naturel notée spécifiquement*C'est précisément par analogie avec l'ordre naturel que le symbole générique \(\preccurlyeq \) a été choisi pour représenter une relation d'ordre en général. \(\leq\) ou \(\leqslant\) et définie sur l'ensemble \({\N}\) des entiers naturels. C'est une relation d'ordre total dont l'ordre strict associé est noté \(\lt\). De par son importance, l'ordre naturel sera étudié plus en détail au chapitre suivant.

(2) On vérifie aisément que la relation d'inclusion \(\subseteq\) définie sur l'ensemble \({\mathscr P}(X)\) des parties d'un ensemble \(X\) est une relation d'ordre partiel dont l'ordre strict associé est noté \(\subset\). La terminologie héritée de l'ordre naturel ne prête pas à confusion ici puisqu'il est commun de dire que l'ensemble \(A\) est plus petit que l'ensemble \(B\) plutôt que \(A\) est inclus ou égal à \(B\).

(3) La relation préfixe \(\sqsubseteq\) définie sur l'ensemble des mots sur un alphabet fixé est une relation d'ordre : informellement, un mot \(u\) est un préfixe de \(v\) s'il est au début de \(v,\) par exemple lit est un préfixe de littéral et tout mot est préfixe de lui-même (réflexivité).

Il faut prendre garde au vocabulaire quand on manipule des relations d'ordre différentes définies sur un même ensemble. La relation de divisibilité dans \(\N\) est une relation d'ordre partielle (cf. exercice). Ainsi comme \(4\mid 0\), on peut tout à fait affirmer que \(4\) est plus petit que \(0\) pour la relation de divisibilité \(\mid\), ce qui peut dérouter car l'acception de ces termes est généralement associée à la relation d'ordre naturel \(\leqslant\). On utilisera donc préférablement le nom particulier de chaque relation : ici \(4\) divise \(0\) mais \(4\) est plus grand que \(0.\)

Soit \(a\) et \(b\) deux éléments d'un ensemble totalement ordonné \((X,\preccurlyeq)\) tels que \(a\preccurlyeq b\). On définit les intervalles suivants :

\begin{align*} [a,b]&:=\{x\in X\mid a\preccurlyeq x\ \text{et}\ x\preccurlyeq b\},\\ ]a,b]&:=\{x\in X\mid a\prec x\ \text{et}\ x\preccurlyeq b\},\\ [a,b[&:=\{x\in X\mid a\preccurlyeq x\ \text{et}\ x\prec b\},\\ ]a,b[&:=\{x\in X\mid a\prec x\ \text{et}\ x\prec b\}.\\ \end{align*}

Ces intervalles sont dits respectivement fermé, semi-ouvert à gauche, semi-ouvert à droite et ouvert. On définit également les demi-droites :

\begin{align*} [a,\rg[&:=\{x\in X\mid a\preccurlyeq x\},\\ ]a,\rg[&:=\{x\in X\mid a\prec x\},\\ ]\leftarrow,b]&:=\{x\in X\mid x\preccurlyeq b\},\\ ]\leftarrow,b[&:=\{x\in X\mid x\prec b\}. \end{align*}

Dans le cas particulier où la relation d'ordre est l'ordre naturel sur \(\N\), les simplets crochets sont souvent remplacés par les doubles crochets \(\llbracket\) et \(\rrbracket\).

Démontrez que la relation binaire d'inclusion \(\subseteq\) définie sur l'ensemble \({\mathscr P}(X)\) des parties d'un ensemble \(X\) est une relation d'ordre.

Nous utilisons le symbole \(\subseteq\) pour représenter la relation d'inclusion entre ensembles alors que de nombreux auteurs utilisent encore le symbole \(\subset\). Il s'agit de garder une cohérence entre les notations des différentes relations d'ordre. La propriété de réflexivité d'une relation d'ordre invite à suggérer l'égalité dans la graphie du symbole et à l'enlever pour l'ordre strict associé. C'est le choix qui a été fait pour la relation d'ordre naturel avec les symboles \(\leqslant\) (ou \(\leq\)) pour l'ordre et \(lt\) pour l'ordre strict. Si l'inclusion est représentée par le symbole \(\subset\), comment représenter l'inclusion stricte ? Des solutions ont été fournies par l'introduction d'une multitude de notations plus ou moins baroques : \(\subsetneq\) ou encore \(\subsetneqq\) voire \(\varsubsetneqq\), ce que nous souhaitons éviter par souci de cohérence.

Diagramme de Hasse

La relation d'inclusion définie sur des ensembles est une relation d'ordre partiel. Considérons l'ensemble des parties de l'ensemble \(X:=\{a,b,c\}\) :

\begin{equation} \label{parties3} {\mathscr P}(X)=\big\{\varnothing,\{a\},\{b\},\{c\},\{a,b\},\{a,c\},\{b,c\},X\big\}. \end{equation}

On ne peut pas comparer les parties \(\{a,b\}\) et \(\{c\}\) avec la relation d'inclusion par exemple, aucun des deux n'est inclus dans l'autre. Quand on dispose d'une relation d'ordre sur un ensemble fini comme ici, on représente le graphe de la relation à l'aide d'un diagramme appelé diagramme de Hasse^# Helmut Hasse était un mathématicien allemand spécialiste de l'algèbre. de la relation :

Le diagramme de Hasse d'une relation d'ordre est construit de bas en haut. Si l'on a \(x\preccurlyeq y\), on dessine un arc reliant le sommet \(x\) vers le sommet \(y\) qui est placé au dessus de \(x\). On ne représente aucune des relations que l'on peut déduire par transitivité.

Dans l'exemple ci-dessus, quand \(E\) contient l'ensemble vide \(\varnothing,\) ce dernier est inclus dans toutes les parties de \(X\), mais on ne trace que les trois arcs le reliant aux trois singletons \(\{a\},\) \(\{b\}\) et \(\{c\}\) car les autres arcs peuvent être déduits par transitivité. Ce diagramme permet dans une certaine mesure de visualiser la relation étudiée et mettre en évidence quelques éléments remarquables que nous allons étudier dans la suite.

Cette représentation n'a vraiment d'intérêt que pour une relation d'ordre partiel. En effet si la relation d'ordre est totale, le diagramme est toujours constitué de tronçons verticaux reliant les différents éléments de l'ensemble \(X\). Par exemple pour l'ensemble \(X:=\{0,1,2,3\}\) muni de l'ordre naturel :

Diagramme de Hasse de l'ordre naturel sur l'ensemble des entiers \(\{0,1,2,3\}\).

Éléments remarquables d'un ensemble ordonné

Quand on dispose d'une relation d'ordre \(\preccurlyeq\) sur un ensemble \(X\), certains éléments de l'ensemble peuvent posséder des propriétés remarquables.

Soit \((X,\preccurlyeq)\) un ensemble ordonné et \(A\) une partie de \(X\). Un élément \(m\in X\) tel que \begin{equation} \forall x\in A\ \ m\preccurlyeq x\qquad(\text{resp.}\ \forall x\in A\ \ x\preccurlyeq m) \end{equation} est appelé un minorant (resp. majorant) de \(A\). Le cas échéant, \(A\) est dite minorée (resp. majorée). Une partie à la fois minorée et majorée, est dite bornée.

Une partie \(A\) d'un ensemble ordonné n'admet pas nécessairement de minorant ou de majorant. Par exemple \([\pi,\rg[\) n'admet pas de majorant dans \(\R\) et \(\rrbracket\lf,-8\rrbracket\) n'admet pas de minorant dans \(\Z\).

Soit \((X,\preccurlyeq)\) un ensemble ordonné et \(A\) une partie de \(X.\) Si \(a\) est un minorant (resp. majorant) de \(A\) et \(a\in A\), alors \(a\) est unique. On l'appelle le plus petit élément ou le minimum (resp. le plus grand élément ou maximum) de \(A\) et on le note \(\text{min}\ A\) (resp. \(\text{max}\ A\)).

S'il existe un plus grand minorant (resp. un plus petit majorant) d'une partie \(A\) d'un ensemble ordonné \((X\preccurlyeq)\), il est appelé infimum ou borne inférieure (supremum ou borne supérieure) de \(A\) et on le note \(\text{inf}\,A\) (resp. \(\text{sup}\,A\)).

(1) Quand \(E={\mathscr P}(X)\) dans l'exemple interactif un peu plus haut, le plus petit élément et le plus grand élément de \({\mathscr P}(X)\) pour la relation d'inclusion existent, il s'agit respectivement de \(\text{min}\ {\mathscr P}(X)=\varnothing\) et \(\text{max}\ {\mathscr P}(X)=X\).
(2) L'ensemble des entiers naturels \({\N}\) admet un plus petit élément pour l'ordre naturel, il s'agit de \(0\). En revanche \({\N}\) n'admet pas de plus grand élément par essence, c'est l'une des trois propriétés qui le caractérisent comme nous le verrons au chapitre suivant.

La borne inférieure de \(A\) appartient à \(A\) si et seulement si \(A\) admet un plus petit élément et dans ce cas \(\text{inf}\;A = \text{min}\;A\). De même, la borne supérieure de \(A\) appartient à \(A\) si et seulement si \(A\) admet un plus grand élément et dans ce cas \(\text{sup}\;A = \text{max}\;A\).

Soit \(f:X\to Y\) une application à valeurs dans un ensemble ordonné \((Y,\preccurlyeq)\) et \(A\subseteq X\). On parlera du minimum et du maximum de \(f\) sur \(A\) en lieu et place de \(\text{min}\ f(A)\) et \(\text{max}\ f(A)\), s'ils existent. De même on parlera de la borne inférieure et de la borne supérieure de \(f\) pour \(\text{inf}\ f(A)\) et \(\text{sup}\ f(A)\), s'ils existent. On les note respectivement \begin{equation} \underset{x\in A}{\text{min}}\ f(x),\quad\underset{x\in A}{\text{max}}\ f(x),\quad \underset{x\in\ A}{\text{inf}}\ f(x),\quad\underset{x\in\ A}{\text{sup}}\ f(x). \end{equation}

Nous avons vu qu'un ensemble ordonné n'admet pas nécessairement de plus petit ou de plus grand élément, a fortiori si la relation d'ordre est partielle puisque tous les éléments ne sont pas comparables. Cependant, on peut se demander s'il existe des éléments qui soient plus petits ou plus grands que tous ceux avec qui la comparaison est possible ?

Soit \((X,\preccurlyeq)\) un ensemble ordonné. Un élément \(a\) de \(X\) tel que \begin{equation} \forall x\in X\ \ \ x\preccurlyeq a\Rightarrow x=a\quad (\text{resp.}\ \forall x\in X\ \ \ a\preccurlyeq x\Rightarrow x=a) \end{equation} est appelé un élément minimal (resp. un élément maximal) de \(X\) pour la relation \(\preccurlyeq\).

Si l'on prend cette fois \(E={\mathscr P}(X)\setminus\{\varnothing\}\) dans l'exemple interactif plus haut, il n'y a plus de plus petit élément, en revanche on dispose de \(3\) éléments minimaux : les \(3\) singletons \(\color{#88F}\{a\}\), \(\color{#88F}\{b\}\) et \(\color{#88F}\{c\}\). L'ensemble des éléments maximaux est réduit à \(X\) qui est toujours le plus grand élément. Si l'on retirait \(X\) de \(E,\) il n'y aurait plus de plus grand élément mais \(3\) éléments maximaux, les \(3\) paires \(\{a,b\},\) \(\{a,c\}\) et \(\{b,c\}.\)

Constructions de relations d'ordre

Il existe des moyens conventionnels de définir de nouvelles relations d'ordre à partir d'une ou plusieurs relations d'ordre prédéfinies :

Nous avons déjà vu la relation d'ordre opposé \(\succcurlyeq\) à une relation d'ordre \(\preccurlyeq\).
Quand on restreint une relation d'ordre définie sur un ensemble \(X\) à une partie \(Y\subseteq X\), la relation ainsi créée s'appelle l'ordre induit par l'ordre \(\preccurlyeq\) sur \(Y\).
Si l'on se donne une famille \((X_i,\preccurlyeq_i)_{i\in I}\) d'ensembles ordonnés, la relation \(\preccurlyeq\) définie sur l'ensemble produit \(X:=\prod_{i\in I}X_i\) par
\begin{equation} (x_i)_{i\in I}\preccurlyeq (y_i)_{j\in I}\iff \forall i\in I\ \ x_i\preccurlyeq_i y_i. \end{equation}
est une relation d'ordre appelée l'ordre produit des relations \(\preccurlyeq_i\).
Les relations d'ordre \(\preccurlyeq_i\) peuvent être totales sans que l'ordre produit \(\preccurlyeq\) le soit. Considérons par exemple l'ordre produit sur l'ensemble des couples d'entiers naturels munis chacun de l'ordre naturel : \[(x,y)\preccurlyeq (x',y')\iff (x\leqslant x')\wedge (y\leqslant y').\] Les couples \((1,2)\) et \((2,1)\) ne sont pas comparables. Pour obtenir une relation d'ordre total sur ce produit cartésien il faut fournir un peu plus d'efforts.
Limitons nous au cas fini avec l'ensemble d'indexation \(I:=\llbracket 1,\,n\rrbracket\) où \(n\) est un entier naturel non-nul. On définit une relation binaire \(\preccurlyeq\) entre deux \(n\)-uplets \((x_i)_{i\in I}\) et \((y_i)_{i\in I}\) par \((x_i)_{i\in I}\preccurlyeq (y_i)_{i\in I}\) si et seulement s'il existe un rang \(k\in\llbracket 1,\,n-1\rrbracket\) tel que leurs \(i\)-èmes projections coïncident pour tout \(i\in \llbracket 1,\,k-1\rrbracket\) et que \(x_k\prec_k y_k\) ou que leurs \(i\)-èmes projections sont toutes égales sauf pour \(i=n\) où \(x_n\preccurlyeq_n y_n\). Il s'agit d'une relation d'ordre total appelée ordre lexicographique.

Malgré une définition alambiquée, la relation d'ordre lexicographique est bien connue du lecteur. Si les ensembles \(X_i\) désignent tous le même alphabet latin muni de l'ordre alphabétique, il s'agit de l'ordre du dictionnaire. C'est également l'ordre qui est utilisé pour ranger les nombres réels quand ils sont représentés sous forme décimale.

On définit la relation de divisibilité \(\mid\) sur l'ensemble des entiers naturels \({\N}\) par \[a\mid b\iff \exists c\in {\N}\ \ ac=b.\] Démontrez qu'il s'agit d'une relation d'ordre partiel. Vérifiez que 0 est le plus grand élément pour cette relation. Existe-t-il un plus petit élément ? Si l'on restreint cette relation à l'ensemble \({\N}\setminus\{0,1\}\), existe-t-il toujours un plus petit élément ? Un plus grand élément ? Quels sont alors les éléments minimaux s'il en existe ? Les éléments maximaux s'il en existe ?

Tracez le diagramme de Hasse de la relation de divisibilité restreinte à l'ensemble \(\{1,2,3,\ldots,20\}\).

Écrivez sous forme logique avec quantificateurs la définition de l'ordre lexicographique entre \(n\)-uplets \((x_i)_{i\in I}\) et \((y_i)_{i\in I}\). Démontrez qu'il s'agit bien d'une relation d'ordre et que si les \(n\) relations d'ordre \(\preccurlyeq_i\) sont totales alors l'ordre lexicographique est une relation d'ordre total.

Pour réaliser des algorithmes de tri comparatif, il est nécessaire que la relation d'ordre utilisée pour comparer les objets soit totale.

Démontrez que pour tout couple \((x,y)\in I\times I\) où \(I\) est un intervalle ou une demi-droite, tout élément compris entre \(x\) et \(y\) appartient à l'intervalle \(I\).

Soit \((X,\preccurlyeq_X)\) et \((Y,\preccurlyeq_Y)\) deux ensembles ordonnés et \(f:X\to Y\) une application. L'application \(f\) est dite croissante si et seulement si : \begin{equation} \forall (x,x')\in X^{2}\quad x\preccurlyeq_X x' \Rightarrow f(x)\preccurlyeq_Y f(x'). \end{equation} L'application \(f\) est dite décroissante si et seulement si : \begin{equation} \forall (x,x')\in X^{2}\quad x\preccurlyeq_X x'\Rightarrow f(x)\succcurlyeq_Y f(x'). \end{equation}

La négation de la croissance n'est pas la décroissance : \begin{align*} \neg\left(\forall (x,x')\in X^{2}\ \ (x\preccurlyeq_X x')\Rightarrow (f(x)\preccurlyeq_Y f(x'))\right)\ \equiv\ \exists (x,x')\in X^{2}\ \ (x\preccurlyeq_X x')\wedge (f(x') \prec_{Y} f(x)) \end{align*} Une application peut très bien croître par moment et décroître par d'autres.

Si l'on remplace dans la définition les relations d'ordre \(\preccurlyeq_X\) et \(\preccurlyeq_Y\) par leurs ordres stricts \(\prec_X\) et \(\prec_Y\) on parle d'application strictement croissante et strictement décroissante respectivement. Une application qui est croissante ou décroissante (resp. strictement croissante ou décroissante) est dite application monotone (resp. application strictement monotone).

Démontrez que toute application monotone et injective est strictement monotone. Démontrez que la composition de deux applications monotone est monotone.

Relations de précédence

Dans les systèmes multiprocesseurs multiprogrammés, on modélise le fonctionnement des processus par un ensemble \(\mathscr T\) de tâches à réaliser. Ces tâches sont représentées par des couples \(T=(d,f)\) dont la première projection \(d\) est l'instant où la tâche \(T\) débute son exécution et la seconde projection \(f\) est l'instant où elle finit son exécution. Certaines tâches ne peuvent débuter leur exécution qu'une fois que d'autres tâches ont fini la leur. Ces différentes contraintes temporelles sont modélisées par une relation binaire \(\propto\) définie sur l'ensemble \(\mathscr T\) des tâches à réaliser. Si \(T\) et \(T'\) sont deux tâches, on interprète \(T\propto T'\) par la tâche \(T\) termine son exécution avant que la tâche \(T'=(d',f')\) ne débute la sienne, i.e.

\[d'\geqslant f.\]

On dit alors que la tâche \(T\) précède la tâche \(T'\) ou que la tâche \(T'\) succède la tâche \(T\).

Une relation binaire définie sur un ensemble \(X\) à la fois antiréflexive, antisymétrique et transitive est appelée relation de précédence sur \(X\).

Si deux tâches \(T\) et \(T'\) sont telles que l'exécution de l'une ne nécessite pas l'exécution de l'autre au préalable, i.e. telles que \(\neg (T\propto T')\wedge\neg(T'\propto T)\), on dit que ce sont des tâches parallèles et on écrit \(T\;\Vert\;T',\) sinon elles sont en série. La relation \(\propto\) est antiréflexive, en effet une tâche \(T\) ne peut pas terminer son exécution avant même d'avoir commencé, elle est antisymétrique et bien sûr transitive.

Le graphe d'une relation de précédence est représenté par un diagramme qui omet tous les arcs que l'on peut déduire par transitivité. Deux questions classiques sont étudiées dans les cours de systèmes d'exploitation des formations en informatique :

Trouver un ordonnancement séquentiel de l'ensemble des tâches compatible avec la relation de précédence ;
Trouver un ordonnancement parallèle de l'ensemble des tâches compatible avec la relation de précédence.

Le premier cas correspond à la situation où les différentes tâches sont exécutées par un unique processeur, le deuxième cas si le système alloue plusieurs processeurs pour exécuter des tâches en parallèle. Considérons par exemple la relation de précédence définie sur l'ensemble \({\mathscr T}:=\{T_1,T_2,\ldots,T_9\}\) par la fermeture transitive \(\overline{G}\) du graphe

\begin{align*} G:=\Big\{(T_7,T_4),\ (T_4,T_1),\ &(T_1,T_2),\ (T_2,T_3),\ (T_4,T_5),\\ &(T_5,T_2),\ (T_5,T_6),\ (T_8,T_5),\ (T_8,T_9),\ (T_9,T_6) \Big\}. \end{align*}

Son diagramme de précédence est représenté ci-dessous. Seuls les numéros des tâches sont indiqués :

Diagramme de précédence de la relation \(\propto\) sur un ensemble de tâches.

Pour organiser un séquencement de ces \(9\) tâches, que ce soit de manière séquentielle ou parallèle, il faut bien sûr commencer par des tâches \(T\) qui n'ont aucun arc incident vers le sommet correspondant dans le diagramme, c'est-à-dire telles qu'il n'existe aucune tâche \(T'\) telle que \(T'\propto T\). Il n'y a que les tâches \(\color{#88F}T_7\) et \(\color{#88F}T_8\) qui ne sont précédées par aucune tâche.

Un ordonnancement séquentiel possible (il n'y pas nécessairement unicité) comme solution du premier problème est :

\begin{equation*} {\color{#88F}T_7}\rg T_4\rg {\color{#88F}T_8}\rg T_5\rg T_1\rg T_9\rg T_6\rg T_2\rg T_3. \end{equation*}

Nous verrons au chapitre consacré à la combinatoire qu'une telle solution constitue une permutation de l'ensemble \(\{1,2,\ldots,9\}\). L'ordonnancement parallèle solution du second problème est :

\begin{equation*} ({\color{#88F}T_7}\;\Vert\;{\color{#88F}T_8})\rg (T_4\;\Vert\;T_9)\rg (T_5\;\Vert\;T_1)\rg (T_2\;\Vert\;T_6)\rg T_3. \end{equation*}

Ces solutions sont faciles à trouver à la main sur une instance aussi petite que celle de cet exemple, mais dans toute leur généralité ces problèmes nécessitent d'élaborer des algorithmes pour les résoudre et on souhaite qu'ils soient efficaces.

D'autres questions sont soulevées par les relations de précédences. Il ne faut pas que dans un graphe de précédence apparaisse un circuit, c'est-à-dire une séquence \(T_{i_1},T_{i_2},\ldots,T_{i_k}\) de tâches telle que

\begin{equation} \label{circuit} \forall j\in \llbracket 1,\,k-1\rrbracket\ \ T_{i_j}\propto T_{i_{j+1}}\ \ \text{et}\ \ T_{i_k}\propto T_{i_1}. \end{equation}

Plus simplement, la condition \((\ref{circuit})\) exprime qu'il ne faut jamais être en mesure de partir d'une tâche \(T\) du graphe et d'y revenir en suivant des flèches. La raison est simple, si un tel circuit existe, alors par transitivité de la relation \(\propto\), on a \(T\propto T\) ce qui contredit l'antiréflexivité.

Comment savoir s'il existe des circuits dans un graphe ? Est-on capable de les trouver rapidement ? C'est ce genre de questions qui sont étudiées en théorie des graphes et on en saisit bien l'utilité.

En théorie de la complexité, en master, qui a pour objectif de classifier des problèmes en termes de ressources en temps et/ou en espace nécessaires pour les résoudre, on définit une relation binaire entre langages définis sur un même alphabet \(\Sigma\) appelée transformation polynomiale, qui est réflexive et transitive mais qui n'est ni symétrique, ni antisymétrique. Cette relation joue un rôle majeur dans cette théorie et cette classification.

Résolution du problème introductif

Modélisation avec les graphes orientés

La modélisation de ce problème, appelé Jeu de Nim, se fait dans le cadre de la théorie des graphes et en particulier des graphes acycliques. Nous illustrons ci-dessous la résolution de ce problème pour \(n=9\) allumettes sur le tas et un maximum de \(a=3\) allumettes à retirer.

Graphe du jeu de Nim pour un tas de \(n=9\) allumettes et un maximum de \(a=3\) allumettes à retirer.

On peut décrire toutes les parties possibles à l'aide d'un graphe dont les sommets codent le nombre d'allumettes restant sur le tas et dont les arcs codent les coups possibles. Le graphe contient par exemple l'arc \(8\to 6\) puisqu'en retirant \(2\) allumettes sur un tas qui en contient \(8,\) il n'en contient plus que \(6\). On considère donc le graphe \(G:=(X,U)\) d'ensemble de sommets \(X:=\ab{0}{n}\) et d'ensemble d'arcs \[U:=\{(\ell,k)\in X\times X\such 1\leqslant \ell - k\leqslant a\}.\]

Chaque sommet \(k\) de ce graphe codant une position du jeu, c'est-à-dire le nombre d'allumettes restant sur le tas, un joueur dans cette position doit choisir parmi les \(a\) coups possibles : \((k,k-1)\), \((k,k-2)\) jusqu'à \((k,k-a)\), celui ou ceux qui peuvent l'amener à une victoire, si de tels coups existent.

Dans notre illustration pour \(n=9\) et \(a=3\), il n'est pas difficile de constater que si un joueur \(A\) est en position 3, 2 ou 1, il peut toujours amener le joueur adverse \(B\) dans la position perdante 0 en retirant \(3\), \(2\) ou \(1\) allumette(s) respectivement et si le joueur \(B\) est en position 4, les trois coups qu'il peut jouer le condamnent à l'une de ces trois situations perdantes. La position 4 a par conséquent le même statut que la position 0 et on peut réitérer le raisonnement de proche en proche.

Cette analyse empirique montre qu'un joueur dans l'une des positions en vert peut toujours amener le joueur adverse sur l'une des positions perdantes en rouge. Par conséquent, le joueur qui connaît cette stratégie et qui commence cette partie est sûr de gagner, sinon il faut qu'il compte sur l'ignorance du joueur adverse pour pouvoir se retrouver sur une position gagnante avant que toutes les allumettes soient retirées.

Le graphe \(G=(X,U)\) définit immédiatement une correspondance \((X,U,X)\) que nous notons \(G\) par abus de langage, on a par exemple \(G(\{8\})=\{7,6,5\}\). Observons les propriétés de la partie \(P:=\color{red}\{0,4,8\}\) de \(X\) (les positions perdantes). Aucune flèche ne permet de relier deux sommets de \(P\), on dit dans ce cas que \(P\) est une partie indépendante du graphe \(G\) :

\begin{equation} \forall (x,y)\in P^2\ \ (x,y)\not\in U. \end{equation}

D'autre part, tout sommet hors de \(P\) est relié à un sommet de \(P\), et on dit alors que \(P\) est une partie absorbante du graphe \(G\) :

\begin{equation} \forall x\not\in P\ \exists y\in P\ \ (x,y)\in U \end{equation}

Une partie \(P\) de \(X\) à la fois indépendante et absorbante est appelée noyau du graphe \(G\). On comprend aisément l'intérêt de ce concept dans le cadre de ce jeu : le noyau contient les positions perdantes pour le joueur qui s'y trouve, il en sort nécessairement (indépendance) et l'autre joueur peut toujours l'y ramener (absorption). Notons qu'un graphe n'admet pas nécessairement de noyau.

Si un graphe admet un noyau, on dispose d'une stratégie générale pour gagner à tous les jeux similaires. Par exemple : deux joueurs sont faces à plusieurs tas de pièces et peuvent retirer chacun leur tour un nombre arbitraire de pièces mais d'un seul tas, qui peut en revanche être différent à chaque tour de jeu. Comment éviter d'être celui qui ne pourra plus retirer de pièce ?

Démontrez que si un graphe orienté acyclique admet un noyau, celui-ci est unique.

Un graphe orienté acyclique fini admet au moins un puits, c'est-à-dire un sommet qui n'admet pas de successeur. Par l'absurde, si aucun sommet du graphe n'est un puits, on part d'un sommet arbitraire \(x\in X\) qui admet donc un successeur \(y\) et on peut répéter l'opération de proche en proche avec des sommets deux-à-deux distincts sans quoi il s'agirait d'un cycle ce qui est impossible puisque le graphe est acyclique, mais dans ce cas le chemin serait constructible à l'infini ce qui est également impossible par hypothèse.

Le graphe contient donc a minima un puits et tous les puits font nécessairement partie d'un noyau, puisqu'ils satisfont la propriété d'indépendance. On raisonne par récurrence sur le nombre de sommets \(n:=|X|\) du graphe. Si \(n=1\), le seul sommet du graphe est un puits et le noyau est réduit à ce seul sommet. Soit \(p\) un puits du graphe. Par hypothèse de récurrence, le sous-graphe obtenu en privant \(G\) du sommet \(p\) et de ses prédécesseurs \(G^{-1}(\{p\})\) admet un noyau unique \(K\). Alors \(K\cup\{p\}\) est l'unique noyau de \(G\).

Considérons le graphe \(G=(X,U)\) définit par \(X:=\{0,1,2\}\) et \(U:=\{(0,1),(1,2),(2,0)\}\). Montrer que ce graphe n'admet pas de noyau.

Une simple étude de cas suffit ici. La partie vide n'est pas absorbante et \(X\) n'est pas une partie indépendante, un noyau contient donc un ou deux sommets. Si la partie contenait un unique sommet \(i\in\{0,1,2\}\), elle ne serait pas absorbante puisque l'arc \((i+1 \pmod 3,i)\not\in U\) et si la partie contenait deux sommets \(i\) et \(j\), elle ne serait pas indépendante, puisque \((i,j)\in U\) ou \((j,i)\in U\).

Deux jardiniers sont face à une rangée de \(7\) fleurs et doivent cueillir une fleur à tour de rôle en respectant la règle suivante : ils ne peuvent retirer une fleur de la rangée qu'à condition qu'elle soit adjacente à une autre fleur. Celui qui ne peut plus retirer de fleur a perdu.

Dessinez le graphe du jeu et calculer son noyau.

La question qui se pose à présent est de déterminer comment calculer le noyau d'un graphe fini acyclique autrement que de manière empirique ?

Fonctions de Grundy

Le mathématicien britannique Patrick Grundy s'est intéressé à ce type de problèmes et a développé l'outillage nécessaire en théorie des graphes pour les analyser et identifier les positions gagnantes et perdantes. Dans le graphe modélisant les différentes configurations du jeu des allumettes et les transitions qui les relient, on constate aisément que l'on peut partitionner les sommets suivant leur statut dans le déroulement du jeu : les sommets \(0\), \(4\) et \(8\) qui sont les positions perdantes, les sommets \(1\), \(5\) et \(9\) qui permettent de les atteindre en retirant \(1\) allumette, les sommets \(2\), \(6\) en retirant \(2\) allumettes et les sommets \(3\) et \(7\) en retirant \(3\) allumettes. Il y a donc \(4\) groupes de positions différents dans le graphe.

Plus généralement, dans un graphe acyclique, s'il y a \(m\) groupes de positions différentes, une fonction de Grundy \(g\) fournit simplement pour un sommet \(x\in X\) du graphe, le numéro \(g(x)\) de son groupe, sachant que les groupes sont numérotés de \(0\) à \(m-1\) et que la valeur nulle est attribuée aux sommets du noyau du graphe.

Soit \( G=(X,U) \) un graphe antiréflexif. On appelle fonction de Grundy, toute application \(g:X\rightarrow\N\) telle que \begin{equation} \forall x\in X\quad g(x)=\min\big(\N\setminus g(G(\{x\}))\big). \end{equation}

Autrement dit la valeur \(g(x)\) de la fonction de Grundy en un sommet \(x\) du graphe est tout simplement la plus petite valeur de l'ensemble des entiers naturels privé de l'ensemble des valeurs de la fonction de Grundy de ses successeurs.

Un graphe qui admet une fonction de Grundy \(g\) admet un noyau.

Il suffit de vérifier que l'ensemble \(g^{-1}(0)\) est indépendant et absorbant.

On comprend aisément l'intérêt d'une telle fonction, les positions perdantes sont déterminées par le noyau de la fonction de Grundy, c'est-à-dire l'ensemble des sommets \(x\) du graphe tels que \(g(x)=0\). Reste à déterminer les conditions qu'un graphe doit satisfaire pour qu'il admette une fonction de Grundy et, le cas échéant, comment construire cette fonction. On admettra le théorème suivant :

Tout graphe orienté et acyclique admet une unique fonction de Grundy.

La construction effective de la fonction de Grundy se fait en deux grandes étapes, on partitionne le graphe en \(k\) groupes de sommets que l'on ordonne en les numérotant de \(0\) à \(k-1\), puis on définit la fonction de Grundy en partant du groupe \(0\) jusqu'au groupe \(k-1\). Pour construire effectivement cette fonction, la définition impose de partir de la fin du graphe, puisque la valeur en un sommet ne peut être déterminée qu'une fois les valeurs de ses successeurs connue.

Le partitionnement du graphe se fait inductivement, on considère dans le groupe \(0\) tous les sommets qui n'ont pas de successeurs (les puits) : \(X_0:=G_0^{-1}(\varnothing)\) puis on élimine ces puits de l'ensemble des sommets \(X\) du graphe pour constituer un sous-graphe à partir duquel on définit l'ensemble des puits \(X_1\) de la même manière et ceci jusqu'à épuisement des sommets.

Cette construction repose sur des algorithmes sur les graphes étudiés en 3ème année de licence d'informatique.

Travaux pratiques

Nano tutoriel Python-UNIX à imprimer/lire/conserver.

Présentation du sujet

L'objectif de ce TP est de transposer en Python quelques manipulations vues en cours sur les correspondances, fonctions et applications. Téléchargez la bibliothèque correspondances.pyc dans le répertoire où vous écrirez vos scripts dans lesquels vous l'importerez :

    from correspondances import *

Cette bibliothèque contient les fonctions et procédures suivantes :

LireCorrespondance(nomfichier) : renvoie le triplet (X,G,Y) créé à partir d'un fichier texte contenant le codage d'une correspondance \(c=(X,G,Y)\). Chaque couple \((x,y)\in G\) de son graphe est codé sur une ligne par la chaîne x > y. Les ensembles de départ \(X\) et d'arrivée \(Y\) sont obtenus automtiquement à partir des \(x\) et des \(y\) qui apparaissent dans le fichier. Comme un élément de \(X\) ou de \(Y\) peuvent ne pas avoir de correspondant, il faut également les coder dans ce fichier. Un élément \(x\in X\) (resp. \(y\in Y\)) sans correspondant dans \(Y\) (respectivement dans \(X\)) est codé x < (resp. > y).
Cliquez pour télécharger un exemple d'un fichier codant une correspondance.
FormaterCorrespondance(c) : affiche une correspondance au format indiqué ci-dessus.
DiagrammeSagittal(c) : affiche (en mode textuel) le diagramme sagittal de la correspondance c passée en paramètre.
Correspondance(nX,nY,nG) : renvoie une correspondance (X,G,Y) aléatoire d'ensemble de départ \(X\) de cardinal nX et d'ensemble d'arrivée \(Y\) de cardinal nY avec nG couples dans son graphe \(G\). (X et Y sont limités à 52 éléments.)
Fonction(nX,nY,nG) : renvoie une fonction (X,G,Y) aléatoire (même principe que Correspondance).
Application(nX,nY) : renvoie une application. NB. Le nombre de couples est nécessairement égal à nX.
Injection(nX,nY) : renvoie une injection. NB. Le nombre de couples est nécessairement égal à nX.
Surjection(nX,nY) : renvoie une surjection. NB. Le nombre de couples est nécessairement égal à nX.
Bijection(n) : renvoie une bijection. NB. Nécessairement \(|X|=|Y|=|G|:=n\).

Exemple : Le script suivant affiche une correspondance générée aléatoirement avec un ensemble de départ à \(6\) éléments, d'arrivée à \(10\) éléments avec \(12\) couples dans son graphe.

from correspondances import *

c = Fonction(6,10,12)
FormaterCorrespondance(c)

NB. Si script.py désigne le script ci-dessus, l'instruction suivante exécutée dans un terminal

python script.py > essaifonction.txt

redirige la sortie du script Python dans le fichier essaifonction.txt.

En séance

La fonction LireCorrespondance(nomfichier) de la bibliothèque correspondances est donnée ci-dessous :

    def LireCorrespondance(nomfichier):
    fichier = open(nomfichier,"r")
    liste = fichier.readlines()
    (X,G,Y) = (set(),set(),set())
    for fleche in liste:
        (x,y) = fleche.strip().split(">")
    if x != '':
        X.add(x)
    if y != '':
        Y.add(y)
    if (x != '') and (y != ''):
        G.add((x,y))
    return (X,G,Y)

Expliquez en commentaire dans votre script comment procède cette fonction pour créer les ensembles de départ, d'arrivée et le graphe de la correspondance codée dans le fichier texte passé en paramètre. Vérifiez que pour la correspondance fournie en exemple, on a bien

\(X=\{a,b,c,d,e\}\) codé X = {"a","b","c","d","e"}
\(Y=\{1,2,3,4,5,6\}\) codé Y = {"1","2","3","4","5","6"}.
\(G=\{(a,1),(a,2),(b,1),(c,2),(c,3),(e,4)\}\) codé G={("a","1"),("a","2"),...,("e","4")}

Faites afficher cette correspondance grâce à la procédure DiagrammeSagittal ou FormaterCorrespondance.

Écrivez une fonction Python DomaineDef(c) qui renvoie l'ensemble de définition de la correspondance \(c\) passée en paramètre.

Écrivez une fonction Python CreerDico(c) qui renvoie un dictionnaire dont les clefs sont tous les \(x\in\text{Def}(c)\). La valeur associée à chaque clef \(x\) est l'image directe de \(\{x\}\) par \(c\), i.e. \(c(\{x\})\). Voir les travaux pratiques #3 pour l'usage des dictionnaires. Pour l'exemple fourni, en notant D ce dictionnaire, on a D["a"]={"1","2"}, D["b"]={"1"}, D["c"]={"2","3"} et D["e"]={"4"}.

Écrivez une fonction Python EstFonction(c) qui décide — c'est-à-dire qui renvoie vrai (True) ou faux (False) — selon que la correspondance \(c\) passée en paramètre est une fonction ou non.
Indication : Utilisez le dictionnaire de c et vérifier que pour toute entrée, sa valeur contient au plus un élément.

Écrivez une fonction Python EstApplication(c) qui décide si la correspondance \(c\) passée en paramètre est une application.

Indication : appliquez littéralement la définition du cours.

Écrivez une fonction Python Reciproque(c) qui renvoie la correspondance réciproque de celle passée en paramètre.

Écrivez une fonction Python ImageDirecte(c,A) qui renvoie l'image directe d'une partie \(A\) de l'ensemble de départ de la correspondance \(c\) passée en paramètre.

Écrivez une fonction Python ImageReciproque(c,B) qui renvoie l'image réciproque d'une partie \(B\) de l'ensemble d'arrivée de la correspondance \(c\) passée en paramètre.

Écrivez une fonction Python Composer(g,f) qui renvoie la composition \(g\circ f\) des deux correspondances \(f\) et \(g\) passées en paramètres. Composez cette correspondance avec sa correspondance réciproque. Est-ce l'identité ?
Indication : on supposera que l'ensemble d'arrivée de \(f\) est égal à l'ensemble de départ de \(g.\)

Compléments hors séance

Écrivez une fonction Python DefIm(c) qui renvoie le couple \((\text{Def}(c),\text{Im}(c))\) constitué par l'ensemble de définition et l'ensemble image de la correspondance \(c\) passée en paramètre.

Écrivez une fonction Python EstInjection(c) qui décide si la correspondance \(c\) passée en paramètre est une injection.

Écrivez une fonction Python EstSurjection(c) qui décide si la correspondance \(c\) passée en paramètre est une surjection.

Écrivez un script Python qui réalise la décomposition canonique d'une application \(f:X\to Y\). Les fonctions sont encore une fois encodées par leurs graphes codés dans un fichier texte. Pour cela, écrivez une fonction DC(f) qui renvoie la liste des couples \((A,y)\) formés par les classes d'équivalence \(A\) suivant \(\rel\) et de l'image commune \(y\) des représentants de la classe \(A\).