Mathématiques pour l'informatique - CHAPITRE 2. Logique des prédicats, théorie des ensembles

Vous devez développer un moteur de recherche pour une médiathèque numérique. Un usager souhaite trouver tous les documents de la médiathèque qui parlent de robot(s) ou de chat(s), mais qui ne mentionnent pas l'intelligence artificielle. Le corpus* Ce corpus n'a rien de réaliste. Il a été réduit ici à une poignée d'entrées afin de pouvoir être analysé à la main et de comprendre les mécanismes que nous mettrons en œuvre pour répondre à cette question. La réalité pour ce type de recherche serait plus proche de dizaines de milliers voire de millions de documents. de cette médiathèque est le suivant :

Avant même de concevoir un algorithme capable de répondre automatiquement à cette requête, et plus généralement à toute requête de ce type, on cherche à répondre à cette question :

Question : Comment traduire avec précision la requête de l’usager, de manière à pouvoir automatiser la recherche des documents qui la satisfont ?

Nous reviendrons sur cette question à la fin de chapitre. Nous proposerons une formalisation rigoureuse et complète de ce problème une fois étudiés les nouveaux concepts introduits dans ce chapitre : ensembles et prédicats.

Démonstrations

Une théorie mathématique est un ensemble d'affirmations, les assertions ou propositions vraies. Une assertion peut être admise, auquel cas on parle d'axiome ou de postulat — c'est incontournable, on ne peut pas créer une théorie ex nihilo, — ou être obtenue à l'aide de règles de déductions logiques et d'autres assertions dont les axiomes.

En complément de la logique propositionnelle, on enrichit le langage mathématique de symboles spécifiques à la théorie en précisant leur syntaxe et comment ils s'articulent avec la logique propositionnelle. Plus précisément, le langage de la logique des prédicats va nous permettre de construire de nouvelles propositions. Ce langage n'entre donc pas en concurrence avec celui de la logique propositionnelle mais l'enrichit.

Cette vision formaliste ne doit pas faire perdre de vue que les mathématiques seraient impraticables ou pour le moins considérablement entravées si l'on s'interdisait l'usage de la langue naturelle pour s'exprimer. Autrement dit, faire des mathématiques ne peut pas se résumer à la construction d'énoncés formels qui respectent une syntaxe stricte, à la manière d'un langage de programmation. Parler d'un entier naturel \(n\) pair n'est pas moins rigoureux que d'écrire \(n\in\N\) et que \(n\) satisfait la proposition suivante \begin{equation} \label{eq:entierpair} \exists k\ \ (k\in\N) \wedge (n={\color{#FF8}2}k). \end{equation} La proposition \((\ref{eq:entierpair})\) — si elle est incompréhensible du lecteur à ce stade, elle ne devrait plus l'être à la fin du chapitre —, est en revanche bien plus efficace s'il faut démontrer que le carré d'un entier pair est pair. En effet, si \(n\) est pair, on dispose d'après \((\ref{eq:entierpair})\) d'un entier naturel \(k\) tel que \(n=2k.\) On démontre alors que les trois implications suivantes sont vraies grâce aux propriétés des opérations en arithmétique : \begin{align*} \boxed{n={\color{#FF8}2}k}\ &\then\ n^2=({\color{#FF8}2}k)^2\\ n^2=({\color{#FF8}2}k)^2\ &\then\ n^2=4k^2\\ n^2=4k^2\ &\then\ \boxed{n^2={\color{#FF8}2}(2k^2)}. \end{align*} Et la transitivité de l'implication nous donne \[ (n={\color{#FF8}2}k)\ \then\ (n^2={\color{#FF8}2}(\underbrace{2k^2}_K)). \] En supposant que \(n=2k\), on a donc pu construire l'entier \(K:=2k^2\) tel que \(n^2=2K\), prouvant ainsi d'après la règle du modus ponens que si \(n\) est pair, son carré l'est aussi.

Le langage mathématique est un outil extrêmement puissant pour exprimer des concepts et les manipuler en les objectivants, mais en aucun cas les mathématiques ne sauraient être réduites à un langage. Les langages naturels permettent d'écrire des chefs d'œuvre de la littérature, mais ne sont que des moyens d'exprimer la pensée.

Une nouvelle assertion obtenue par déduction est appelée théorème, ou lemme si le résultat est une étape importante pour l'obtention d'un théorème, ou parfois proposition* au sens de cette définition et non pas d'une formule de la logique propositionnelle., ou encore corollaire lorsqu'il s'agit d'une conséquence directe d'un théorème. Stricto sensu, chaque proposition intermédiaire obtenue dans une démonstration constitue un théorème, mais nous ne mettons en évidence que celles qui nous paraissent importantes, les autres restent dans l'anonymat.

Le rôle premier d'une démonstration est de valider une proposition. Elle agit comme un processus de certification qui n'explique pas nécessairement pourquoi cette proposition est vraie, mais comment. En général, on débute par la compréhension du résultat, même parcellaire, puis on tente de le valider formellement, rarement l'inverse. Parfois, l'explication est transposable en preuve, en particulier quand il s'agit d'un processus constructif.

Ce processus formel de certification peut être abscons. Il est donc essentiel, de trouver des arguments, même informels, pour comprendre pourquoi une proposition est vraie. De la même manière, un algorithme s'adresse à un être humain et explicite comment obtenir un résultat, alors que le code exécutable qui le réalise n'est plus qu'une succession d'instructions parfaitement obscures. Le lecteur peut s'en convaincre en lisant le code exécutable de n'importe quel programme compilé.

Version géométrique du théorème de Pythagore.

Les deux carrés à gauche et à droite ci-dessus ont des côtés de même longueur \(A+B.\) En recomposant les \(4\) triangles du carré gauche de manière à former deux rectangles de côtés de longueurs \(A\) et \(B\) dans le carré droit, on en déduit que les aires bleues à gauche et à droite sont égales ce qui nous permet d'obtenir le fameux théorème de Pythagore : le carré de l'hypothénuse d'un triangle rectangle est égal à la somme des carrés des autres côtés : \[{\color{#08F}H^2}={\color{#08F}A^2+B^2}.\]

Cette démonstration est informelle mais justifie de manière compréhensible le résultat. Une preuve formelle utiliserait, par exemple, les outils de la géométrie cartésienne comme les vecteurs et le produit scalaire pour établir le résultat de manière algébrique :

On considère un triangle \(ABC\) rectangle en \(B\) de côtés \([AB]\), \([BC]\) et d'hypothénuse \([BC]\). On rappelle que si \(\overrightarrow{u}\) et \(\overrightarrow{v}\) sont deux vecteurs du plan on a \[\overrightarrow{u}\cdot\overrightarrow{v}=\Vert\,\overrightarrow{u}\,\Vert\,\Vert\,\overrightarrow{v}\,\Vert\,\cos(\widehat{\overrightarrow{u},\overrightarrow{v}})\] où \(\cdot\) désigne le produit scalaire. On en déduit que \(\overrightarrow{u}\cdot\overrightarrow{u}=\Vert\,\overrightarrow{u}\,\Vert^2\) puisque \(\cos(\widehat{\overrightarrow{u},\overrightarrow{u}})=1\). On calcule alors \begin{align*} BC^2&=\Vert\,\overrightarrow{BC}\,\Vert^2\\ &=\Vert\,\overrightarrow{BA} + \overrightarrow{AC}\,\Vert^2\quad(\text{Chasles})\\ &=\Vert\,\overrightarrow{AC}-\overrightarrow{AB}\,\Vert^2\\ &=(\overrightarrow{AC}-\overrightarrow{AB})\cdot(\overrightarrow{AC}-\overrightarrow{AB})\\ &=\overrightarrow{AC}\cdot\overrightarrow{AC}-2\,\overrightarrow{AB}\cdot\overrightarrow{AC}+\overrightarrow{AB}\cdot\overrightarrow{AB}\quad(\text{Bilinéarité de \(\cdot\)})\\ &=\Vert\,\overrightarrow{AC}\,\Vert^2-2\,\overrightarrow{AB}\cdot\overrightarrow{AC}+\Vert\,\overrightarrow{AB}\,\Vert^2 \\ &=\Vert\,\overrightarrow{AC}\,\Vert^2+\Vert\,\overrightarrow{AB}\,\Vert^2 -2\,\Vert\,\overrightarrow{AB}\,\Vert\,\,\Vert\,\overrightarrow{AC}\,\Vert\,\,\underbrace{\cos(\widehat{\overrightarrow{AB},\overrightarrow{AC}})}_{0} \end{align*} Et finalement \(BC^2=AC^2+AB^2\) car \(\overrightarrow{AB}\perp\overrightarrow{AC}\).

Nous avons déjà mentionné trois méthodes communes qui sont utilisées pour faire une démonstration, sans qu'elles soient exclusives* Exemple typique de l'effort à faire pour lever les ambiguïtés ou imprécisions de la langue naturelle. Sans cette précision, le lecteur ne sait pas si ces trois méthodes de démonstration sont les seules possibles ou non. :

La théorie mathématique dans laquelle nous discourons, tout au moins dans ce cours, est une axiomatisation de la théorie des ensembles développée par G. Cantor*Mathématicien allemand de la fin du 19ème siècle. à la fin du 19ème siècle, proposée par les mathématiciens allemands E. Zermelo et A. Fraenkel pour en éliminer les paradoxes. Elle est l'aboutissement de questionnements philosophiques sur la nature du raisonnement et de la construction des ensembles qui ont culminés à la charnière du xix-ème et du xx-ème siècle. Bien entendu, les mathématiciens n'ont pas attendu le xx-ème siècle et cette théorie pour faire des démonstrations. L'apparition de contradictions et de paradoxes, conséquence de manipulations sans contraintes des ensembles infinis, a mis en péril l'édifice mathématique et a nécessité d'en fixer les règles. Pour faire une métaphore routière, conduire sur les routes sans fixer quelques règles de circulation peut aboutir à des accidents.

Cette théorie identifie tous les objets manipulés à des ensembles, nombres, fonctions, relations, vecteurs, etc. Elle fournit un nombre limité d'axiomes et de règles pour justifier leur existence ou pour les construire. Elle n'est pas la théorie des ensembles, au sens défini singulier, bien que nous emploierons souvent cette expression, mais plutôt un codage particulier et cohérent des objets qui étaient déjà utilisés en mathématiques. La plupart des axiomes expriment des propriétés qui semblent évidentes pour les ensembles tels que nous les concevons naïvement. Ils précisent dans quel cadre nous pouvons construire de nouveaux ensembles à partir de ceux que nous connaissons déjà.

L'objet de cette théorie n'est pas d'expliquer ce que sont les ensembles, mais d'établir des règles de construction afin d'éviter des paradoxes. Nous ne ferons qu'effleurer ces questions délicates dans ce cours de licence, elles seront à nouveau abordées dans un cours de calculabilité de master d'informatique. Dans la suite nous ne présenterons que les axiomes que nous utilisons intensivement, ils illustrent la démarche qui sous-tend cette théorie et dont la dimension systématique est proche de la théorie des langages en informatique.

Ensembles

Plus prosaïquement, nous concevons un ensemble comme une collection d'objets, comme un regroupement, à la manière d'un sac de billes. Cette vision informelle est non seulement légitime mais indispensable pour élaborer nos raisonnements, il est donc exclu de la sacrifier sur l'autel du formalisme, elle est suffisante pour la licence. C'est celle de Georg Cantor :

Les deux mots clés dans cette définition sont les mots définis et discernables. Le premier signifie que l'on doit être en mesure de dire pour tout objet s'il est un élément ou non de l'ensemble \(X.\) Le second signifie que l'on doit être en mesure de distinguer les éléments d'un ensemble. Ces deux conditions expriment le fait qu'un ensemble est totalement caractérisé par ses éléments.

Les conditions définis et discernables font émerger deux relations spécifiques à la théorie des ensembles, respectivement la relation d'appartenance notée \(\in\) et la relation d'égalité notée \(=.\) La proposition \(x\) est un élément de \(X\) est codée par l'expression \begin{equation} x\in X \end{equation} et la proposition \(x\) est égal à \(y\) est codée \begin{equation} x=y \end{equation}

Rien n'empêche un ensemble d'être lui-même l'élément d'un autre ensemble. Si \(x\) et \(y\) satisfont \(x=y\), cela entraîne qu'ils sont synonymes, on peut échanger leurs rôles dans n'importe quelle expression mathématique sans rien changer à son interprétation.

D'autres symboles spécifiques à la théorie des ensembles sont utilisés, en particulier l'accolade ouvrante \(\{\) et l'accolade fermante \(\}\).

Quand le nombre d'éléments qui définissent un ensemble \(X\) est fini — le sens précis de la finitude sera introduit plus tard —, on peut le représenter par la liste de ses éléments délimités par ces deux symboles respectivement. Par exemple \begin{align} \label{eq:ens4} X=\{1,f,3,x\}. \end{align} dont les éléments sont \(1\), \(f\), \(3\) et \(x.\) Cette écriture est appelée écriture en extension de \(X\).

Comme un ensemble est entièrement déterminé par ses éléments, les répétitions éventuelles d'un même élément dans l'écriture en extension d'un ensemble sont redondantes, ainsi \[\{a,a,b,a,c\}=\{a,b,c\}.\] Un même identificateur, \(a\) dans notre exemple, ne peut pas décrire des objets différents d'un ensemble, alors que dans une interprétation physique des ensembles, on peut y ranger plusieurs exemplaires d'un même objet, comme trois stylos bic bleus par exemple, mais s'ils sont indistinguables, il ne sont pas pour autant égaux au sens mathématique. D'autre part, l'ordre dans lequel apparaissent les éléments d'un ensemble n'a aucune importance, par exemple : \[\{a,b,c\}=\{b,a,c\}=\{a,c,b\},\ \text{etc.}\]

Logique des prédicats

Prédicats

Nous allons étudier la logique des prédicats, dite également logique du premier ordre, dans le cadre de la théorie des ensembles. La démarche est similaire à celle que nous avons présentée pour la logique propositionnelle, nous commençons par étudier sa syntaxe. Contrairement à la logique propositionnelle où les variables ne peuvent prendre leurs valeurs que dans l'ensemble \(\{\top,\bot\}\), les variables de la logique des prédicats peuvent prendre leurs valeurs dans des univers quelconques, en particulier dans des ensembles dans le cadre de la théorie ZF qui nous concerne ici.

Un prédicat à \(q\) variables \(x_1,x_2,\ldots,x_q\) est généralement noté de manière préfixe, c'est-à-dire \(P(x_1,x_2,\ldots,x_q)\) et on dit également que \(P\) est un prédicat \(q\)-aire. Stricto sensu, conformément à la définition ci-dessus, un prédicat contient au moins une variable, sinon il s'agit d'une proposition, mais il est commode de considérer qu'une variable propositionnelle est un prédicat d'arité \(0,\) encapsulant ainsi le langage du calcul propositionnel dans le langage du calcul des prédicats.

La syntaxe des formules de la logique des prédicats hérite de celles des formules propositionnelles, mais on connecte cette fois des prédicats. Notons que si l'on se limite aux prédicats d'arité \(0\), autrement dit les propositions, on retrouve le langage du calcul propositionnel. Dans le cadre de la théorie ZF on va pouvoir constituer de nouveaux prédicats en enrichissant le lexique avec des ensembles et des symboles spécifiques, pour commencer \(=\), \(\in\), \(\{\) et \(\}\).

Exemples. L'expression \(x\in\{1,2\}\) est un prédicat d'une variable \(x.\) L'expression \(\neg(x\in y)\) est un prédicat à deux variables \(x\) et \(y.\) Ainsi l'expression \((x\in\{1,2\})\wedge(\neg(x\in y))\) est un nouveau prédicat à deux variables \(x\) et \(y.\) On peut, bien sûr, combiner des prédicats (au sens strict) et des propositions comme \((1=2)\then (x\in y)\) qui définit ici un prédicat à deux variables \(x\) et \(y\).

On conserve la même terminologie que pour la logique propositionnelle quand on fixe la valeur d'une ou plusieurs variables d'un prédicat, il s'agit encore d'une interprétation. Notons que si une seule variable a été interprétée dans un prédicat à \(q\) variables, on dispose alors d'un prédicat à \(q-1\) variables.

Prédicats collectivisants

La théorie des ensembles de Zermelo-Fraenkel, ou en condensé théorie ZF, distingue deux types de prédicats :

Les axiomes de la théorie des ensembles élaborée par Zermelo et Fraenkel ont pour objet de fournir une famille de prédicats collectivisants suffisamment riche pour pouvoir coder tous les objets dont les mathématiciens ont besoin, mais en bridant la construction de nouveaux ensembles afin de ne pas créer de monstres générant des paradoxes. De manière imagée, les axiomes et le langage de cette théorie s'apparentent à un jeu de construction dont les pièces détachées et les règles d'assemblage permettent de construire de nouveaux objets dont on peut étudier les propriétés. Pour valider cette boite de jeu, il fallait être capable de reconstruire*plus précisément coder au sens informatique du terme les objets utilisés depuis des lustres par les mathématiciens et montrer que le prix à payer pour cette restriction de mouvement constituait un gage de sécurité.

A contrario, la théorie ne dit pas quels sont les prédicats qui ne sont pas collectivisants. Sont disqualifiés de fait tous ceux dont les ensembles associés, s'ils existaient, permettraient d'en déduire une contradiction. Cantor ne faisait pas ce distinguo et son principe d'abstraction affirmait que tout prédicat définissait un ensemble, ce que l'on traduirait dans le langage de la théorie ZF, par tout prédicat est collectivisant.

L'application de ce principe, écarté dans la théorie ZF, génère des paradoxes. Le plus célèbre d'entre eux est probablement le paradoxe de Russel * Bertrand Russel était un philosophe et mathématicien anglais et l'un des fondateurs de la logique contemporaine. Il a découvert ce paradoxe en 1901. : considérons \(P(x)\) le prédicat

Supposons que \(P(x)\) soit collectivisant en \(x.\) On dispose alors de l'ensemble

D'après la définition \((\ref{eq:Russel})\) de l'ensemble \(X\), il est clair que si \(X\in X\), \(X\) doit satisfaire \(X\not\in X\), en notant \(A\) la proposition \(X\in X\), on vient de montrer que \[A\then\neg A\equiv \neg A\vee A\equiv \neg A.\] Bien sûr, si \(X\not\in X\), alors l'ensemble \(X\) satisfait le prédicat \((\ref{eq:predicatRussel})\) et doit donc appartenir à \(X\), on a donc montré que \[\neg A\then A\equiv A\vee A\equiv A.\] on a donc montré que \(A\wedge \neg A\) ce qui est contradictoire.

Quantificateurs

Deux nouveaux symboles permettent de construire des propositions à l'aide d'un prédicat \(P(x)\) et des règles syntaxiques suivantes :

En pratique, la variable \(x\) décrit des éléments d'un ensemble fixé \(X\), on utilise alors très souvent les deux expressions raccourcies suivantes : \begin{align} \label{eq:universel} \color{white}\forall x\in X\ \ &{\color{white} Q(x)}\ \ \equiv\ \ \forall x\ {\color{#08F}(x\in X)\then Q(x)},\\ \label{eq:existentiel} \color{white}\exists x\in X\ \ &{\color{white} Q(x)}\ \ \equiv\ \ \exists x\ {\color{#F80}(x\in X)\wedge Q(x)}. \end{align}

La première expression a été construite sur la base de l'expression \((\ref{eq:universel0})\) avec le prédicat \({\color{#08F}(x\in X)\then Q(x)}\), la seconde sur la base de l'expression \((\ref{eq:existentiel0})\) avec le prédicat \({\color{#F80}(x\in X)\wedge Q(x)}\).

Quand un quantificateur précède une variable \(x\), on dit qu'elle est quantifiée ou qu'il s'agit d'une variable liée (sous-entendu à un quantificateur). Dans ce cas, on parle également de variable muette ou anonyme au sens où elle peut être remplacée partout dans l'expression par n'importe quelle autre sans en changer le sens. On peut s'en convaincre en remplaçant \(x\) par \(y\) dans les deux expressions \((\ref{eq:universel})\) et \((\ref{eq:existentiel}).\) Ces deux expressions sont donc bien des propositions et pas des prédicats. Quand une variable n'est pas quantifiée elle est dite libre. Quand toutes les variables d'une formule de la logique des prédicats sont quantifiées, la formule est dite close.

Pour démontrer une proposition du type \(\forall x\in X\ \ P(x)\), on se donne un élément \(x\) quelconque de l'ensemble \(X\) et on montre que \(P(x)\) est vraie. Comme \(x\) est quelconque il symbolise n'importe quel élément de \(X\), ainsi si la proposition \(P(x)\) est vraie, elle l'est aussi pour tout autre élément de \(X.\) Pour démontrer une proposition du type \(\exists x\in X\ \ P(x)\), il faut exhiber un élément particulier \(x\) de l'ensemble \(X\) tel que \(P(x)\) soit vraie, il peut d'ailleurs en exister plusieurs.

Il arrive souvent que l'on ait besoin d'exprimer l'existence d'un objet et que celui-ci est unique. On rajoute alors un point d'exclamation à la suite du quantificateur existentiel pour le signifier. La proposition \(\exists!\, x\in X\ P(x)\) est logiquement équivalente à la proposition \begin{equation} \underbrace{(\exists x\in X\ \ P(x))}_{\text{existence}}\;\wedge\;\underbrace{\Big(\forall x\in X\ \forall y\in X\ \ \big((P(x)\wedge P(y))\Rightarrow (x=y)\big)\Big)}_{\text{unicité}}. \end{equation} Le terme gauche de cette conjonction code l'existence de \(x\) et le terme droit son unicité en exprimant sous forme contraposée que deux éléments distincts \(x\) et \(y\) de l'ensemble \(X\) ne peuvent simultanément satisfaire le prédicat : \((x\neq y)\then \neg(P(x)\wedge P(y)).\)

La négation des deux expressions \((\ref{eq:universel0})\) et \((\ref{eq:existentiel0})\) est conforme à celle des énoncés correspondants en langue naturelle : \begin{align*} \neg (\forall x\ P(x))&\equiv \exists x\ \neg P(x)\\ \neg (\exists x\ P(x))&\equiv \forall x\ \neg P(x) \end{align*} avec pour déclinaisons sur un ensemble \(X\) \begin{align} \label{eq:negA} \neg ({\color{orange}\forall x\in X\ P(x)})&\equiv {\color{green}\exists x\in X\ \neg P(x)}\\ \label{eq:negE} \neg ({\color{lightblue}\exists x\in X\ P(x)})&\equiv {\color{lightgreen}\forall x\in X\ \neg P(x)} \end{align}

Illustrons l'équivalence logique \((\ref{eq:negA})\) en langue naturelle en supposant que \(X\) désigne l'ensemble des étudiants qui suivent ce cours de mathématiques et \(P(x)\) le prédicat dont l'interprétation est \(P(x)\) est vrai si et seulement si l'étudiant \(x\) comprend le cours. La négation de la proposition

Ainsi, quand on veut démontrer qu'une proposition du type \(\color{orange}\forall x\in X\ \ P(X)\) est fausse, autrement dit que sa négation est vraie, il suffit d'exhiber un élément \(\color{green}x\in X\) tel que \(\color{green}\neg P(x)\), qu'on appelle un contre-exemple.

Passons à l'équivalence logique \((\ref{eq:negE}).\) La négation de la proposition

Le langage mathématique ne peut laisser la place qu'à une unique interprétation. Ces différents énoncés montrent au passage que la variable \(x\) est bien muette, nous ne l'avons jamais mentionnée pour exprimer \((\ref{eq:negA})\) ou \((\ref{eq:negE})\).

Exemples : Les difficultés commencent quand on manipule des prédicats de plusieurs variables et que l'on quantifie tout ou partie de leurs variables. Par exemple, un prédicat \(P(x,y)\) dont la variable \(x\) a été quantifiée est un prédicat de la variable \(y.\) Considérons le prédicat \(P(x,y)\) défini sur deux variables réelles \(x\) et \(y\) suivant : \[x^2-y= 1\] On peut définir le prédicat \(Q(x)\) de la variable \(x\) suivant \[\exists y\in\R\quad x^2-y= 1\] et la proposition \(\forall x\in\R\ Q(x)\), soit \[\forall x\in\R\ (\exists y\in\R\quad x^2-y = 1)\] que l'on écrit souvent en omettant les parenthèses : \begin{equation}\label{eq:AE} \forall x\in\R\ \exists y\in\R\quad x^2-y = 1. \end{equation} Cette proposition est vraie. En effet, quelle que soit la valeur du réel \(x\), le nombre réel \(y\) défini par \(y=x^2-1\) satisfait l'équation de la proposition \((\ref{eq:AE}).\) Échangeons à présent les deux quantificateurs et étudions la signification de cette nouvelle proposition : \[\exists y\in\R\ \forall x\in\R\quad x^2-y = 1.\] Replaçons tout d'abord les parenthèses (ce n'est qu'une fois que ces écritures seront familières que l'on pourra se parfois les omettre) : \begin{equation}\label{eq:EA} \exists y\in\R\ (\forall x\in\R\quad x^2-y = 1). \end{equation} Cette nouvelle proposition est fausse. Notons \(y_0\) un nombre réel \(y\) tel que tout nombre réel \(x\) satisfait l'égalité de la proposition \((\ref{eq:EA}).\) Si tous les nombres réels \(x\) satisfont l'égalité \((\ref{eq:EA})\) pour \(y=y_0\), c'est le cas en particulier des nombres \(0\) et \(1.\) On peut donc affirmer que \begin{align*} 0^2-y_0&=1^2-y_0 \end{align*} proposition équivalente à la proposition (prouvez le) : \begin{align*} 0=1 \end{align*} qui est fausse. Nous avons exhibé là un contre-exemple.

Il faut donc prendre garde à l'ordre des quantificateurs et en particulier replacer les parenthèses absentes si l'on doit propager une négation comme \((\ref{eq:negA})\) ou \((\ref{eq:negE})\) pour des prédicats à plusieurs variables.

On dit qu'une fonction \(f:\R\rightarrow\R\) est simplement continue en un point \({\color{#FF8}x}\in\R\) si la proposition suivante est satisfaite : \begin{equation} \label{eq:continuitesimple} \forall\varepsilon>0\quad\exists\delta>0\quad\forall y\in \R\quad |{\color{#FF8}x}-y|<\delta\Rightarrow |f({\color{#FF8}x})-f(y)|<\varepsilon. \end{equation} Si l'on comprend que \(|x-y|\) désigne la distance de \(x\) à \(y\), cette proposition exprime formellement l'idée que l'on peut toujours cantonner l'image de \(y\) dans un rayon arbitraire \(\epsilon\) autour de l'image de \(x\), en limitant les déplacements de \(y\) autour de \(x\) dans un rayon \(\delta\) qui existe et dépend du rayon \(\epsilon\) qu'on s'était fixé.

Dessinez le graphe de la fonction \(f\) définie par \(x\mapsto x^2-3\) et illustrez sur ce graphe la continuité ou non-continuité de cette fonction en \(x=2.\) Faites de même avec la fonction définie par \(x\mapsto 2x\) si \(x\leqslant 2\) et \(x\mapsto x\) si \(x > 2.\)

Quelle proposition doit satisfaire une fonction \(f:\R\rightarrow\R\) pour qu'elle soit simplement continue en tout point \(x\in\R\) ?

Une fonction \(f:\R\rightarrow\R\) est uniformément continue sur \(\R\) si elle satisfait la proposition :

\begin{equation} \label{eq:continuiteuniforme} \forall\varepsilon>0\quad\exists\delta>0\quad\forall x\in \R\quad\forall y\in \R\quad |x-y|<\delta\Rightarrow |f(x)-f(y)|<\varepsilon. \end{equation} Quelle différence remarquez-vous entre la proposition de continuité simple en tout réel et la proposition de continuité uniforme ?

Écrivez la négation des deux propositions (\ref{eq:continuitesimple}) et (\ref{eq:continuiteuniforme}).

Quelques axiomes

Nous allons à présent introduire la terminologie de base de la théorie des ensembles et définir pas-à-pas les opérations élémentaires sur les ensembles. On commence par l'inclusion.

On note \(X\not\subseteq Y\) plutôt que \(\neg(X\subseteq Y).\) Dans la proposition \(X\) est une partie de \(Y\), il n'y a plus mention de la variable \(x\) présente dans son homologue formalisée \(\forall x\ \ x\in X\then x\in Y\), elle est donc bien muette.

L'axiome d'extension exprime que deux ensembles sont égaux si et seulement s'ils ont exactement les mêmes éléments :

C'est cet axiome que l'on applique quand on veut démontrer que deux ensembles \(X\) et \(Y\) sont égaux, on parle souvent de la double inclusion. Cela consiste à se donner un élément quelconque \(x\in X\) et à démontrer qu'il appartient à l'ensemble \(Y\), puis à démontrer la réciproque.

Dans le cas où \(a=b\), la paire \(\{a,b\}\) est réduite à \(\{a\}\), on l'appelle singleton \(a.\) L'axiome de la paire nous permet de considérer un ensemble avec deux objets et c'est grâce à cet axiome et à l'axiome de la réunion plus loin, que l'on peut définir l'écriture en extension d'un ensemble.

L'axiome de sélection (ou axiome de compréhension ou encore axiome de séparation) est déjà bien connu du lecteur après le cours de mathématiques générales, il est utilisé en permanence. C'est la restriction du principe d'abstraction de Cantor, tout prédicat \(P(x)\) définit un ensemble, à condition que les objets \(x\) qui vérifient \(P(x)\) soient sélectionnés dans un ensemble préexistant :

On peut donc collecter les éléments d'un ensemble \(X\) qui satisfont un prédicat quelconque \(P(x).\) Il est clair qu'il s'agit d'un sous-ensemble de \(X.\) Ainsi, cet axiome est inoffensif, il ne permet donc pas de créer un ensemble trop gros. L'écriture \((\ref{eq:compr})\) d'un ensemble est dite écriture en compréhension de l'ensemble.

L'axiome de la réunion permet de collecter tous les éléments des différents ensembles qui appartiennent à un ensemble donné :

Quand l'ensemble \(X=\{A,B\}\) est une paire d'ensembles, sa réunion est notée \(A\cup B.\) C'est grâce à l'axiome de la réunion et à l'axiome de la paire que l'on a pu construire l'ensemble \((\ref{eq:ens4})\), c'est la réunion des paires \(\{1,f\}\) et \(\{3,x\}.\) La réunion de l'ensemble \(\{\{a\},\{a,b,d\},\{a,c\},\{b,d\}\}\) est l'ensemble \(\{a,b,c,d\}.\)

Soit \(P(x)\) un prédicat quelconque. En se souvenant de (\ref{eq:universel}) et (\ref{eq:existentiel}), on comprend pourquoi la proposition \(\forall x\in\varnothing\ P(x)\) est une tautologie qui affirme que tout élément de l'ensemble vide satisfait le prédicat \(P(x)\) (on rappelle que \(\bot\then A\) est toujours vrai) et la proposition \(\exists x\in\varnothing\ P(x)\) est une antilogie qui affirme qu'aucun élément de l'ensemble vide ne satisfait le prédicat \(P(x)\).

On note parfois \(\complement_XY\) le complémentaire de \(Y\) dans \(X\) ou encore \(\overline{Y}\) si le contexte discursif établit clairement quel est l'ensemble de référence \(X\).

Exemples : \(X\setminus X=\varnothing\) et \(X\setminus\varnothing=X\) ou encore \(\{a,b\}\setminus\{a\}=\{b\}.\)

Deux ensembles \(X\) et \(Y\) dont l'intersection \(X\cap Y=\varnothing\) est vide sont dits disjoints. En particulier l'ensemble vide est disjoint de tout ensemble \(X.\) On note parfois la réunion de deux ensembles disjoints \(A\sqcup B.\) L'intersection d'un ensemble d'ensembles à la manière de la réunion d'un ensemble sera définie au chapitre prochain. La différence symétrique entre deux ensembles \(X\) et \(Y\) est l'ensemble \((X\cup Y)\setminus(X\cap Y)\), on le note \(X\;\Delta\;Y\).

Pour aider à la compréhension, on représente parfois les opérations ensemblistes à l'aide d'un diagramme de Venn.* John Venn était un mathématicien anglais du début du 20-ème siècle Les ensembles sont représentés sous forme de cercles ou de patates qui se chevauchent. Vous pouvez visualiser le résultat des différentes opérations ensemblistes en les survolant ci-dessous :

L'axiome des parties* nettement moins inoffensif que l'axiome de sélection permet de considérer l'ensemble dont les éléments sont tous les sous-ensembles de \(X.\) Nous verrons au chapitre Combinatoire qu'il est considérablement plus grand que \(X\).

L'ensemble vide est une partie de tout ensemble \(X\) puisque \(x\in\varnothing\then x\in X\) est une proposition vraie puisque \(x\in\varnothing\) est fausse. Un ensemble est bien sûr inclus dans lui-même, par conséquent l'ensemble des parties d'un ensemble \(X\) contient toujours la partie vide \(\varnothing\) et l'ensemble \(X.\) Par exemple si \(X=\{a,b,c\}\), on a \[\P(X)=\{\varnothing,\{a\},\{b\},\{c\},\{a,b\},\{a,c\},\{b,c\},X\}.\] D'autre part, l'ensemble des parties de l'ensemble vide \(\P(\varnothing)=\{\varnothing\}\) qui n'est pas l'ensemble vide puisqu'il contient l'élément \(\varnothing\).

L'ordre dans lequel nous écrivons les éléments d'un ensemble en extension n'a pas d'importance, la paire \(\{x,y\}\) est donc égale à la paire \(\{y,x\}.\) Comment définir un nouvel objet mathématique similaire à une paire mais pour lequel l'ordre dans lequel on écrit les deux objets a une importance ? On admettra le résultat suivant.

Il est aisé de vérifier que deux couples sont égaux si et seulement si leurs projections respectives sont égales. (cf. exercice suivant), ce qui répond à notre besoin. On peut bien sûr imaginer d'autres constructions ensemblistes pour ce faire. Il faut être conscient qu'il ne s'agit ici que d'un simple codage et que maintenant que ce nouvel objet est dans notre arsenal, on peut oublier l'échaffaudage qui a permis sa construction.

On peut facilement généraliser la notion de couple à la notion de \(n\)-uplet \((x_1,x_2,\ldots,x_n)\) en posant* Nous verrons au chapitre 3 la définition de l'écriture indicielle \(x_i\) parachutée par endroit depuis le début de ce cours. \begin{equation} (x_1,x_2,\ldots,x_n):=\{\{x_1\},\{x_1,x_2\},\ldots,\{x_1,x_2,\ldots,x_n\}\}. \end{equation} en utilisant inductivement l'axiome de la paire et l'axiome de la réunion puis en définissant le produit cartésien de \(n\) ensembles \(X_1, X_2,\ldots,X_n\) par \begin{equation} X_1\times X_2\times\cdots\times X_n:=\{(x_1,x_2,\ldots,x_n)\such \forall i\in\{1,\ldots,n\}\ x_i\in X_i\}. \end{equation} On définit alors la \(i\)-ème projection \(\text{pr}_i\) pour tout \(i\in\{1,\ldots,n\}\) et un ensemble \(G\) de \(n\)-uplets est qualifié de \(n\)-graphe.

Un dernier axiome, et nous achèverons là cette introduction à la théorie des ensembles, l'axiome du choix. Cet axiome nous autorise à extraire un élément de notre choix de chaque ensemble d'une famille d'ensembles pour en faire un ensemble, une sorte de menu à la carte. Cet axiome peut être intégré ou non dans la théorie des ensembles, si c'est le cas elle est appelée théorie zfc.

Exemple : Nous ne verrons la définition d'une application qu'au chapitre Relations, applications, mais l'étudiant a déjà été familiarisé avec cet outil mathématique en cours d'analyse. Notons simplement que l'ensemble des applications d'un ensemble \(X\) dans un ensemble \(Y\) est noté* L'ensemble \(X\) est bien en exposant \(Y^X\).

Considérons l'énoncé suivant : \(f\) est une application constante de l'ensemble des réels dans lui-même. On peut l'exprimer plus formellement par l'application \(f\in\R^{\R}\) vérifie la proposition \begin{equation} \label{eq:marmite0} \forall (x_1,x_2)\in\R\times\R\ \ f(x_1)=f(x_2), \end{equation} que l'on condense parfois en \begin{equation*} f\in\R^\R:\quad \forall (x_1,x_2)\in\R\times\R\quad f(x_1)=f(x_2). \end{equation*}

On peut écrire une proposition équivalente à celle de l'énoncé \((\ref{eq:marmite0})\) : \begin{equation} \label{eq:marmite} {\color{#88F}\exists c\in\R}\ \ {\color{orange}\forall x\in\R}\quad f(x)=c. \end{equation}

Attention la proposition \((\ref{eq:marmite})\) n'est pas logiquement équivalente à la proposition \begin{equation} \label{eq:marmite2} {\color{orange}\forall x\in\R}\ \ {\color{#88F}\exists c\in\R}\quad f(x)=c. \end{equation}

La proposition \((\ref{eq:marmite2})\) exprime que tout nombre réel \(x\) admet une image \(c\) dans \(\R\) pour \(f\) qui dépend donc de \(x.\) Il s'agit là d'une tautologie, puisque cette proposition est satisfaite par toute application par définition.

La métaphore suivante devrait aider à le comprendre. Considérons l'expression française Toute marmite a son couvercle. En notant \(M\) l'ensemble des marmites, \(C\) l'ensemble des couvercles et \(P(m,c)\) le prédicat à deux variables dont l'interprétation est \(P(m,c)\) est vrai si et seulement si le couvercle \(m\) est adapté à la marmite \(m\), la proposition suivante a exactement la même tructure que celle de la proposition \((\ref{eq:marmite2})\) : \begin{equation*} {\color{orange}\forall m\in M}\ \ {\color{#88F}\exists c\in C}\quad P(m,c). \end{equation*}

Il est évident que le couvercle \(c\) dépend de la marmite \(m\) considérée. En permutant les quantificateurs, la proposition \begin{equation*} {\color{#88F}\exists c\in C}\ \ {\color{orange}\forall m\in M}\quad P(m,c). \end{equation*} exprime qu'il existe un couvercle qui convient à toutes les marmites, ce qui n'est bien sûr pas la même chose.

Comme tous les énoncés en langue naturelle, il peut y avoir des ambiguïtés donnant lieu à des interprétations différentes, et par conséquent à différentes formalisations. Dans chacun des différents énoncés, il est implicite que l'on s'intéresse à un objet appartenant à un ensemble particulier et qui vérifie une certaine propriété.
Dans ce cas, pour le premier énoncé \(f\) est l'application identité du plan réel dans lui-même, on écrirait que \(f\in{(\R\times\R)}^{\R\times\R}\) et que cette application satisfait la proposition \[\forall(x,y)\in\R\times\R\ f((x,y))=(x,y)\] ce que l'on condense parfois en une expression (informelle) \begin{equation*} f\in{(\R\times\R)}^{\R\times\R}:\ \forall(x,y)\in\R\times\R\ f((x,y))=(x,y). \end{equation*} en séparant la donnée de l'énoncé de la propriété qu'elle satisfait.
On a donc avec les abus de langage usuels : \begin{align*} &(1) & f\in{(\R^2)}^{\R^2} :\quad & \forall (x,y)\in\R^2\ \ f(x,y)=(x,y)\\ &(2) & f\in{(\R^2)}^{\R^2} :\quad & \exists (x,y)\in\R^2\ \ f(x,y)=(x,y)\\ &(3) & f\in{\R}^{\R} :\quad & \exists! x\in\R\ \ f(x)=0\\ &(4) & (f,g)\in({\R}^{\R})^2 :\quad & \forall x\in\R\ \ f(x) > g(x)\\ &(5) & f\in{\R}^{\R} :\quad & \forall x\in\R\ \ f(x)=f(-x)\\ &(6) & f\in{\R}^{\R} :\quad & (\forall x\in\R\ \ f(x)=f(-x))\wedge (\forall (x,y)\in\R^2\ \ x \leqslant y \Rightarrow f(x)\leqslant f(y))\\ &(7) & (u_n)_{n\in\N}\in{\R}^{\N} :\quad & \exists B\in\R\ \forall x\in\R\ \ f(x)\leqslant B\\ &(8) & (u_n)_{n\in\N}\in{\R}^{\N} :\quad & \forall (n,m)\in\N^2\ \ n\leqslant m \Rightarrow u_n\leqslant u_m\\ &(9) & (u_n)_{n\in\N}\in{\R}^{\N} :\quad & \exists N\in\N\ \exists c\in\R\ \forall n\in\N\ \ n > N \Rightarrow u_n=c\\ &(10) & (u_n)_{n\in\N}\in{\R}^{\N} :\quad & \exists k\in\N\ \forall n\in\N\ \ u_{n+k}=u_n\\&(10) & (u_n)_{n\in\N}\in{\R}^{\N} :\quad & \exists k\in\N\ \forall n\in\N\ \ u_{n+k}=u_n\\ &(11) & (u_n)_{n\in\N}\in{\R}^{\N} :\quad & \exists k\in\N\ \exists N\in\N\ \forall n\in\N\ \ n\geqslant N\then u_{n+k}=u_n\\ \end{align*}

Formalisation

Réponse à la question du problème de la médiathèque

On rappelle qu'il s'agit d'étudier comment automatiser la recherche de documents qui satisfont la requête suivante dans une médiathèque : trouver tous les documents qui parlent de robot(s) ou de chat(s)*l’extraction des termes a permis de regrouper les variantes lexicales "robot" / "robots" ou encore "chat" / "chats" sous un même descripteur normalisé., mais qui ne mentionnent pas l'intelligence artificielle.

Définition des prédicats

On définit trois prédicats d'une variable \(d\) représentant un document avec les interprétations suivantes :

La requête exprimée par l’usager se traduit par le prédicat \(P(d)\) suivant sur le corpus \({\mathscr D}\) de documents de la médiathèque :

Calcul

Le travail à fournir se traduit relève à présent de simples opérations ensemblistes

Trois documents correspondent finalement à la requête \(P\) : \[ {\mathscr D}(P)=\{d_1,d_3,d_5\} \]

Perspectives d'automatisation du processus

Bien sûr, on est encore loin de pouvoir réaliser toutes ces opérations automatiquement. Comment sont indexés les termes clefs des documents ? Peut-on traduire automatiquement une requête en langue naturelle sous forme prédicative ? etc.

L’évaluation du prédicat \(P(d)\) sur le corpus \(\mathscr{D}\) repose sur un traitement algorithmique qui peut être schématiquement décomposé en plusieurs étapes :

D’un point de vue calculatoire, cette procédure peut s’exprimer de façon élémentaire en Python sous la forme suivante :

Le Sudoku

\(d\)	\(R(d)\)	\(C(d)\)	\(I(d)\)	\(P(d)\)
\( d_1 \)	❌	✅	❌	✅
\( d_2 \)	✅	❌	✅	❌
\( d_3 \)	✅	✅	❌	✅
\( d_4 \)	❌	✅	✅	❌
\( d_5 \)	✅	❌	❌	✅
\( d_6 \)	❌	❌	✅	❌

Le calcul des prédicats permet de modéliser certains problèmes de manière beaucoup plus concise et expressive que le calcul propositionnel, notamment en évitant la prolifération des variables lorsque les domaines de valeurs sont importants. Considérons par exemple le jeu du Sudoku. Ce jeu solitaire consiste à compléter les cases vierges d'une grille de \(9\) lignes par \(9\) colonnes avec des nombres compris entre 1 et 9 en respectant les règles suivantes :

Les valeurs déjà présentes dans la grille, ont été choisies de manière à ce qu'il n'existe qu'une seule façon de compléter la grille, et le jeu consiste à les trouver. La grille ci-dessous est un exemple de grille à résoudre.

La formalisation du problème du Sudoku se fait avec un langage adapté. Les constantes sont les \(9\) valeurs de l'ensemble \({\mathscr C}:=\{1,2,3,\ldots,9\}\) et on considère des prédicats \(S(l,c,n)\) à trois variables dans l'ensemble \(\def\CC{{\mathscr C}}\CC\) avec l'interprétation suivante : \(S(l,c,n)\) est vrai si et seulement si la case à la ligne d'indice \(l\) et à la colonne d'indice \(c\) contient la valeur \(n.\) C'est bien plus économique que la logique propositionnelle avec laquelle il aurait fallu définir une variable propositionnelle pour chaque valeur possible dans chaque case, soit \(9\times 9\times 9=729\) variables.

On traduit le fait que chaque case contient exactement une valeur par les deux propositions suivantes (la première pour exprimer au moins une valeur, la seconde pour au plus une valeur) :

La partie des règles R1 et R2 disant que chaque nombre apparaît une seule fois par ligne et par colonne s'exprime respectivement par les deux propositions suivantes :

Pour la partie de la règle R3 disant que chaque nombre apparaît au plus une fois par région, c'est un peu plus complexe car les sous-grilles \(3\times 3\) ne sont pas aisément adressables par des indices séparés. On peut régler ce problème de bien des manières. Par exemple en introduisant une fonction auxiliaire \(r:\CC^2\rightarrow\CC\) qui à chaque couple \((l,c)\) associe le numéro de la région où se trouve la case à la ligne \(l\) et à la colonne \(c\), en numérotant les régions de \(1\) à \(9\) dans l'ordre de lecture par exemple. On aurait alors \begin{align*} &\forall (l,l',c,c',n)\in\CC^5\quad S(l,c,n)\wedge S(l',c',n)\wedge r(l,c)=r(l',c')\then (l,c)=(l',c'). \end{align*}

Chacun des \(24\) indices fournis dans la grille au départ se traduit par une instanciation \(S(l,c,n) = V\) pour la valeur \(n\) affectée à la ligne \(l\) et la colonne \(c\), par exemple ici \(S(2,5,2)=V\) ou encore \(S(3,7,5)=V\).

Travaux pratiques

L'objectif de ces travaux pratiques est de réaliser un script qui lit une grille de Sudoku codée dans un fichier texte et tente de la compléter. Les indices dans la grille sont codés par les caractères 1 à 9 et les cases vides dont les valeurs sont à découvrir sont codées par le symbole point. Cliquez pour télécharger ce fichier exemple dans le répertoire où vous écrirez votre script.

Pour lire le contenu d'un fichier, il faut tout d'abord créer un fichier logique en l'associant à un fichier physique pour une lecture (read). C'est la fonction open qui réalise cette opération. Le nom du fichier et le mode d'accès à ce fichier (ici en lecture) sont codés par des chaînes de caractères. On récupère ensuite très facilement le contenu du fichier en créant la liste des chaînes de caractères constituées par chacune des lignes du fichier, grâce à la méthode readlines(), puis on ferme le fichier avec la méthode close() (en réalité, on indique au système que l'accès à ce fichier est à nouveau libre).

      fichier = open("nom_du_fichier","r")
      liste = fichier.readlines()
      fichier.close()

Attention, le dernier caractère de chaque chaîne de caractères de la liste est le caractère invisible retour charriot puisqu'il est présent à la fin de chaque ligne d'un fichier texte. On peut s'en débarrasser à l'aide de la méthode rstrip(), qui élimine tous les caractères de type espacement en fin d'une chaîne : chaine.rstrip().

On découpe une chaîne de caractères chaine suivant un séparateur sep (une chaîne de caractère également, par défaut un espace) grâce à la méthode split(sep) (chaine.split(sep)) qui renvoie la liste des sous-chaînes séparées par la chaîne sep. Par exemple, l'exécution des instructions

    chaine = "maths:en:folie"
    print(chaine.split(":"))

affichera la liste

  ["maths","en","folie"]

Un ensemble s'écrit comme en mathématique, par exemple {a,b} est la paire constituée de a et de b. Malheureusement l'initialisation d'un ensemble \(X\) à l'ensemble vide qui devrait s'écrire naturellement X = {} n'est pas possible car c'est la syntaxe réservée à la création d'un dictionnaire vide, il faut plutôt écrire X = set(). On rajoute un élément x à un ensemble X à l'aide de l'instruction X.add(x) et on élimine un élément x d'un ensemble X à l'aide de l'instruction X.discard(x). Les opérations ensemblistes de réunion, d'intersection, de différence, de différence symétrique sont codées respectivement |, &, -, ^ en Python. Exemple : {a,c} | {a,b,d} est l'ensemble {a,b,c,d} et {a,c} & {a,b,d} est le singleton {a}.

En séance

Écrivez une fonction LireGrille(nomfichier) qui lit la grille dans le fichier dont le nom est passé en paramètre de cette fonction et qui renvoie une liste de 9 listes contenant chacune les 9 valeurs sur une ligne.

Écrivez une procédure AfficherGrille(grille) qui affiche la grille passée en paramètre sous forme de tableau en séparant les 9 régions* Le ? n'apparaît à la place d'un . que pour illustrer la question 4 :

9 . . | . 7 . | 3 . .
  . 1 5 | . 2 . | . 4 6
  . . 8 | 6 . . | 2 5 .
  ------+-------+------
  4 6 ? | 1 8 2 | . . .
  . 7 9 | . . . | 8 3 .
  . . . | 9 3 7 | . 6 2
  ------+-------+------
  . 3 7 | . . 1 | 5 . .
  1 8 . | . 5 . | 6 9 .
  . . 4 | . 6 . | . . 3

Écrivez une fonction Inconnues(grille) qui renvoie le tuple des coordonnées des cases de la grille passée en paramètre qui ne sont pas des indices.

Écrivez les deux fonctions LibreL(ligne) et LibreC(colonne) qui renvoient respectivement l'ensemble des valeurs encore libres sur la ligne et la colonne. Pour la grille de l'exemple à la ligne 4 et la colonne 2 (on numérote à partir de 0) marquée par un point d'interrogation, ces deux fonctions renvoient respectivement les ensembles {3,5,7,9} et {1,2,3,6}.

Écrivez une fonction LibreR(ligne, colonne) qui renvoie l'ensemble des valeurs encore libres dans la région qui contient la case en (ligne,colonne). Pour la même case de coordonnées (3,2) de la question précédente, la fonction renvoie l'ensemble {1,2,3,5,8}. Indication : pour pouvoir parcourir toutes les cases de cette région, partez des coordonnées de celle dans son angle supérieur gauche obtenues à l'aide de divisions euclidiennes.

Écrivez la fonction Libre(ligne, colonne), qui renvoie l'ensemble des valeurs encore libres dans la case de coordonnées (ligne,colonne) à l'aide des trois fonctions précédentes. Pour la grille de l'exemple et la case de coordonnées (4,2), la fonction renvoie l'ensemble \[{\color{#FF8}\{3\}}=\{3,5,7,9\}\cap\{1,2,3,6\}\cap\{1,2,3,5,8\}.\]

Écrivez une fonction MAJ(grille), qui met à jour toutes les cases de coordonnées (ligne,colonne) pour lesquelles la fonction Libre a renvoyé un singleton— signifiant qu'une seule valeur y est possible — en remplaçant la valeur inconnue par celle contenue dans ce singleton. La fonction devra renvoyer un booléen indiquant s'il y a eu ou non une ou des valeurs dévoilées dans la grille.

Compléments hors séance

Écrivez une fonction Completer(grille), qui utilise les fonctions précédentes pour tenter de compléter la grille de Sudoku passée en paramètre et qui recommence tant que de nouvelles valeurs sont dévoilées. Testez votre script sur l'exemple ci-dessus ainsi que celui donné dans le cours.

La procédure de complétion proposée jusqu’ici suppose qu’à chaque itération, au moins une nouvelle case peut être remplie de manière certaine, c’est-à-dire que l'ensemble de ses possibilités est réduit à un seul élément. Cependant, certaines grilles de Sudoku nécessitent d’envisager plusieurs hypothèses successives et de revenir en arrière en cas d’erreur :

. 2 . | . 7 . | 3 . .
  . . . | . 3 8 | 9 1 .
  . . . | . 5 . | . . .
  ------+-------+------
  . . . | . . . | . . .
  . 3 4 | 5 6 . | . . .
  . . . | . . . | . . .
  ------+-------+------
  . 9 2 | . . . | . . .
  . . . | . 9 7 | 1 . .
  . . . | . . . | . . 3

Testez votre code sur le sudoku ci-dessus. Vérifiez que sur cette grille, pour chacune des cases encore indéterminées, l’ensemble des valeurs possibles contient au moins deux éléments. Expliquez comment l'on pourrait procéder pour poursuivre la résolution de cette grille.

Logique des prédicats, théorie des ensembles

Introduction à la théorie des ensembles

La médiathèque