Présentation du problème.
On se donne un anneau intègre \(A\) muni de ses lois additive \(+\) et multiplicative \(\times\) d'éléments neutres respectifs notés \(0\) et \(1\) et supposés distincts. L'anneau est commutatif et n'admet aucun diviseur de \(0\).
Un polynôme à coefficients dans \(A\) est défini comme une suite \(({\color{yellow}a_k})_{k\in\N}\) d'éléments de \(A\) nulle à partir d'un certain rang : \[\exists N\in\N\ \ \forall n\in\N\quad n\geq N\then a_n=0. \] Les valeurs \(a_k\) sont appelés les coefficients du polynôme. Si \(\forall k\in\N\ a_k=0\), le polynôme est appelé polynôme nul. On appelle degré d'un polynôme non-nul, le plus grand indice \(k\in\N\) tel que \(a_k\neq 0\). Si un seul terme \(a_k\) n'est pas nul, le polynôme est appelé monôme de degré \(k\). La structure adaptée pour coder un polynôme de degré \(d\) est donc typiquement une liste de longueur \(d+1\).
On exprime généralement un polynôme \(P\) de degré \(n\) à l'aide d'une somme formelle faisant intervenir une indéterminée, à savoir un symbole \(X\) : \begin{equation}\label{exp} P(X) = {\color{yellow}a_0} + {\color{yellow}a_1}X + {\color{yellow}a_2}X² + \cdots + {\color{yellow}a_{n-1}}X^{n-1} + {\color{yellow}a_n}X^n. \end{equation} À l'aide des opérations de l'anneau \(A\), on munit l'ensemble des polynômes à coefficients dans \(A\) de trois opérateurs, une addition et une multiplication internes \(+\) et \(\times\), et une multiplication externe \(\cdot\) sur \(A\). Notons \(I_k:=\ab{0}{k}\). Soit \(P\) et \(Q\) deux polynômes de degrés respectifs \(n\) et \(m\) et de coefficients \((a_i)\) et \((b_j)\) et \(a\in A\) : \begin{align*} P(X)+Q(X)&:=\sum_{\ell\in I_{\max\{n,m\}}}({\color{yellow}a_\ell+b_\ell})X^\ell,\\ P(X)\times Q(X)&:=\sum_{\ell\in I_{nm}} \Big(\sum_{\overset{\scriptstyle(i,j)\in I_n\times I_m}{i+j=\ell}} {\color{yellow}a_ib_j}\Big)X^\ell\\ a\cdot P(X)&:=\sum_{i\in I_n}(a.{\color{yellow}a_i})X^i. \end{align*}
On veut calculer efficacement l'image \(P(x)\) d'un élément \(x\in A\) par une fonction polynomiale associée à un polynôme \(P\) de degré \(n\).
L'écriture du polynôme suggère de procéder itérativement en sommant chacun des monômes évalué en \(x\), ce qui implique de calculer à chaque fois une exponentielle ce qui peut être évité comme nous le verrons à la section suivante.
L'algorithme.
La méthode dite de la factorisation de Horner (qui n'est pas réellement une factorisation au sens usuel) consiste à écrire le polynôme \(P(X)\) sous la forme \({\color{#46F}P_1(X)}.X+a_0\) et à répéter cette opération pour le polynôme \(P_1(X)\) de degré \(n-1\) et ainsi de suite jusqu'au polynôme constant \({\color{yellow}P_{n}(X)}={\color{yellow}a_n}\) qui achève le processus : \begin{align*} P(X) &= \big({\color{#46F}a_nX^{n-1} + a_{n-1}X^{n-2} + \cdots + a_2X+a_1}\big)X+a_0\\ &= \big((a_nX^{n-2} + a_{n-1}X^{n-3} + \cdots + a_2)X+a_1\big)X+a_0\\ &\ \,\vdots\\ &= \Big(\big(\ldots({\color{#FF0}a_n}X + a_{n-1})X + a_{n-2})X + \cdots + a_2\big)X+a_1\Big)X+a_0 \end{align*}
On peut construire cette suite de polynômes \(P_k(X)\) par la relation de récurrence suivante, où le premier terme \(P_0(X)\) de la suite est défini par le polynôme \(P(X)\) : \begin{align}\label{rec} P_k(X):= \begin{cases} P(X),&\text{si}\ k=0.\\ \frac{1}{X}(P_{k-1}(X)-a_{k-1}),&\text{si}\ 1\leq k \leq n. \end{cases} \end{align}
L'algorithme itératif de Horner consiste à remonter le processus défini par la relation de récurrence \((\ref{rec})\) en partant du polynôme constant \(P_n=a_n\). On évalue alors à chaque étape une fonction affine dont le résultat devient le coefficient du monôme \(X\) pour la suivante.
Horner(P,x):valeur DONNÉES P[0:n]: liste de n + 1 valeurs dans un anneau A x: réel VARIABLES R: valeur i: entier DEBUT R ← 0 i ← 0 TQ (i ≤ n) FAIRE R ← R * x + P[n - i] i ← i + 1 FTQ RENVOYER R fin
Complexité.
Pour les mêmes raisons que pour l'exponentiation, c'est le coût en nombre de multiplications qui va nous intéresser, nous faisons donc l'hypothèse que les valeurs sont bornées ce qui nous évite d'intégrer le coût de ces opérations (le tp sur le calcul multiprécision a pour objet de mettre en évidence que cette hypothèse n'est pas toujours pertinente). Étudions brièvement le cas de l'algorithme naïf ci-dessous au préalable:
EvalNaive(P,x):valeur données P: liste de n + 1 valeurs dans un anneau A x: réel variables R: valeur i: entier debut R ← P[0] i ← 1 TQ (i ≤ n) FAIRE R ← R + P[i] * Exp(x,i) i ← i + 1 FTQ retourner R fin
Cet algorithme est basé sur une boucle qui calcule chaque terme \(a_kX^k\) du polynôme \(P(X)\) et l'additionne aux résultats qui précèdent. L'évaluation de ce terme demande exactement \(k\) produits dont \(k-1\) pour l'exponentiation Exp (en supposant qu'elle se fait naïvement elle aussi) et \(1\) pour multiplier le coefficient. On a donc au total:
Le nombre de multiplications effectuées dans l'algorithme de Horner est \(n+1\) puisqu'il n'y a qu'une seule opération de multiplication dans la boucle et que l'on y passe \(n+1\) fois. Finalement, on passe d'une complexité quadratique en nombre de multiplications avec l'algorithme naïf à une complexité linéaire. L'exercice montre que l'utilisation de l'algorithme square & multiply donnerait une complexité en \(n\log_2 n\), donc intermédiaire entre les deux.
Travaux pratiques
On se propose de comparer trois algorithmes pour évaluer une fonction polynomiale \(P\) en \(a\). Chacun des trois algorithmes suivants doit renvoyer non seulement la valeur \(P(a)\) mais également le nombre de multiplications effectuées pour l'obtenir. Le langage est le \(C\).
Pour cet exercice, les couples \((n,T(n))\) doivent être rangés sur deux colonnes dans un fichier texte (sans parenthèse, ni virgule, l'espacement faisant office de séparateur entre \(n\) et \(T(n)\)). Pour tracer les trois courbes simultanément dans la même fenêtre graphique, sous l'environnement gnuplot, lancez la commande plot NomFichier1, puis replot NomFichier2 et replot NomFichier3.
Les données des trois fonctions de complexité sont à générer automatiquement dans des fichiers textes à l'aide d'un programme, pas à la main! De la même manière, on écrira le script gnuplot dans un fichier intitulé comparer-eval.gnu dont la dernière commande sera pause -1 afin de conserver l'affichage des trois courbes à l'écran. Le lancement du script se fait sous un terminal avec la commande gnuplot comparer-eval.gnu.