Évaluer un polynôme est une situation extrêmement courante en informatique, ce qui explique l’importance que l’on accorde à l’algorithme de William George Horner, somme toute très simple. Il ne faut pas perdre de vue qu’in fine, les algorithmes sont exécutés sur des machines dont les opérations élémentaires se réduisent essentiellement à des combinaisons d’additions et de multiplications. Or, ces deux lois de composition sont précisément celles qui structurent l’expression d’un polynôme.
Le procédé de Hörner, en réécrivant le polynôme sous une forme factorisée et hiérarchisée, met en évidence cette structure de manière particulièrement élégante. Il offre une manière naturelle et systématique d’évaluer un polynôme.
Au-delà de son apparente simplicité, cette méthode illustre parfaitement la manière dont une expression symbolique est transformée en processus calculatoire rigoureux et fiable. Elle met en lumière le lien étroit entre l’algèbre formelle et la pratique algorithmique : comprendre la structure d’un objet mathématique conduit à une mise en œuvre rationnelle.
Enfin, il faut souligner que la portée de ce type d’algorithme dépasse très largement le cadre de la simple évaluation d’un polynôme donné. Dans de nombreux domaines — qu’il s’agisse d’approximer des fonctions analytiques (par des développements limités), de décrire des formes géométriques (courbes de Bézier, splines), ou encore de modéliser des phénomènes physiques ou statistiques —, on ramène les objets étudiés à des expressions polynomiales pour bénéficier de la simplicité et de l’efficacité du calcul qui leur est associé. Le schéma de Hörner s’inscrit ainsi au cœur d’une idée fondamentale : dans la pratique du calcul scientifique comme dans celle de la modélisation numérique, une grande partie des problèmes se ramènent, tôt ou tard, à un calcul polynomial.
On se donne un anneau intègre \(A\) muni de ses lois additive \(+\) et multiplicative \(\times\) d'éléments neutres respectifs notés \(0\) et \(1\) et supposés distincts.
Un polynôme à coefficients dans \(A\) est défini comme une suite \(({\color{orange}a_k})_{k\in\N}\) d'éléments de \(A\) nulle à partir d'un certain rang : \begin{equation} \exists N\in\N\ \ \forall n\in\N\quad n\geqslant N\then a_n=0. \end{equation} Si \(\forall k\in\N\ a_k=0,\) le polynôme est appelé polynôme nul. On appelle degré d'un polynôme non-nul, le plus grand indice \(k\in\N\) tel que \(a_k\neq 0\) et les valeurs \((a_i)_{i=0}^k\) sont appelées coefficients du polynôme. Si un seul coefficient \(a_d\) n'est pas nul, le polynôme est appelé monôme de degré \(d\). La structure adaptée pour coder un polynôme de degré \(n\) est donc typiquement une liste de longueur \(n+1\).
On exprime généralement un polynôme \(P\) de degré \(n\) à l'aide d'une somme formelle faisant intervenir une indéterminée, à savoir un symbole \(X\) : \begin{equation}\label{exp} P(X) = {\color{orange}a_0} + {\color{orange}a_1}X + {\color{orange}a_2}X² + \cdots + {\color{orange}a_{n-1}}X^{n-1} + {\color{orange}a_n}X^n. \end{equation} À l'aide des deux lois de composition \(+\) et \(\times\) de l'anneau \(A,\) on munit l'ensemble des polynômes à coefficients dans \(A\) de trois lois, une addition et une multiplication internes \(+\) et \(\times,\) (on conserve les mêmes symboles par commodité) et une multiplication externe \(\cdot\) sur \(A\). Notons \(I_k:=\ab{0}{k}\). Soit \(P\) et \(Q\) deux polynômes de degrés respectifs \(n\) et \(m\) et de coefficients \((a_i)_{i=0}^n\) et \((b_j)_{j=0}^m\) et \(a\in A\) : \begin{align*} \text{Addition interne :}&\quad P(X)+Q(X):=\sum_{\ell\in I_{\max\{n,m\}}}({\color{orange}a_\ell+b_\ell})X^\ell.\\ \text{Produit interne :}&\quad P(X)\times Q(X):=\sum_{\ell\in I_{n+m}} \Big(\sum_{\overset{\scriptstyle(i,j)\in I_n\times I_m}{i+j=\ell}} {\color{orange}a_ib_j}\Big)X^\ell.\\ \text{Produit externe :}&\quad a\cdot P(X):=\sum_{i\in I_n}(a.{\color{orange}a_i})X^i. \end{align*}
On vérifie que l'ensemble des polynômes est ainsi équipé d'une structure d'anneau héritée de \(A.\) On l'appelle anneau des polynômes à coefficients dans \(A\) et on le note \(A[X]\). On peut à présent définir la fonction polynomiale \(P:A\to A\) associée à un polynôme \(P\) de coefficients \((a_i)_{i=0}^n\) et de degré \(n\) par : \begin{equation} x\mapsto \sum_{i=0}^n{\color{orange}a_i}x^i. \end{equation}
Nous pouvons à présent considérer la question suivante : Comment calculer efficacement l'image \(P(x)\) d'un élément \(x\in A\) par une fonction polynomiale associée à un polynôme \(P\) de degré \(n\) ?
L'écriture du polynôme suggère de procéder itérativement en sommant chacun des monômes évalué en \(x,\) ce qui implique de réaliser à chaque fois une exponentiation, ce qui peut être évité comme nous le verrons à la section suivante.
La méthode dite de la factorisation de Horner (qui n'est pas réellement une factorisation au sens usuel) consiste à écrire le polynôme \(P(X)\) sous la forme \({\color{steelblue}P_1(X)}.X+a_0\) et à répéter cette opération pour le polynôme \(P_1(X)\) de degré \(n-1\) et ainsi de suite jusqu'au polynôme constant \({\color{orange}P_{n}(X)}={\color{orange}a_n}\) qui achève le processus : \begin{align*} P(X) &= \big({\color{steelblue}a_nX^{n-1} + a_{n-1}X^{n-2} + \cdots + a_2X+a_1}\big)X+a_0\\ &= \big((a_nX^{n-2} + a_{n-1}X^{n-3} + \cdots + a_2)X+a_1\big)X+a_0\\ &\ \,\vdots\\ &= \Big(\big(\ldots({\color{orange}a_n}X + a_{n-1})X + a_{n-2})X + \cdots + a_2\big)X+a_1\Big)X+a_0 \end{align*}
On peut construire cette suite de polynômes \(P_k(X)\) par la relation de récurrence suivante, avec \(P_0(X):=P(X)\) et \begin{align}\label{eq:rec} \forall k\in\ab{0}{n-1}\quad P_{k+1}(X):=\frac{P_{k}(X)-a_{k}}{X}. \end{align}
L'algorithme itératif de Horner consiste à remonter le processus défini par la relation de récurrence \((\ref{eq:rec})\) en partant du polynôme constant \(P_n=a_n\). On évalue alors à chaque étape une fonction affine dont le résultat devient le coefficient du monôme \(X\) pour la suivante.
ALGORITHME Horner(P,x):valeur
DONNEES
P[0:n]: liste de n + 1 valeurs dans un anneau A
x: valeur
VARIABLES
R: valeur
i: entier
DEBUT
R ← 0
i ← 0
TQ (i ≤ n) FAIRE
R ← R * x + P[n - i]
i ← i + 1
FTQ
RENVOYER R
fin
Pour les mêmes raisons que pour l'exponentiation, c'est le coût en nombre de multiplications qui va nous intéresser, nous faisons donc l'hypothèse que les valeurs sont bornées ce qui nous évite d'intégrer le coût de ces opérations (le tp sur le calcul multiprécision a pour objet de mettre en évidence que cette hypothèse n'est pas toujours pertinente). Étudions brièvement le cas de l'algorithme naïf ci-dessous au préalable:
ALGORITHME EvalNaive(P,x):valeur
DONNEES
P: liste de n + 1 valeurs dans un anneau A
x: réel
VARIABLES
R: valeur
i: entier
DEBUT
R ← P[0]
i ← 1
TQ (i ≤ n) FAIRE
R ← R + P[i] * Exp(x,i)
i ← i + 1
FTQ
RENVOYER R
FIN
Cet algorithme est basé sur une boucle qui calcule chaque terme \(a_kX^k\) du polynôme \(P(X)\) et l'additionne aux résultats qui précèdent. L'évaluation de ce terme demande exactement \(k\) produits dont \(k-1\) pour l'exponentiation Exp (en supposant qu'elle se fait naïvement elle aussi) et \(1\) pour multiplier le coefficient. On a donc au total:
Le nombre de multiplications effectuées dans l'algorithme de Horner est \(n+1\) puisqu'il n'y a qu'une seule opération de multiplication dans la boucle et que l'on y passe \(n+1\) fois. Finalement, on passe d'une complexité quadratique en nombre de multiplications avec l'algorithme naïf à une complexité linéaire. L'exercice montre que l'utilisation de l'algorithme square & multiply donnerait une complexité en \(n\log_2 n,\) donc intermédiaire entre les deux.
On se propose de comparer trois algorithmes pour évaluer une fonction polynomiale \(P\) en \(a\). Chacun des trois algorithmes suivants doit renvoyer non seulement la valeur \(P(a)\) mais également le nombre de multiplications effectuées pour l'obtenir. Le langage est le \(C\).
Pour cet exercice, les couples \((n,T(n))\) doivent être rangés sur deux colonnes dans un fichier texte (sans parenthèse, ni virgule, l'espacement faisant office de séparateur entre \(n\) et \(T(n)\)). Pour tracer les trois courbes simultanément dans la même fenêtre graphique, sous l'environnement gnuplot, lancez la commande plot NomFichier1, puis replot NomFichier2 et replot NomFichier3.
Les données des trois fonctions de complexité sont à générer dans des fichiers textes à l'aide d'un programme, pas à la main… De la même manière, écrivez le script gnuplot dans un fichier intitulé comparer-eval.gnu dont la dernière commande sera pause -1 afin de conserver l'affichage des trois courbes à l'écran. Le lancement du script se fait dans un terminal : gnuplot comparer-eval.gnu