[Traduit par Mathias Valla and Grant Sanderson. Soumettez des corrections sur criblate.com] « Pour moi, les mathématiques sont un ensemble d'exemples;
un théorème est une affirmation concernant un ensemble d'exemples et le but de prouver des théorèmes est de classer et d'expliquer les exemples. » John B.
Conway Quand j'ai découvert les séries de Taylor, j'étais loin de me rendre compte à quel point elles sont importantes.
Mais encore et encore, elles reviennent en maths, en physique, et dans plein de domaines d'ingénierie, parce que c'est un des
outils les plus puissants des maths pour approximer des fonctions. Je crois que mon premier vrai déclic, c'était pas en cours d'analyse,
mais en cours de physique. On étudiait un problème sur l'énergie potentielle d'un pendule,
et pour ça il faut une formule pour la hauteur du poids du pendule au-dessus de son point le plus bas, et quand on calcule ça,
c'est proportionnel à 1 - cos(theta), où theta est l'angle entre le pendule et la verticale.
Les détails du problème dépassent un peu le sujet ici, mais ce cosinus rendait tout lourd et pénible,
et ça masquait le lien avec d'autres phénomènes oscillants. Mais si on approxime cos(theta) par 1 - theta^2/2,
tout se mettait à bien fonctionner d'un coup, comme par magie. Si vous n'avez jamais vu un truc comme ça, une
approximation pareille peut sembler venir de nulle part. Si on trace cos(theta) avec la fonction 1 - theta^2/2, elles ont l'air assez proches,
au moins pour les petits angles près de 0, mais comment on penserait à faire cette approximation, et comment trouver exactement ce terme de second degré ?
Les séries de Taylor, c'est surtout prendre des fonctions non polynomiales et trouver des polynômes qui les approximent près d'une certaine valeur de x.
L'idée, c'est que les polynômes sont bien plus faciles à manipuler que les autres fonctions : plus faciles à calculer, plus faciles à dériver, à intégrer, bref,
bien plus sympas. Donc regardons cette fonction, le cosinus de x,
et prenons un moment pour voir comment construire une approximation quadratique, de degré 2, près de x = 0.
Autrement dit, parmi tous les polynômes du type c0 + c1 x + c2 x^2, pour certains choix de ces constantes, c0, c1 et c2,
trouvons celui qui ressemble le plus à cos(x) près de x = 0, dont le graphe vient presque se blottir contre celui de cos(x) en ce point.
Déjà, en x = 0, la valeur de cos(x) vaut 1, donc si notre approximation veut être un minimum correcte, elle doit aussi valoir 1 pour x = 0.
En remplaçant x par 0, on obtient juste c0, donc on pose c0 = 1. Ça nous laisse libres de choisir c1 et c2 pour rendre l'approximation aussi
bonne que possible, mais quoi qu'on fasse, le polynôme restera égal à 1 en x = 0. Ce serait mieux si elle avait leur tangente en ce point,
qui avait la même pente celle de cos(x). Sinon, l'approximation s'éloignerait du graphe du cosinus bien plus vite que nécessaire.
La dérivée du cosinus, c'est -sinus, et en x = 0, ça vaut 0 : la tangente est donc parfaitement horizontale.
De l'autre côté, quand on dérive notre formule quadratique, on obtient c1 + 2 c2 x. En x = 0, ça vaut juste la valeur de c1 qu'on choisit,
Donc cette constante c1 contrôle entièrement la dérivée de notre approximation près de x = 0.
La fixer égale à 0 garantit que notre approximation a aussi une tangente horizontale en ce point.
Ça nous laisse libres de changer c2, mais la valeur et la pente de notre polynôme en x = 0 sont verrouillées pour coller à celles du cosinus.
Dernier truc à exploiter : le graphe du cosinus se courbe vers le bas au-dessus de x = 0 : la dérivée seconde est négative.
Autrement dit, même si le taux de variation vaut 0 en ce point, ce taux de variation diminue dans son voisinage.
Plus précisément, comme sa dérivée est -sin(x), sa dérivée seconde est -cos(x), et en x = 0, ça vaut -1.
Comme on voulait que la dérivée de notre approximation colle à celle du cosinus pour éviter qu'elles s'écartent trop vite, faire coïncider aussi les dérivées
secondes garantit qu'elles se courbent au même rythme, ça garantit que la pente de notre polynôme ne s'écarte pas de celle de cos(x)
plus vite que nécessaire. On reprend la dérivée d'avant, et on la dérive encore :
la dérivée seconde de ce polynôme, c'est exactement 2 fois c2. Donc pour que cette dérivée seconde vaille aussi -1 en x = 0,
2c2 doit valoir -1, donc c2 doit valoir -1/2. On obtient l'approximation : 1 + 0x - x^2/2.
Pour voir si c'est bon, si on estime cosinus de 0,1 avec ce polynôme, on trouve 0,995, et c'est exactement le cosinus de 0,1.
C'est une super approximation ! Prenez un instant pour réfléchir à ce qui vient de se passer.
Avec cette approximation quadratique, on avait 3 degrés de liberté : les constantes c0, c1 et c2.
c0 servait à faire coïncider la valeur de l'approximation avec cos(x) en x = 0 ; c1 faisait coïncider les dérivées en ce point,
et c2 faisait coïncider les dérivées secondes. Ça garantit que la façon dont l'approximation change quand on s'éloigne de x = 0,
et la façon dont ce taux de variation change lui-même, ressemble au mieux au comportement de cos(x), vu le contrôle qu'on a.
On peut se donner plus de contrôle en ajoutant plus de termes dans le polynôme, et en faisant coïncider des dérivées d'ordre plus élevé.
Par exemple, imaginons qu'on ajoute un terme c3 x^3, pour une constante c3. Dans ce cas, si on prend la troisième dérivée d'un polynôme cubique,
tout ce qui est quadratique ou moins devient 0. Et pour ce dernier terme, après trois applications de la
règle de dérivation des puissances, ça donne 1×2×3×c3. De l'autre côté, la dérivée troisième de cos(x) est sin(x), qui vaut 0 en x = 0.
Donc pour faire coïncider les dérivées troisièmes, il faut fixer c3 = 0. Autrement dit, non seulement 1 - x^2/2 est la meilleure approximation
quadratique du cosinus, mais c'est aussi la meilleure approximation cubique. On peut faire mieux en ajoutant un terme d'ordre 4 : c4 fois x^4.
La quatrième dérivée de cos(x), c'est cos(x), donc ça vaut 1 en x = 0. Et la quatrième dérivée de notre polynôme avec ce nouveau terme ?
Eh bien, quand on applique la règle de dérivation des puissances encore et encore, avec ces exposants qui viennent systématiquement se mettre devant le x,
on finit avec 1×2×3×4×c4, donc 24×c4. Donc si on veut que ça colle à la quatrième dérivée de cos(x),
qui vaut 1, il faut que c4 vaille 1/24. Et en effet, le polynôme 1 - x^2/2 + x^4/24, qui ressemble à ça,
approxime très bien cos(x) autour de x = 0. Dans un problème de physique avec le cosinus d'un petit angle, par exemple,
les prédictions seraient presque indistinguables si on remplaçait ce polynôme à la place de cos(x).
Maintenant, prenons du recul et remarquons deux-trois trucs dans ce processus. D'abord, les factorielles apparaissent très naturellement ici.
Quand on prend n dérivées successives de la fonction x^n, en laissant la règle de dérivation des puissances se dérouler à chaque étape,
il reste 1×2×3×… et ça continue jusqu'à ce qu'on arrive à n. Donc on ne fixe pas juste les coefficients égaux à la dérivée qu'on vise :
il faut diviser par la bonne factorielle pour annuler cet effet. Par exemple, le coefficient de x^4 venait de la quatrième dérivée de cos(x),
qui vaut 1, mais divisée par 4!, c'est-à-dire 24. Deuxième chose à remarquer : ajouter de nouveaux termes, comme ce c4 x^4,
ne dérègle pas ce que doivent être les anciens termes, et ça, c'est vraiment crucial. Par exemple, la dérivée seconde de ce polynôme en x = 0 vaut toujours 2 fois le
coefficient du terme en x^2, même après avoir ajouté des termes d'ordre supérieur. Ça c'est parce qu'on remplace x par 0, donc la dérivée seconde de n'importe
quel terme d'ordre supérieur, qui contient toujours un x, s'annule. Et c'est pareil pour n'importe quelle autre dérivée :
c'est pour ça que chaque dérivée d'un polynôme en x = 0 est contrôlée par un seul et unique coefficient.
Si au lieu de ça on approchait près d'une valeur autre que 0, par exemple x = π, pour avoir le même effet il faudrait écrire le polynôme en puissances de (x - π),
ou de (x - a) si on veut généraliser, bref autour du point qu'on regarde. Ça a l'air nettement plus compliqué, mais en gros on fait comme si,
localement, π jouait le rôle de 0, pour que remplacer x par π provoque plein d'annulations sympas et ne laisse qu'une seule constante.
Et enfin, de façon plus “philosophique”, remarquez qu'ici on est surtout en train de prendre des infos sur des dérivées d'ordre élevé en un point,
et de les convertir en infos sur la valeur de la fonction près de ce point. On peut dériver cos(x) autant de fois qu'on veut.
Ça suit un joli cycle : cos(x), -sin(x), -cos(x), sin(x), puis ça recommence. Et la valeur de chacune est facile à calculer en x = 0.
Ça donne le cycle 1, 0, -1, 0, puis ça recommence. Et connaître toutes ces valeurs de dérivées d'ordre élevé,
c'est énormément d'infos sur cos(x), alors que ça ne demande que de remplacer x par un seul nombre : 0.
Donc on exploite cette info pour obtenir une approximation autour de cette valeur, en construisant un polynôme dont les dérivées successives d'ordre élevé sont
faites pour coller à celles du cosinus, en suivant le même cycle 1, 0, -1, 0. Et pour ça, il suffit de faire en sorte que chaque coefficient du polynôme
suive ce même motif, mais il faut diviser chaque terme par la bonne factorielle. Comme je l'ai dit, c'est ça qui annule l'effet en
cascade de la règle de dérivation des puissances. Les polynômes qu'on obtient en s'arrêtant n'importe quand :
ce sont les polynômes de Taylor de cos(x). Plus généralement, et donc plus abstraitement,
si on avait une autre fonction que le cosinus, on calculerait sa dérivée, sa dérivée seconde, et ainsi de suite, autant de termes qu'on veut,
et on évaluerait chacune d'elles en x égal 0. Ensuite, pour l'approximation polynomiale, le coefficient du terme en x^n devrait être la
valeur de la n-ième dérivée de la fonction évaluée en 0, mais divisée par n factorielle. Cette formule est un peu abstraite, vous allez sûrement la voir dans
n'importe quel cours ou bouquin qui parle de polynômes de Taylor. Et quand vous la voyez, dites-vous que le terme constant garantit que la valeur du
polynôme colle à la valeur de f, le terme suivant garantit que la pente du polynôme colle à la pente de la fonction en x = 0, le suivant que la façon dont la pente
change est la même en ce point, et ainsi de suite, selon combien de termes on prend. Et plus on ajoute de termes, plus on se rapproche,
mais en échange, le polynôme devient plus compliqué. Et pour généraliser encore, si on veut approximer près d'une valeur autre que 0,
qu'on va appeler a, on écrit ce polynôme en puissances de x - a, et on évalue toutes les dérivées de f en ce point, a.
Voilà à quoi ressemblent les polynômes de Taylor dans toute leur généralité. Changer la valeur de a change l'endroit où cette approximation se colle à la fonction
d'origine, où ses dérivées d'ordre élevé sont égales à celles de la fonction d'origine. Un des exemples les plus simples qui ait du sens, c'est la fonction e^x autour de x = 0.
Calculer les dérivées, c'est super agréable, c'est vraiment le top, parce que la dérivée de e^x, c'est elle-même,
donc la dérivée seconde aussi, la troisième aussi, et ainsi de suite. Donc au point x = 0, toutes valent 1.
Et ça veut dire que notre approximation polynomiale, elle doit ressembler à quelque chose comme 1 + x + x^2/2 + x^3/3!,
et ainsi de suite, en fonction du nombre de termes qu'on veut bien sûr. Ça, ce sont les polynômes de Taylor de e^x.
OK, avec tout ça en tête, dans l'idée de vous montrer à quel point tous les sujets d'analyse sont très liés, je vais passer à un truc assez fun,
une autre façon de comprendre le terme d'ordre 2 des polynômes de Taylor, mais cette fois géométriquement.
En fait c'est lié au théorème fondamental de l'analyse, dont j'ai parlé aux chapitres 1 et 8, si vous voulez un rappel.
Comme dans ces vidéos, on considère une fonction qui donne l'aire sous une courbe, entre un point fixe à gauche et un point variable à droite.
Ce qu'on va faire ici, c'est voir comment approximer cette fonction aire, pas la fonction de la courbe elle-même, comme on faisait avant.
Se concentrer sur cette aire, c'est ça qui va faire ressortir le terme d'ordre 2. Rappelez-vous : le théorème fondamental de l'analyse dit que cette courbe représente
la dérivée de la fonction de l'aire, parce qu'un petit décalage dx de la borne droite ajoute un petit bout d'aire, à peu près égal à la hauteur de la courbe fois dx.
Et cette approximation devient de plus en plus précise quand dx devient tout petit. Mais si on voulait être plus précis sur cette variation d'aire,
pour un changement en x qui n'est pas censé tendre vers 0, il faudrait tenir compte de cette partie-là, qui ressemble à peu près à un triangle.
Appelons l'entrée de départ a, et l'entrée après décalage x, donc la variation, c'est x-a. La base de ce petit triangle, c'est ce changement justement,
x-a, et sa hauteur, c'est la pente de la courbe fois x-a. Comme cette courbe est la dérivée de la fonction aire,
sa pente est la dérivée seconde de la fonction aire, évaluée au point a. Donc l'aire de ce triangle, un demi fois la base fois la hauteur,
c'est un demi fois la dérivée seconde de cette fonction aire, évaluée en a, multiplié par (x-a)^2.
Et c'est exactement ce qu'on obtient avec un polynôme de Taylor. Si on connaît les infos sur les dérivées de cette fonction aire au point a,
comment est-ce qu'on approxime l'aire au point x ? Eh ben, il faut prendre toute l'aire jusqu'à a, f(a), plus l'aire de ce rectangle,
qui vaut la dérivée première fois x-a, plus l'aire du petit triangle, qui vaut un demi fois la dérivée seconde, fois (x-a)^2.
J'aime bien ça, parce que même si, écrit comme ça, ça fait un peu fouillis, chaque terme a un sens clair : on peut clairement le placer concrètement sur ce dessin.
Si on voulait, on pourrait s'arrêter là, et on aurait un outil incroyablement utile pour faire des approximations avec ces polynômes de Taylor.
Mais si vous pensez comme un mathématicien, une question qui vient, c'est est-ce que ça a du sens de ne jamais s'arrêter,
et d'ajouter une infinité de termes ? En maths, une somme infinie s'appelle une série,
donc même si une approximation avec un nombre fini de termes s'appelle une polynôme de Taylor, en additionnant une infinité de termes,
on obtient une série de Taylor. Il faut être vraiment prudent avec l'idée de série infinie, parce qu'en vrai,
ça n'a pas de sens d'additionner une infinité de choses : on ne peut appuyer sur le bouton + de la calculette un nombre infini de fois.
Mais si on a une série où, en ajoutant de plus en plus de termes, ce qui a un sens à chaque étape, on se rapproche de plus en plus d'une valeur précise,
on dit que la série converge vers cette valeur. Ou, si vous acceptez l'idée d'élargir le signe d'égalité pour
inclure ce genre de convergence, on dira que la série entière, cette somme infinie, est égale à la valeur vers laquelle elle converge.
Par exemple, prenez le polynôme de Taylor de e^x, et remplacez x par une valeur, genre x = 1.
Quand on ajoute de plus en plus de termes, la somme totale se rapproche de plus en plus de la valeur e ; donc on dit que cette série infinie converge vers le nombre e,
ou, ce qui revient au même, on dit qu'elle est égale au nombre e. En fait, il se trouve que si on met n'importe quelle autre valeur de x,
par exemple x = 2, et qu'on regarde la valeur des polynômes de Taylor d'ordre de plus en plus élevé en ce point, ça converge toujours vers e^x, ici e^2.
C'est vrai pour n'importe quelle valeur de x, même très loin de 0, alors que ces polynômes de Taylor sont construits uniquement à partir d'infos sur les
dérivées, prises en x = 0. Dans un cas comme celui-là, on dit que e^x est égal à sa propre série de Taylor,
pour tout x, ce qui a un côté un peu magique. Même si c'est aussi vrai pour quelques autres fonctions importantes,
comme le sinus et le cosinus, parfois ces séries ne convergent que dans une certaine plage autour du point où on a pris les infos de dérivées.
Par exemple, si on calcule la série de Taylor du logarithme népérien ln(x) autour de x = 1, en évaluant les dérivées d'ordre élevé de ln(x) en x = 1, voilà à quoi ça ressemble.
Si on met une valeur entre 0 et 2, ajouter de plus en plus de termes de cette série nous rapproche bien, de plus en plus, de ln(x) pour cette valeur.
Mais en dehors de cette plage, même juste un tout petit peu, la série n'approche rien du tout.
Quand on ajoute de plus en plus de termes, la somme part dans tous les sens, en oscillant violemment.
Elle ne converge pas, comme on pourrait l'imaginer, vers ln(x) de cette valeur, même si ln(x) est parfaitement défini pour des valeurs au-dessus de 2.
D'une certaine façon, l'information sur les dérivées de ln(x) en x = 1 ne “se propage” pas jusque-là.
Dans un cas comme ça, où ajouter des termes n'approche rien, on dit que la série diverge. Et la distance maximale entre le point autour duquel on approxime et les points où ces
polynômes convergent vraiment s'appelle le rayon de convergence de la série de Taylor. Il reste encore plein de choses à apprendre sur les séries de Taylor.
Il y a beaucoup d'usages, des méthodes pour mesurer l'erreur de ces approximations, des tests pour savoir quand des séries convergent ou non, et plus largement,
il reste aussi énormément à apprendre sur l'analyse en général, sans parler des innombrables sujets qu'on n'a pas abordés dans cette série.
Le but de ces vidéos, c'est de vous donner les intuitions fondamentales qui vous rendent à l'aise et efficace pour apprendre la suite par vous-même,
et peut-être même pour redécouvrir une partie du sujet, par vous-même. Pour les séries de Taylor, l'intuition de base à garder en tête quand vous
explorez la suite, c'est qu'elles transforment l'information sur les dérivées en un point en une information d'approximation autour de ce point.
Merci encore à toutes celles et ceux qui ont soutenu cette série. La prochaine série du même genre portera sur les probabilités,
et si vous voulez un accès en avance au fur et à mesure, vous savez où aller. Merci.