Когда я впервые узнал о сериалах Тейлора, я определенно не осознал, насколько они важны. Но снова и снова они возникают в математике, физике и во многих областях техники,
поскольку являются одним из самых мощных инструментов, которые математика может предложить для аппроксимации функций.
Я думаю, что один из первых случаев, когда я был студентом, это поразило меня не на уроке математического анализа, а на уроке физики.
Мы изучали определенную проблему, связанную с потенциальной энергией маятника, и для этого вам нужно выражение того, насколько вес маятника превышает
его самую низкую точку, и когда вы это решите, оно окажется пропорциональна 1 минус косинус угла между маятником и вертикалью.
Специфика проблемы, которую мы пытались решить, здесь не имеет значения, но я скажу, что эта функция косинуса сделала задачу неудобной и громоздкой
и сделала менее ясным, как маятники связаны с другими колебательными явлениями. Но если вы аппроксимируете косинус тэты как 1 минус тэта в квадрате более 2,
все станет на свои места гораздо легче. Если вы никогда раньше не видели ничего подобного,
такое приближение может показаться совершенно неуместным. Если вы построите график косинуса теты вместе с этой функцией:
1 минус тета в квадрате над 2, они действительно покажутся довольно близкими друг к другу, по крайней мере, для небольших углов, близких к 0,
но как бы вы вообще подумали сделать такое приближение и как бы вы это сделали? найти этот конкретный квадрат?
Изучение рядов Тейлора в основном сводится к взятию неполиномиальных функций и поиску полиномов, которые аппроксимируют их вблизи некоторых входных данных.
Мотив здесь в том, что с полиномами гораздо проще иметь дело, чем с другими функциями. Их легче вычислять, легче брать производные, легче интегрировать,
и они в целом более дружелюбны. Итак, давайте взглянем на эту функцию, косинус x, и подумаем,
как можно построить квадратичную аппроксимацию вблизи x, равного 0. То есть среди всех возможных многочленов, которые выглядят как c0 плюс c1,
умноженный на x плюс c2, умноженный на x в квадрате, для некоторого выбора этих констант c0, c1 и c2, найдите тот,
который больше всего напоминает косинус x около x, равного 0. , график которого похож на ложку с графиком косинуса x в этой точке.
Ну, во-первых, на входе 0 значение косинуса x равно 1, поэтому, если наше приближение вообще будет хорошим, оно также должно равняться 1 на входе x,
равном 0. Подстановка 0 приводит к тому, что равно c0, поэтому мы можем установить его равным 1.
Это дает нам свободу выбирать константы c1 и c2, чтобы сделать это приближение настолько точным, насколько это возможно,
но никакие наши действия с ними не изменят тот факт, что полином равен 1 при x, равном 0. Также было бы хорошо, если бы наше приближение имело тот же наклон касательной,
что и косинус x в этой интересующей точке. В противном случае аппроксимация отклоняется от графика косинуса гораздо быстрее,
чем это необходимо. Производная косинуса — отрицательный синус, а точка x равна 0,
что означает 0, что означает, что касательная линия идеально плоская. С другой стороны, когда вы вычисляете производную нашего квадратичного уравнения,
вы получаете c1 плюс 2, умноженный на c2, умноженный на x. Если x равно 0, это соответствует тому, что мы выбрали для c1.
Таким образом, эта константа c1 полностью контролирует производную нашего приближения вокруг x, равную 0.
Установка его равным 0 гарантирует, что наше приближение также будет иметь плоскую касательную в этой точке.
Это дает нам возможность изменять c2, но значение и наклон нашего полинома при x, равном 0, фиксируются на месте, чтобы соответствовать значению косинуса.
Последнее, чем стоит воспользоваться, это тот факт, что график косинуса изгибается вниз выше значения x, равного 0,
и имеет отрицательную вторую производную. Другими словами, даже несмотря на то, что в этой точке скорость изменения равна 0,
сама скорость изменения снижается примерно в этой точке. В частности, поскольку его производная представляет собой отрицательный синус x,
его вторая производная является отрицательным косинусом x, а при x, равном 0, это соответствует отрицательной 1.
Теперь, точно так же, как мы хотели, чтобы производная нашего приближения соответствовала производной косинуса, чтобы их значения не расходились без
необходимости быстро, убедитесь, что совпадение их вторых производных гарантирует, что они будут изгибаться с одинаковой скоростью,
что наклон нашего полинома не отклоняется от наклона косинуса x быстрее, чем это необходимо.
Подняв ту же производную, что и раньше, а затем взяв ее производную, мы видим, что вторая производная этого многочлена равна ровно 2 раза c2.
Таким образом, чтобы убедиться, что эта вторая производная также равна отрицательной 1 при x, равном 0, 2 раза c2 должно быть отрицательным 1,
что означает, что само c2 должно быть отрицательной 1 половиной. И это дает нам приближение 1 плюс 0x минус 1 половина x в квадрате.
И чтобы почувствовать, насколько это хорошо, если вы оцените косинус, равный 0.1, используя этот полином, вы оцениваете его как 0.995.
И это истинное значение косинуса 0.1. Это действительно хорошее приближение!
Найдите минутку, чтобы подумать о том, что только что произошло. В этом квадратичном приближении у вас было три степени свободы, константы c0, c1 и c2.
c0 отвечал за то, чтобы выходные данные аппроксимации соответствовали выходным данным косинуса x при x, равном 0.
c1 отвечал за совпадение деривативов в этот момент, а c2 отвечал за совпадение вторых производных.
Это гарантирует, что способ изменения вашего приближения по мере удаления от x будет равен 0, а способ изменения самой скорости изменения будет
максимально похож на поведение косинуса x, учитывая объем вашего контроля. Вы можете дать себе больше контроля, включив в полином больше
членов и сопоставив производные более высокого порядка. Например, предположим, что вы добавили к члену c3,
умноженному на x3, для некоторой константы c3. В этом случае, если вы возьмете третью производную кубического многочлена,
все квадратичное или меньшее значение будет равно 0. Что касается этого последнего члена, то после 3
итераций правила степени он выглядит как 1×2×3×c3. С другой стороны, третья производная косинуса x равна синусу x,
который равен 0, когда x равен 0. Поэтому, чтобы гарантировать совпадение третьих производных,
константа c3 должна быть равна 0. Другими словами, 1 минус 1 половина x2 — это не только наилучшее
квадратичное приближение косинуса, но и наилучшее кубическое приближение. Вы можете улучшить ситуацию, добавив к четвертому члену четвертого порядка c4,
умноженное на x. Четвертая производная косинуса равна 1 при x, равном 0.
И какова четвертая производная нашего многочлена с этим новым членом? Что ж, когда вы продолжаете применять правило степени снова и снова,
когда все показатели степени прыгают вперед, вы получаете 1 раз 2 раза 3 раза 4 раза с4, что составляет 24 раза с4.
Итак, если мы хотим, чтобы это соответствовало четвертой производной косинуса x, равной 1, c4 должно быть 1 больше 24.
И действительно, полином 1 минус 1 половина x2 плюс 1 24 раза x до четвертого, который выглядит так, является очень близким приближением для косинуса x вокруг x,
равного 0. Например, в любой физической задаче, связанной с косинусом малого угла,
прогнозы будут почти незаметно другими, если вы замените этот многочлен косинусом x. Теперь сделайте шаг назад и обратите внимание на некоторые вещи,
происходящие в этом процессе. Прежде всего, в этом процессе очень естественно возникают факториальные члены.
Когда вы преобразуете n последовательных производных функции x в n, позволяя правилу степеней продолжать каскадно снижаться,
у вас останется 1x2x3 и так далее, до тех пор, пока не будет равно n. Таким образом, вы не просто устанавливаете коэффициенты
полинома равными любой производной, которую хотите. Вам нужно разделить на соответствующий факториал, чтобы нейтрализовать этот эффект.
Например, x до четвертого коэффициента был четвертой производной косинуса, 1, но разделенной на 4 факториала, 24.
Второе, на что следует обратить внимание, это то, что добавление новых терминов, например c4, умноженное на x до четвертого, не меняет того,
какими должны быть старые термины, и это действительно важно. Например, вторая производная этого многочлена в точке x, равной 0,
по-прежнему равна 2-кратному второму коэффициенту, даже после того, как вы введете члены более высокого порядка.
И это потому, что мы подставляем x равным 0, поэтому вторая производная любого члена более высокого порядка, который все включает x, просто смоется.
И то же самое касается любой другой производной, поэтому каждая производная многочлена при x, равном 0,
контролируется одним и только одним из коэффициентов. Если бы вместо этого вы аппроксимировали входное значение, отличное от 0, например,
x равно пи, то для того, чтобы получить тот же эффект, вам пришлось бы записать свой полином в виде степеней x минус пи или любого другого
входного сигнала, на который вы смотрите. Из-за этого все выглядит заметно сложнее, но все, что мы делаем, — это следим за тем,
чтобы точка pi выглядела и вела себя как 0, так что вставка x равна pi приведет к множеству хороших операций отмены, в результате которых останется только одна константа.
И, наконец, на более философском уровне обратите внимание, что мы здесь по сути берем информацию о производных функции более высокого
порядка в одной точке и переводим ее в информацию о значении функции вблизи этой точки. Вы можете взять сколько угодно производных косинуса.
Это следует этому красивому циклическому шаблону: косинус x, отрицательный синус x, отрицательный косинус, синус, а затем повторение.
И значение каждого из них легко вычислить, когда x равно 0, это дает циклический шаблон 1, 0, отрицательный 1, 0, а затем повторяется.
А знание значений всех этих производных более высокого порядка дает много информации о косинусе x, даже несмотря на то,
что для этого нужно подставить только одно число, x равно 0. Итак, мы используем эту информацию, чтобы получить аппроксимацию этих входных данных,
и вы делаете это, создавая полином, чьи производные более высокого порядка рассчитаны на совпадение с производными косинуса,
следующими за теми же 1, 0, отрицательным 1, 0, циклический шаблон. И для этого вы просто заставляете каждый коэффициент многочлена следовать одному и
тому же шаблону, но вам нужно разделить каждый из них на соответствующий факториал. Как я уже упоминал ранее, именно это сводит на нет
каскадный эффект многих приложений правил мощности. Полиномы, которые вы получаете, останавливая этот процесс в любой точке,
называются полиномами Тейлора для косинуса x. В более общем смысле и, следовательно, более абстрактно,
если бы мы имели дело с какой-либо другой функцией, отличной от косинуса, вы бы вычислили ее производную, вторую производную и т. д.,
получив столько членов, сколько захотите, и вычислили бы каждое из них. из них в точке x равно 0.
Для полиномиальной аппроксимации коэффициент каждого члена x к n должен быть значением n-й производной функции, оцененной как 0, но разделенной на n факториал.
Всю эту довольно абстрактную формулу вы, вероятно, увидите в любом тексте или курсе, посвященном полиномам Тейлора.
Когда вы это увидите, подумайте про себя, что постоянный член гарантирует, что значение полинома совпадает со значением f.
Следующий член гарантирует, что наклон полинома соответствует наклону функции в точке x, равной 0.
Следующий член гарантирует, что скорость изменения наклона в этой точке будет одинаковой, и так далее, в зависимости от того, сколько членов вы хотите.
И чем больше членов вы выберете, тем ближе будет аппроксимация, но компромисс в том, что полученный полином будет более сложным.
И чтобы сделать ситуацию еще более общей, если вы хотите аппроксимировать какой-либо входной сигнал, отличный от 0, который мы назовем a,
вы должны записать этот полином в виде степеней x минус a и оценить все производные f. на этом входе a.
Именно так выглядят полиномы Тейлора в своей полной общности. Изменение значения a изменяется в том случае, если это приближение охватывает исходную
функцию, где ее производные более высокого порядка будут равны производным исходной функции.
Одним из простейших содержательных примеров этого является функция e для x вокруг входного значения x, равного 0.
Вычисление производных — это очень приятно, настолько приятно, насколько это возможно, потому что производная от е по х — это она сама,
поэтому вторая производная также равна е по х, как и ее третья, и так далее. Итак, в точке x, равной 0, все они равны 1.
Это означает, что наша полиномиальная аппроксимация должна выглядеть так: 1 плюс 1, умноженный на х, плюс 1, умноженный на 2, умноженный на х в квадрате,
плюс 1, умноженный на 3 факториала, умноженный на х в кубе, и так далее, в зависимости от того, сколько членов вы хотите.
Это полиномы Тейлора для преобразования e в x. Итак, взяв это за основу, чтобы показать вам, насколько связаны все темы исчисления,
позвольте мне обратиться к чему-то забавному, совершенно другому способу понять этот член второго порядка полиномов Тейлора, но геометрически.
Это связано с фундаментальной теоремой исчисления, о которой я говорил в главах 1 и 8, если вам нужно быстро освежить знания.
Как и в тех видеороликах, рассмотрим функцию, которая определяет площадь под некоторым графиком между фиксированной левой точкой и переменной правой точкой.
Здесь мы собираемся подумать о том, как аппроксимировать эту функцию площади, а не функцию самого графика, как мы делали раньше.
Сосредоточение внимания на этой области приведет к появлению термина второго порядка. Помните, фундаментальная теорема исчисления заключается в том,
что этот график сам по себе представляет собой производную функции площади, и это потому, что небольшое смещение dx к правой границе площади дает новый бит площади,
примерно равный высоте графика, умноженной на dx. . Это приближение становится все более точным при все меньшем и меньшем выборе dx.
Но если вы хотите быть более точным в отношении этого изменения площади, учитывая некоторое изменение x, которое не должно приближаться к 0,
вам придется принять во внимание вот эту часть, которая представляет собой примерно треугольник.
Назовем начальный вход a, а сдвиг над ним — x, чтобы изменение было xa. Основание этого маленького треугольника — это изменение ха,
а его высота — это наклон графика, умноженный на ха. Поскольку этот график является производной функции площади,
его наклон является второй производной функции площади, вычисляемой на входе a. Таким образом, площадь этого треугольника, 1 половина основания,
умноженная на высоту, равна 1 половине второй производной этой функции площади, оцененной как a, умноженной на квадрат ха.
И это именно то, что вы увидите с полиномом Тейлора. Если бы вы знали различную производную информацию об этой функции площади в точке a,
как бы вы аппроксимировали площадь в точке x? Вам нужно включить всю эту площадь до a, f a, плюс площадь вот этого прямоугольника,
которая является первой производной, умноженную на xa, плюс площадь этого маленького треугольника, которая в 1 раз равна второй производной,
умноженной на 1. ха в квадрате. Мне это очень нравится, потому что, хотя все это выглядит немного беспорядочно,
каждый из терминов имеет очень четкое значение, на которое вы можете просто указать на диаграмме.
Если бы вы захотели, мы могли бы назвать это концом, и вы получили бы феноменально полезный инструмент для аппроксимации с помощью
этих полиномов Тейлора. Но если вы мыслите как математик, вы можете задаться вопросом:
имеет ли смысл никогда не останавливаться и просто добавлять бесконечное количество членов.
В математике бесконечная сумма называется рядом, поэтому, хотя одно из этих приближений с конечным числом членов называется полиномом Тейлора,
сложение всех бесконечных членов дает то, что называется рядом Тейлора. Вы должны быть очень осторожны с идеей бесконечного ряда,
потому что на самом деле нет смысла добавлять бесконечное количество элементов, вы можете нажать кнопку «плюс» на калькуляторе только определенное количество раз.
Но если у вас есть ряд, в котором добавление все большего и большего количества членов, что имеет смысл на каждом этапе, приближает вас к некоторому конкретному значению,
вы говорите, что ряд сходится к этому значению. Или, если вам удобно расширить определение равенства,
включив в него этот вид сходимости рядов, вы бы сказали, что ряд в целом, эта бесконечная сумма, равна значению, к которому он сходится.
Например, посмотрите на полином Тейлора для преобразования e в x и подставьте какой-нибудь входной сигнал, например x равен 1.
По мере того, как вы добавляете все больше и больше полиномиальных членов, общая сумма становится все ближе и ближе к значению e, поэтому вы говорите,
что этот бесконечный ряд сходится к числу e, или, что говорит то же самое, что он равен числу e.
Фактически оказывается, что если вы подставите любое другое значение x, например, x равное 2, и посмотрите на значение полиномов Тейлора все более и более высокого порядка
при этом значении, они будут сходиться в направлении e к x, что составляет е в квадрате. Это верно для любого входа, независимо от того, насколько далеко он находится от 0,
даже несмотря на то, что эти полиномы Тейлора строятся только на основе производной информации, собранной на входе 0.
В таком случае мы говорим, что e для x равно собственному ряду Тейлора на всех входах x, что является своего рода волшебством.
Несмотря на то, что это справедливо и для пары других важных функций, таких как синус и косинус, иногда эти ряды сходятся только в определенном
диапазоне вокруг входных данных, информацию о производной которых вы используете. Если бы вы вычислили ряд Тейлора для натурального логарифма x для входного значения x,
равного 1, который строится путем вычисления производных более высокого порядка натурального логарифма x в точке x, равной 1, то это было бы так.
Когда вы подключаете входные данные от 0 до 2, добавление все большего и большего числа членов этой серии
действительно приближает вас к естественному логарифму этого входного сигнала. Но за пределами этого диапазона, даже немного, сериал не может ни к чему приблизиться.
По мере того, как вы добавляете все больше и больше членов, сумма сильно колеблется взад и вперед.
Он не приближается, как можно было ожидать, к натуральному логарифму этого значения, даже несмотря на то, что натуральный логарифм x прекрасно
определен для входных значений выше 2. В каком-то смысле информация о производной ln от x в точке x,
равной 1, не распространяется так далеко. В таком случае, когда добавление дополнительных членов ряда ни к чему не приводит,
вы говорите, что ряд расходится. И это максимальное расстояние между входными данными,
которые вы аппроксимируете, и точками, где выходные данные этих полиномов фактически сходятся, называется радиусом сходимости ряда Тейлора.
Нам еще предстоит узнать больше о ряде Тейлора. Существует множество вариантов использования, тактик для определения границ
ошибки этих приближений, тестов для понимания того, когда ряды сходятся, а когда нет, и, если уж на то пошло, еще многое предстоит узнать об исчислении
в целом и о бесчисленных темах, которые не были затронуты. по этой серии. Цель этих видеороликов — дать вам фундаментальную интуицию,
которая позволит вам чувствовать себя уверенно и эффективно, изучая больше самостоятельно и, возможно, даже заново открывая для себя больше темы.
В случае с рядами Тейлора фундаментальная интуиция, которую следует иметь в виду, когда вы изучаете больше того, что существует, заключается в том,
что они преобразуют производную информацию в одной точке в информацию аппроксимации вокруг этой точки.
Еще раз спасибо всем, кто поддержал эту серию. Следующая серия, подобная этой, будет посвящена вероятности,
и если вам нужен ранний доступ по мере создания этих видео, вы знаете, куда идти.