Правила вычисления дифференциалов

Правила вычисления дифференциалов

1. Константу можно выносить за знак дифференциала.

2. Дифференциал суммы/разности.

Дифференциал суммы/разности функций равен суме/разности дифференциалов от каждого из слагаемых.

3. Дифференциал произведения.

4. Дифференциал частного.

5. Дифференциал константы равен нулю.

Краткая теория

Онлайн калькуляторы

Копирование материал с сайта возможно только с разрешения администрации портала и при наличие активной ссылки на источник.

www.webmath.ru

Правила вычисления дифференциалов

Ничего непонятно?

Попробуй обратиться за помощью к преподавателям

Правила вычисления дифференциалов были открыты Лейбницем и аналогичны правилам отыскания производных.

Числовой множитель выносится за знак дифференциала

Дифференциал суммы или разности функций равен сумме или разности их дифференциалов.

Дифференциал числа (константы) равен 0

Выполнить дифференцирование функции.

По правилу дифференцирования, дифференциал числа равен 0.

Выполнить дифференцирование функции.

По правилу дифференцирования, дифференциал константы равен 0.

Найти дифференциал функции.

По правилу дифференцирования, дифференциал разности равен разности дифференциалов функций.

Найдем производные данных функций и добавим к ним знак дифференциала

Найти дифференциал функции.

По правилу дифференцирования, дифференциал суммы равен сумме дифференциалов функций.

Найдем производные данных функций и добавим к ним знак дифференциала. Производная второй функции так же, как и дифференциал, равна 0.

Найти дифференциал функции.

По правилу дифференцирования:

Найдем производные данных функций и добавим к ним знак дифференциала.

\[d(e^ \cos x)=e^ dx\cdot \cos x-e^ \sin xdx\]

Найти дифференциал функции.

Вынесем числовой множитель за знаки дифференциала

Найдем производную функции и добавим знак дифференциала.

Найти дифференциал функции.

Вынесем числовой множитель за знаки дифференциала

По формуле частного найдем дифференциал

Лень читать?

Задай вопрос специалистам и получи
ответ уже через 15 минут!

Найти дифференциал функции.

По формуле произведения найдем дифференциал

Так и не нашли ответ
на свой вопрос?

Просто напиши с чем тебе
нужна помощь

spravochnick.ru

Правила вычисления дифференциалов

Дифференциал и формула Тейлора —
без нелепостей и жаргона

Сократа приговорили к смерти за непочтение богов.
Накануне казни он сидел в тюрьме и играл на дудке.
Его навестили друзья.
— Как можешь ты играть на дудке в такой день? — изумились они.
— Потом у меня на это не будет времени, — ответил Сократ.

Книжки по математике надо читать с оглавления и предисловия.
Они дают список понятий, понимание того, о чем речь.
А затем надо читать книжку с того места, где увидел
что-то интересное и шагать туда, куда хочется.
Шагать хоть вперед, хоть назад.
Белякова М.А., учитель математики
в 366 школе Ленинграда, 1968 год.

Статьи [1,2,3] о 60- летних нелепостях в теме «инвариантность первых дифференциалов и не инвариантность старших» были задуманы мной как «patch» («заплата») для стандартных учебников. Я надеялся, что статьи будут полезны не только преподавателям, но и студентам.

После получения отзывов на статьи я обнаружил следующее. В отличие от преподавателя студент мало знаком с учебниками. Поэтому получилась парадоксальная ситуация: для того, чтобы эти статьи принесли пользу студенту, он сначала должен настрадаться, изучая «инвариантность — не инвариантность» по учебникам, а потом с моей помощью узнать, что они содержат принципиальные ошибки и им не следовало верить.
Но чему тогда верить ? Нужна статья, которая могла бы наставить студента на путь истинный.

Я попытался ее написать. Вот она, перед Вами, читатель.
Основная её цель — объяснить студентам (студентам, а не преподавателям!) :
что дифференциал без полинома Тейлора — бесполезен, не может быть ясно понят и использован,
— что правила употребления дифференциалов — всего лишь фрагменты знакомых школьнику правил действий над многочленами
(полиномами Тэлора, степенными разложениями).

Я предупреждаю студента, что излагаемые в учебниках правила действий с дифференциалами только выглядят хорошими (их подают как повторение правил действий с производными), — на самом деле они не только не уберегают от грубых ошибок, но даже и провоцируют их. Причина — неустранимое несовершенство обозначений дифференциалов. Средство не делать ошибки — формула Тейлора, ясное осознание того, из какого многочлена Тэйлора (степенного разложения функции) взят дифференциал. Если студент научится выходить из затруднений в работе с дифференциалами таким способом — обращая свой взор к полиному Тейлора, содержащему этот дифференциал, — то эта статья достигла ее первоначальной цели. Потом, при желании, студент может прочесть [ 1 — 3].

Кроме самих дифференциалов эта статья даст студенту связанные с ними понятия. Овладение ими — вторая цель статьи

Должен указать важную особенность восприятия начал математического анализа студентом, обучаемым по российским стандартам. Студенту неявно внушают, что, якобы, самое главное понятие, — это производная. А в итоге сокращения курса математики под предлогом тотальной бакалавризации это внушение достигло небывалой силы и наносит много вреда сознанию студентов.
Это внушение нигде не написано прямым текстом. Но оно содержится в теле курса, в его структуре.
По моим наблюдениям, все студенты поддаются этому внушению. Как это происходит? — Вот как.
Сначала студента знакомят с «теорией пределов» (правильнее сказать — предельных значений функций и последовательностей чисел). Поскольку в прикладных задачах вычисление предельных значений используется редко, студент думает, что главной целью искусства вычисления пределов является вывод таблицы производных и правил её использования. Многие студенты бывают раздражены тем, что столь большой материал их заставили изучать ради коротенькой таблицы производных. Они думают, что могли бы просто выучить ее и пользоваться ею без траты сил на » теорию пределов «. — Такое мнение ошибочно, но у меня в этой статье нет места на разговор о нем.
Потом студента упражняют в вычислении производных с помощью полученных таблиц и правил.
Потом приучают связывать убывание — возрастание значений функции со знаком производной и с видом графика (а также выпуклость вверх — вниз со знаком второй производной). Отрабатывают эту привычку на задачах построения графиков. У студента даже создается неверное убеждение, что главное, чему он должен научиться, — строить график по жёстко оговоренной схеме «исследования функций» (тогда как на самом деле главное — приучить глаза видеть связь между свойствами графика и свойствами функции), — в этом месте курса формализм «схемы» часто оказывается выше смысла: студент ощущает себя беспомощным, когда сталкивается с функцией, не желающей укладываться в эту «схему», он боится отклониться от схемы.
Так и вертятся весь первый семестр все разговоры вокруг производной, будто это некая палочка — выручалочка, способная решить все задачи. — Ну разве может студент в такой обстановке не осознать, что производная — самое главное понятие?
А потом студента знакомят с дифференциалом. И. только одна картинка, для одного частного случая, ничего наглядного, ничего прикладного, одни лишь формулы.
Под занавес, в спешке конца семестра, когда уже нет времени на разнообразные упражнения, студенту дают общую формулу полинома Тейлора, которую можно записать в обозначениях дифференциалов, — но вообще -то и без них вполне можно обойтись.
В итоге студент остается в недоумении — зачем его заставляли знакомиться с дифференциалами? Только для того, чтобы уметь написать формулу Тейлора в виде линейной комбинации дифференциалов? Только и всего?
Это недоразумение усиливается еще и тем, что контрольные работы содержат узкий спектр понятий и задач, и студент, экономя силы, ограничивает себя этим «отчетным» материалом. Дифференциала в нем, под давлением бакалавризации всея Руси, — можно сказать, — уже нет. Ну а экзамен, как известно, в чем-то сродни лотерее. Вопросы про дифференциалы попадаются немногим студентам, рассматриваются студентами как неизбежное зло вроде » пуля-дура», встречающееся редко, потому у студентов и преподавателей не вызывает массового беспокойства тот факт, что студенты не понимают дифференциалов.

Вообще, должен сообщить студентам, что очередное сокращение норм аудиторного времени под знаменем тотальной бакалавризации высшего образования, навязанной нам «реформаторами», заставило преподавателей выкинуть очень многое и лишило курс математики наглядности и связности. Например, за борт выкинуты как балласт задачи о замене переменных в выражениях, содержащих производные. А это — материал, который очень нуждается в ясном понимании этой темы. Выкинутыми также оказались и важнейшие для сознания инженера (прикладные!) задачи на составление дифференциальных уравнений — тоже требовавшие понимания этой темы. Выкинуты все задачи на построение степенных разложений (приближений) для функций, заданных системами уравнений. В общем говоря, выкинуто то, что требовало понимания. Оставлено то, что может быть усвоено на уровне запоминания алгоритма такого уровня : «дёрни, деточка, за веревочку, — дверца и откроется»
Бороться с этим упрощенчеством нужно обязательно. Надо заниматься самообучением и заглядывать за рамки курса, побольше спрашивать преподавателя » а что там «?

Итак, студент думает, что «дифференциал» — лишний и непонятный довесок к производной.
На самом же деле всё наоборот . Это производная по отношению к дифференциалу — довесок, а не он к ней .
Я прошу студента навсегда запомнить (запомнить для себя, а не для отчета преподавателю): производная — всего лишь коэффициент в дифференциале.. А дифференциал — всего лишь формула для касательной прямой, написанная в специальных обозначениях. Производная -коэффициент наклона этой прямой. Коэффициент, зависящий от параметра (параметр — абсцисса точки касания, если ее поменять, точка касания сдвинется, коэффициент наклона касательной изменится). Больше ничего значительного и важного за производной не числится. Это — самое главное предназначение производной (первой, второй, третьей и т.д.), — быть коэффициентом в дифференциале (первом, втором, третьем и т.д.). Никаких других обстоятельств, оправдывающих введение понятие «производная», — нет. То, что первая производная — скорость возрастания функции в точке, а вторая производная — ускорение, – реализуется, опять же, только через дифференциалы (первый для скорости, второй для ускорения и т.д.).
Изучать производную без дифференциала — примерно то же самое, что изучать формулу корней квадратного трехчлена ax 2 + bx + c без самого трехчлена (одни лишь коэффициенты a, b, c от него оставить).

Дифференциал же, в свою очередь, существует на свете только потому, что является частью полинома (формулы) Тейлора. Как только студент написал степенное разложение (формулу Тейлора) для какой-то функции в заданной точке — он, сам того не сознавая, уже написал дифференциалы (и производные, как коэффициенты в них).
Простейший пример: формула суммы бесконечной, убывающей по модулю геометрической прогрессии.

1 / (1–x) = 1 + x + x 2 + x 3 + . где abs(x) 2

Чтобы найти c2 , требуем, чтобы при стремлении x к 1 разность между f(x) и вторым приближением убывала быстрее, чем (x-1) 2 ( условие соприкосновения 2 порядка )

Делим обе части равенства на ( x–1) 2 . После сокращения дроби получим:

Устремляя x к 1, получим предельный вид равенства 1 – c2 = 0, т.е. c 2 = 1.

Мы получили второе приближение или соприкасающуюся параболу :

Факт касания второго порядка выражен требованием (**), которое мы смогли выполнить подбором коэффициента c2.

Аналогично для получения третьего приближения (т.е. соприкасающейся кубической параболы) добавляем ко второму приближению слагаемое третьего порядка с буквенным коэффциентом c3

и подбираем c3 из условия соприкасания третьего порядка

Деля обе части равенства на ( x–1) 3 , получаем

Устремляя x к 1, получим предельный вид равенства – 1 – c3 = 0, т.е. c 3 = –1.

Итого имеем третье приближение к функции 1/ x в точке 1

На рисунке видим график самой функции (гипербола) и ее первых трех приближений в точке 1, полученных нами.

Если в полученной формуле приближения (****) обозначить x–1 = q , мы увидим знакомую нам со школы геометрическую прогрессию

Она оказалась наилучшим в указанном смысле степенным приближением к 1/ x в точке 1.

Какой же идеей мы руководствовались, когда получали коэффициенты?
— Идеей Тэйлоровских приближений.
Нулевое приближение к функции 1/x в точке 1 — это число c0
Первое приближение к функции 1/x в точке 1 — это c0 + c1 (x-1) (полином 1 порядка)
Второе приближение — это c0 + c1 (x–1) + c2 (x–1) 2 (полином 2 порядка)
Третье приближение — это c0 + c1 (x–1) + c2 (x–1) 2 + c3 (x–1) 3 (полином 3 порядка)
И называем мы их приближениями за то, что каждое из них мало отличается от 1/x при стремлении x к 1. «Мало» в том смысле, что приближение порядка m (т.е. полином такой степени) отличается вблизи точки 1 от функции 1/x на величину, которая убывает быстрее, чем (x–1) m .
Инструментом сравнения двух величин, стремящихся к нулю, нам служит дробь. Если её числитель идет к нулю быстрее, чем знаменатель, — то и дробь идет к нулю. Вот именно этим мы и руководствовались: рассматривали разность между функцией и очередным найденным приближением и добивались, чтобы эта разность убывала быстрее соответствующей степени величины (x-1).

Такие вычисления были проделаны для всех элементарных функций. Для синусов — косинусов и других функций они были, конечно, сложнее приведенных в этом примере.
Вот классические шесть разложений для точки 0 (Т.е. по степеням переменной x, ибо отклонение x от нуля равно x – 0 = x).
Их обязательно знать наизусть, как фундамент мышления в этой области. Их легко запомнить в силу их особенностей (я их укажу ниже). Их получили давно. До того, как была написана обощающая их формула Тейлора.

Первые три разложения верны для любых вещественных значений x

e x = 1 + x + x 2 / 2! + x 3 / 3!+ x 4 / 4! + x 5 / 5!+. + x n / n! +. (1)
sin(x) = xx 3 / 3! + x 5 / 5! – . (2)
cos(x) = 1 – x 2 / 2! + x 4 / 4! –. (3)

Разложения синуса и косинуса я написал в разрядку, чтобы было видно совпадение членов их разложений с членами разложения (1).

Следующие разложения (4) — (6) верны при -1 m = 1 + m x + m(m-1) x 2 /2! + m(m-1)(m-2) x 3 /3! + m(m-1)(m-2)(m-3) x 4 /4!+. (4)
(1 + x) -1 = 1 – x + x 2 – x 3 + x 4 –. (5)
ln(1 + x) = xx 2 /2 + x 3 /3 – x 4 /4 + x 5 /5 –. (6)

Все разложения такого рода, в конечном итоге, порождены практикой приближенных вычислений. Подставьте в формулы вместо x любое число из указанной области и посмотрите, как ведут себя частные суммы при добавлении следующих слагаемых. С некоторого момента Вы увидите, что слагаемые с достаточно большими номерами малы и дают лишь малые поправки суммы S, — дают вклад во все более удаленные от запятой младшие разряды десятичной записи числа S и не меняют первых цифр ; таких неизменных цифр становится все больше и больше.

Вот, например, что получается, если в (1) подставить x =1 и прибавлять слагаемые.
Начну с суммы первых трех, доведу сумму до слагаемого десятого порядка:

2. 5 (3 слагаемых)
2. 6666666666666666666666666666
2.7 083333333333333333333333333
2.71 66666666666666666666666666
2.718 0555555555555555555555555
2.7182 539682539682539682539682
2.7182 787698412698412698412698
2.71828 15255731922398589065255
2.7182818 011463844797178130511 (11 слагаемых)

Синим цветом я выделил цифры, которые стабилизировались навсегда, т.е. верные цифры.
Если взять x побольше, стабилизация начнется позже. Если поменьше — раньше.
Скорость стабилизации (ширина треугольника синих цифр) тоже зависит от x . Для значений x, близких к краю области сходимости (см. о ней ниже) скорость стабилизации цифр хуже.

Вот аналогичные вычисления для синуса (2) при таком же x =1

.84 166666666666666666666666666666 (3 слагаемых)
.841 46825396825396825396825396825
.84147 100970017636684303350970018
.841470984 64806798140131473464807
.84147098480 865841976953088064199
.84147098480789 370339634889899440
.8414709848078965 1485360324451516
.8414709848078965066 3296799789084
.8414709848078965066525 4093895423 (11 слагаемых)

В разговоре применяют неясное понятие скорость сходимости степенного ряда. Как видим, у синуса в той же точке x =1 она выше. Т.е. быстрее растет число правильных цифр. Почему быстрее — понятно: в разложении синуса каждое следующее слагаемое на два порядка выше предыдущего, они быстрее убывают по величине с ростом номера. Четкого определения понятию «скорость сходимости ряда» я не встречал. Вместо него используют оценки для остатка ряда (или «остаточного члена»), т.е. разницы между функцей и частной суммой ряда с n слагаемыми (n- ым приближением)

Слова «частные ( частичные ) суммы» употребляют как для сумм чисел вроде написанных только что, т.е. при некотором числовом значении x , так и для сумм функций.

Например, для разложения (1) первые приближения (частные суммы) таковы:

y = 1 + x (прямая, касающаяся графика в точке 0)
y = 1 + x + x 2 / 2 (соприкасающаяся парабола; та же точка прикосновения)
y = 1 + x + x 2 / 2 + x 3 / 6 (соприкасающаяся парабола 3 порядка)
y = 1 + x + x 2 / 2 + x 3 / 6+ x 4 / 24 (соприкасающаяся парабола 4 порядка)

На Рис. A. видно, что с ростом номера (порядка многочлена) их графики все лучше и лучше приближаются к графику раскладываемой функции (в некоторой окрестности точки касания, в данном случае это 0)

Частные (частичные) суммы степенных рядов (разложений) называют также первым, вторым, третьим и т.д. приближениями к раскладываемой функции (номер приближения = порядок многочлена в такой-то точке касания). Их же называют полиномами (многочленами) Тейлора (для такой-то функции в такой-то точке).

Рис. A . Первое — третье — пятое приближения к синусу в точке 0.

[ Обозначения полиномов в книжках обычно содержат индекс, указывающий их порядок. Так, первый из этих полиномов скорее всего, в книжках обозначили бы P1(x), а последний P4(x).

Если же речь об этих приближениях шла, как о частных суммах, то этот список, скорее всего, начинался бы формулой y = 1, называемой «нулевым приближением». Частные суммы обычно нумеруют по количеству слагаемых в них. Так, последнюю формулу, скорее всего, обозначили бы S5(x). ]

Вот такие приближения (частные суммы) и есть самое главное в математическом анализе. А производные — всего лишь коэффициенты в них (точнее — кусочек коэффициентов, в коэффициенте ведь и факториал есть в знаменателе ; и еще в написанных выше формулах присутствуют не сами производные, а их числовые значения в точке 0).

Откуда пришло название » математичесий анализ «? — Слово «анализ» по-гречески и есть «разложение на части». Умение представить функцию в виде суммы более простых (с точки зрения трудоемкости вычислений) степенных функций назвали «математическим анализом», а функции, позволяющие заменить себя таким разложением, — «аналитическими». Особенно впечатляло первых исследователей то, что в бесконечно длинном степенном разложении можно обнаружить сколь угодно малые слагаемые (они, так сказать, » испаряются » с ростом их номера в сумме). Думаю, именно это обстоятельство побудило ученых употреблять слово » анализ «.

Позже оказалось, что все разложения (1-6) и многие другие можно получать единым способом, на основе созданной и получившей большое применение таблицы производных. Этот способ связан с именами Маклорена и Тейлора

Формулы (7) и (8) избавили студентов от необходимости изучать частные способы, которыми были получены (1-6) и многие иные.
Все разложения (1-6) можно получить из формулы Маклорена (7) [ проделайте этот вывод в качестве обязательного гимнастического упражнения для клеток Вашего мозга и Ваших рук, обязательно добейтесь умения его делать не глядя в эти формулы ]

Эти две формулы ничем не отличаются, кроме обозначений.
Формула Маклорена (7) получится из вормулы Тейлора (8) при a = 0. Про нее так и говорят, что это формула Тэйлора «в точке 0» (или «для точки 0»).
А формула Тейлора (8) получается из формулы Маклорена (7) сдвигом системы координат вбок, — чтобы начало кординат попало в точку a.
Реально это выглядит так: берем функцию f(a+t), разложим ее по (7) по степеням t (т.е. в точке t = 0) и потом заменим a + t = x в левой части равенства и t = x– a в правой. [ Проделайте это ].

Обе эти формулы в правой части содержат бесконечное число операций сложения степенных функций, так называемый степенной ряд . Степенной ряд — частный случай функционального ряда, то есть «суммы» бесконечного количества функций.

Как надо себе представлять такую «сумму»? Ведь в ней бесконечно много слагаемых!
— Идея естественная: добавлять слагаемые и смотреть что получится в пределе.
Конкретнее: берем число x и подставляем в каждое слагаемое. Получаем числовой ряд. Берем из него первое число (слагаемое) и, прибавляя к нему поштучно следующие, получаем последовательность (числовую) частных сумм S1, S2, S3. Если эта (числовая) последовательность частных сумм имеет предельное значение (число) S, то мы его и объявляем значением (суммой) ряда в точке x и обозначаем S(x). В этом случае говорим, что функциональный ряд сходится в точке x к числу S(x). А если предел последовательности S1, S2, S3. не существует или бесконечен — говорим, что ряд расходится в точке x.

Грубо говоря, поступаем так для всех вещественных чисел x . В результате все вещественные числа разделяются на две части: область сходимости (точки x , в которых ряд сходится) и область расходимости ряда.

Про степенные ряды (слагаемые в которых — степенные функции) известно, что их область сходимости — симметричный промежуток (с оговоркой, что на его левом и правом краях может быть разное сочетание сходимости — расходимости).
[А если бы мы работали с комплексными числами, то область сходимости — круг на плоскости. Отсюда появилось в матанализе слово «окрестность точки»]
Центр области сходимости степенного ряда — в той самой точке, которая, будучи подставлена вместо x, обнуляет все слагаемые, кроме самого первого. Для формулы Малорена это точка 0, для формулы Тейлора — это точка a. Именно эту точку и называют центром разложения (правильнее, но длиннее называть ее центром области сходимости). Она же — абсцисса точки касания графиков всех приближений с графиком функции. Причем чем выше порядок приближения (порядок полинома), тем лучше касание. Так и говорят: касание (соприкосновение) второго порядка, третьего порядка и т.д. В частности, второе приближение имеет соприкосновение второго порядка — разница между функцией и приближением имеет больший чем 2 порядок малости относительно величины Δx отклонения аргумента от абсциссы a точки касания

то же самое в привычной для глаз записи

Эти две записи трактуем так : разница между функцией и ее вторым Тейлоровским приближением (соприкасающейся параболой) в точке ax при неограниченном приближении последней к точке касания a (т.е. при Δ x стремящемся к 0 ) убывает быстрее, чем Δ x 2 (т.е. отношение этой разницы к Δ x стремится к 0). Еще можно говорить : » имеет порядок малости выше второго » ( относительно стремящегося к нулю Δ x)

Радиус сходимости (половина диаметра области сходимости) у разных степенных рядов разный. Способы его отыскания изучают в теме «степенные ряды». Нам достаточно знать, что радиус области сходимости для (1,2,3) бесконечно большой, а для (4,5,6) он равен 1. И в этих областях эти формулы верны. А формулы для остальных элементарных функций можно получать из этих.

[ Тот факт, что (1-6) можно получить из общей формулы (7), часто провоцирует студентов на «экономию» сил: они не заучивают (1 — 6), ошибочно надеясь, что знание наиболее общей формулы выручит во всех задачах. И когда встречают в задаче комбинацию из трех функций, требующую замены ее разложением третьего порядка — быстро тонут в обширнейших вычислениях по (7) или (8). Аналогичная ошибка — упование на правило Лопиталя для вычисления предельных значений вида 0/0. Призываю читателей учить (1- 6) и учиться использовать именно их, а не общие формулы (7) и (8). Последние наводят порядок в голове, но в практике вычислений пределов встречаются не часто. ]

[ Слово «ряд», «серия», изначально имеет смысл «последовательность». В нашей литературе закрепилась привычка словом «ряд» обозначать именно «сумму бесконечного числа слагаемых», неограниченное число операций сложения, независимо от того, имеет эта «сумма» числовое значение или нет. Видимо, это связано вот с чем: за словом » сумма » закрепился смысл «число, полученное в результате сложения». А когда слагаемых бесконечно много, результат может оказаться бесконечно большой (например 1 +1 +1 +1+1+. ) или вообще никакой (например 1 –1 +1 –1+1 –. ). Потому употребить слово «сумма» для бесконечно большого количества слагаемых означало бы заранее провоцировать слушателя на мысль, что у них сумма имеется. Иными словами, слово «сумма» уместно применять лишь к сходящимся рядам. Я же применяю здесь слово » сумма » потому. что обращаюсь к вчерашним школьникам .]

Займёмся формулами (1 — 3). Запомнить эти три формулы легко, взяв за основу первую из них. Её главная особенность: в ней все слагаемые однотипны. И если взять производную от любого из них — получается предыдущее: ( x n /n!) = n x n-1 /n! = x n-1 /(n–1)!
— Таким образом в степенном разложении оказалось реализовано свойство экспоненты (e x )‘ = e x , — степенное разложение при дифференцировании (вычислении производной) остается неизменным из-за того, что в нем бесконечно много слагаемых (иначе степень полинома при вычислении производной понижалась бы), — все слагаемые под действием операции вычисления производной как бы делают шаг влево (первое слагаемое — константа — исчезает), а поскольку вправо у ряда нет конца, то никаких изменений не происходит.

Благодаря этому обстоятельству, вооруженные таблицей производных, мы легко могли бы догадаться до этого разложения, если бы задались вопросом: какими должны быть коэффициенты c 0 , c1∙, c2 ∙, . cn ∙. разложения e x = c0 + c1x + c2x 2 + c3x 3 +. + cnx n + . чтобы вычисление производной от разложения давало бы его самого?

Очевидно, требование e 0 = 1 дает c 0 = 1.

Далее, вычислив производную разложения и приравняв ее к исходному разложению почленно (иначе не получится тождественного равенства) найдем все остальные коэффициенты

Таким же способом можно получить коэффициенты разложения синуса (2). Для этого следует заметить, что по причине нечетности синуса его разложение должно состоять только лишь из нечетных степеней икса. Далее, используя тождество (sin x)» ≡ – sin x , получаем возможность найти все коэффициенты разложения, почленно приравнивая разложение его второй производной со знаком минус. Так же можно получить и (3) и (4).

Маклорен предложил универсальный способ вычисления коэффициентов степенного разложения, не использующий специфических свойств функции вроде

Он предложил вычислять производные раз за разом, т.е. получать разложения для производной, второй производной и т.д. А потом во все эти тождества подставить x = 0. Вслед за Маклореном проделаем это для некоей функции f (x ), т.е. в общем виде

Вычислим производную от обеих частей тождественного равенства, получим

А теперь во все эти равенства подставим x =0. От сумм в правых частях равенств останутся только самые первые слагаемые, это нам даст значения коэффициентов.

Отсюда получаем значения чисел c 0 , c1 , c2 , c3 . cn ∙. т.е. формулу (7).

До формулы Тейлора (8) можно догадаться точно так же, только разложение надо задать по степеням величины ( xa ) — т.е. отклонения аргумента x от точки а :

Для получения коэффициентов — дифференцировать это равенство, и в полученные разложения производных подставить x = a . Получится (8). [ Проделайте это ]

Разумеется, Маклорен не имел оснований утверждать, что сумму бесконечного числа слагаемых можно дифференцировать почленно. Однако если бы он боялся делать не разрешенные кем-то вещи, он не придумал бы этот способ догадаться до формулы (7).

Он исходил из того, что для каких-то функций это делать можно. А вопрос «для каких» — оставил потомкам. И это было правильно, иначе ничего бы не было.

Разумеется, следующее столетие было потрачено на то, чтобы выяснить, для каких функций можно дифференцировать степенное разложение с бесконечным числом слагаемых.

Разумеется, оказалось, что все элементарные функции и обратные к ним таким свойством обладают (являются аналитическими).

Ну и разумеется, все учебники в большей их части заполнены выводом критерия аналитичности функции (возможности представить ее сходящимся рядом Тейлора), хотя для практики инженера, использующего лишь ограниченный набор функций, эти общие методы не нужны.

Внимательный читатель может меня упрекнуть: ну вот, автор проповедует отказ от излишеств, а сам, тем не менее, выше показал способ вычисления коэффициентов разложения, опирающийся на особые свойства функций вроде f (x) ≡ f (x ) или f » (x) ≡ – f (x ) и т.д.

Зачем, имея универсальную идею Маклорена, автор показал узко специфический метод?

Верно, показал. Почему? Потому что это — один из способов решать дифференциальные уравнения. Дифференциальное уравнение связывает между собой неизвестную (искомую) функцию и ее производные. И уж если мы знаем, что производные — это коэффициенты из степенного разложения, то легко догадаться, что дифференциальное уравнение — связь между коэффициентами степенного разложения. Решить дифференциальное уравнение = найти эту функцию. Однако найдите в стандартных книжках эту идею, немало послужившую таким титанам как Эйлер! Разве лишь в задачнике по дифференциальным уравнениям в самом конце как дополнительный и потому кажущийся необязательным материал.

Пример дифференциального уравнения: f » (x) + f (x ) = 0. Можно искать функцию f (x ) в виде степенного разложения в точке 0 с буквенными коэффициентами. Дифф. уравнение дает связь между коэффициентами разложения (как описано выше), позволяющую выразить их все через два первых, — вот главная идея.

Разумеется, если дифф. уравнение не столь простое, как это, — закономерность в коэффициентах разложения не будет нами обнаружена и нам придется ограничиться в качестве (приближенного) ответа частной суммой разложения. Мы можем надеяться на правдоподобность такого урезанного ответа только вблизи центра разложения. Соображения о близости такого приближенного решения к точному решению здесь дать не могу, они уведут нас далеко в сторону. Попробуйте, однако, решить указанное уравнение таким способом. Эйлер таким способом сделал немало открытий. Семейство решений этого диффура имеет вид C1 sin x + C2 cos x где C1, C2 — произвольные постоянные числа. Попробуйте получить его описанным способом.

Заканчиваем знакомство с разложениями (1 — 3).

Разложения синуса (2) и косинуса (3) легко запомнить, потому что они получаются из разложения экспоненты (1) изъятием «половины» слагаемых (синус — нечетная функция и потому должны остаться только нечетные степени аргумента, а косинус — четная) и чередованием знаков. Без чередования знаков не получилось бы, что (cos x) = – sin (x).

Если в (2) и (3) везде поставить плюсы, то получатся разложения «гиперболических» синуса и косинуса, у которых всегда

Рассмотрим следующие разложения (4 — 6). Основной формулой в этой группе может служить (4). Это — бином Ньютона, но записанный для любого постоянного вещественного (не только натурального) числа m. Если m — натуральное, формула обрывается сама собой и остается квадрат суммы, куб суммы и т.д. [ Убедитесь в этом для m=2, 3 ].

Разложение (5) можно рассматривать как частный случай (m= –1) разложения (4). Но полезнее увидеть, что это всего лишь сумма бесконечной убывающей геометрической прогрессии со знаменателем q = –x , знакомая каждому школьнику. Именно так её и надо учить.

Последнее разложение (6), благодаря равенству (ln(1 + x)) = (1 + x) 1 получается почленным интегрированием разложения (5) и учетом того, что ln 1 =0 (это дает значение постоянного слагаемого C, возникающего при интегрировании). Проделайте это.

Чтобы пользоваться этими шестью разложениями (в частности, для вычисления пределов), надо:

(A) уметь из них получать разложения для этих же функций в других точках (не в нуле),
(B) уметь получать разложения для функций обратных к этим (хотя бы первые члены),
(C) уметь использовать правило «комбинации функций отвечает такая же комбинация их степенных разложений» (это правило очевидно: степенное разложение — это та же самая функция, но вычисленная иным способом),
(D) знать, что почленное дифференцирование или интегрирование не меняет радиуса сходимости степенного ряда и не нарушает справедливости степенных разложений.

[ В последнем пункте не зря выделено слово » степенной » . Для иных разложений этого свойства может не быть. ]

A) Показываю, как получать разложения для других точек касания.

Например, нас интересует разложение экспоненты для точки x = 2.
Обозначим t — отклонение от точки 2 (влево или вправо в зависимости от знака числа t).
Тогда e 2+t = e 2 e t = e 2 (1 + t + t 2 / 2! + t 3 / 3!+. ) — осталось раскрыть скобки, вместо t везде подставить ( x – 2) (скобки не раскрывать). Получим Тейлоровское разложение в точке 2.

Если основание экспоненты другое, — не беда: a x = e x ln a далее используем разложение экспоненты (1), подставляя в него всюду ( x ln a ) вместо x.

Разложить синус в другой точке? — Пожалуйста. Пусть эта точка обозначена буквой a. Обозначим буквой t отклонение от нее.
Тогда sin(a + t) = sin(a) cos(t)+ cos(a) sin(t) где sin(a) , cos(a) — постоянные числа.
Осталось подставить сюда разложения для cos(t) и sin(t), потом вместо t подставить (xa) (скобки не раскрывать).

Формулу (4) можно рассматривать как разложение функции x m в точке 1. Для этого в формуле (4) вместо буквы x лучше что-то другое писать, например Δх .

Точно так же можно рассматривать и (5,6).

Как использовать эти разложения в иных точках. Например, нам нужно разложение логарифма ln x по степеням отклонения аргумента от точки 2. Обозначаем буквой t отклонение от 2. Тогда ln(2 + t) = ln 2 + ln (1 + t /2). Осталось подставить вместо второго слагаемого разложение (6), заменив в нём везде букву x на t /2. Потом, при желании, можно везде вместо t подставить ( x –2). Получим:

ln x = ln 2 + (x–2)/2 – (x–2) 2 /8 +(x–2) 3 /24 – (x–2) 4 /64 + . где 1 3 + .

Подставим вместо х в левую часть равенства sin(x), в правую часть равенства — тоже sin(x), но в виде степенного разложения (2).

Упрощаем левую и правую части равенства.

Это не просто равенство, это — тожество. То есть равенство верное для всех x из некоторого промежутка (с центром в точке 0). Отсюда следует, что коэффициенты при степенях x в левой и правой частях равенства должны быть одинаковы.

1 = c1 (коэффициенты при x)
0 = c3-c1 /6 (коэффициенты при x 3 )

Замечание: все слагаемые степеней выше 3-й я относил в группу, замененную многоточием.

Замечание 2: то, что c 1 = 1, можно было увидеть на графике. Поскольку график синуса в нуле касается биссектрисы y = x , то и график арксинуса тоже касается.

Замечание 3. Первые члены разложения арксинсуа в точке 0 можно получить и дифференцированием (см. D)

Замечание 4 : Если бы мы пытались использовать тождество sin(arcsin( x)) = x , мы получили бы нелинейную относительно c1, c3 . систему уравнений, которую не смогли бы решить.

C) Показываю, как пользоваться принципом «комбинации функций отвечает такая же комбинация их степенных разложений»

Например, тангенс получается делением синуса на косинус. Поэтому первые члены разложения тангенса в точке 0 можно получить делением «уголочком» ( xx 3 / 3!+ x 5 / 5! – . ) / (1– x 2 / 2! + x 4 / 4! –. ) = x +x 3 /3+2x 5 /15 +. Обязательно проделайте это.

Например, функцию 1/( x 2 –3 x +2) нужно разложить по степеням x (т.е. в окрестности точки 0). Раскладываем дробь в сумму простейших (обычно изучают в теме «интегрирование дробно-рациональных функций») 1/( x 2 –3 x+2) = 1/(x–2) – 1/(x –1) и используем (5):

1/(1 – x) = 1 + x + x 2 + x 3 +.
1/(2 – x) = 0.5 / (1 – x / 2) = 0.5 (1 + x/2 + (x/2) 2 + (x/2) 3 + . )
Складывая получаем 1/( x 2 –3 x+2) = 1/2 + 3 x /4+7 x 2 /8+15 x 3 /16+.

Например, функцию 1/( x 2 –2 x +2) нужно разложить по степеням x . Можно использовать прием предыдущего примера, но поскольку корни знаменателя (их называют полюсами дробно-рациональной функции) комплексные, придется использовать комплексные числа. Ответ будет вещественным 1/2 + x /2 + x 2 /4 – x 4 /8 –. Тем, кто знаком с комплексными числами, рекомендую проделать вычисления.

Но если нужны лишь несколько первых слагаемых, можно в разложение

и потом раскрыть скобки.

Суперпозиции функций отвечает суперпозиция их разложений. По очень простой причине: функция и ее разложение — это одна и та же функция (с оговоркой, что у степенного разложения функции область определения может быть уже, чем у самой функции).

Например: нам нужно разложение функции e cos(x) по степеням x (то есть в окрестности токи 0, такова абсцисса точки касания). Тогда подставляем разложение косинуса в точке 0 в разложение экспоненты в точке 1 (ведь cos(0) = 1).

При таких подстановках возникает необходимость уметь возводить в степень суммы нескольких слагаемых. И вот тут-то и становятся полезны символы Ландау «o — маленькое» или «О — большое». В этих задачах у них простой смысл: они заменяют собой слагаемые высших степеней, выписывать которые нам не нужно.

Например, для точки 0: cos( x) = 1 — x 2 /2! + O(x 4 ) В этом разложении последнее слагаемое заменяет собой все, имеющие порядок не ниже четвертого.

А могли написать и так: cos( x) = 1 — x 2 /2! + o(x 3 ) В этом разложении последнее слагаемое заменяет собой все слагаемые, имеющие порядок строго выше третьего.

Так что между «o маленьким» и «O большим» в этих задачах разница примерно такая же, как между строгим неравенством и нестрогим.

Теперь пишем разложение экспоненты в точке 1:

e 1+t = e ∙ (1 + t + t 2 / 2! + t 3 / 3!+ O(t 4 ))

и подставляем в него отклонение косинуса от единицы:

Когда будем возводить этот двучлен в степени, степени икса — четвертую и выше, относим в группу слагаемых, обозначенную буквами O( x 4 ):

t 2 = (– x 2 /2! + O(x 4 )) 2 = x 4 /4 – x 2 O(x 4 ) + O(x 8 ) = O(x 4 ) + O(x 6 ) + O(x 8 ) = O(x 4 )

Эта, на первый взгляд странная, арифметика на самом деле верна. Ведь мы договорились обозначать O(x 4 ) группу любых слагаемых, имеющих степень не ниже 4.

Поэтому у нас O(x 4 ) + O(x 4 ) = O(x 4 ) и O(x 4 ) – O(x 4 ) = O(x 4 ) и 5·O(x 4 ) = O(x 4 ) и т.д.

В итоге мы получим:

e cos(x) = e ∙ (1 + – x 2 /2! + O(x 4 )) = e – e ∙ x 2 /2! + O(x 4 )

При вычислениях пределов выражений, содержащих эту функцию, при x стремящемся к нулю, можно использовать это её разложение, последнее слагаемое в котором надо рассматривать как самое маленькое, пренебрежимо малое в сравнении с предыдущими.

D) Показываю, как пользоваться дифференцированием и интегрированием.

Разложение арктангенса в точке 0 удобно основать на равенстве ( arctg x ) = 1/(1+x 2 )

Раскладывая полученную дробь как геометрическую прогрессию (5) (вместо x всюду подставить x 2 ) и интегрируя полученное разложение почленно, получим

arctg x = С + x – x 3 /3 + x 5 /5 – x 7 /7 +. где C — произвольная константа интегрирования.

Зная, что arctg 0 = 0, находим, что С = 0.

Разложение арксинуса можно осуществить так же. Производную арксинуса разложить по (4), потом интегрировать полученное разложение почленно .

Разложение арккосинуса можно вести так же, с учетом его значения в нуле, равного π/2 (оно и есть константа, возникающая при интегрировании производной). А можно использовать тождество arcsin x + arccos x = π /2.

То же самое касается арккотангенса.

Дробь 1/(1+ x) 2 легко разложить по степеням x, если заметить, что

Последнее завершает проблему разложения по степеням x дробно рациональной функции (т.е. функции в виде дроби, числитель и знаменатель которой — полиномы от x ). Дело вот в чем. Неправильная дробь ( степень числителя не меньше степени знаменателя) делением числителя на знаменатель представима в виде «многочлен + правильная дробь». А правильная дробь раскладывается в сумму дробей вида 1/ ( xxk ) где xk — корень знаменателя («полюс» функции) и их степеней (вплоть до степени, равной кратности корня). Зная, что степени есть производные (как, например, указано выше) мы сможем писать для них степенные разложения, дифференцируя геометрическую прогрессию.

Если же центр разложения рациональной алгебраической функции не 0, например это число a, — делаем замену x = a + t и ведем разложение по степеням t.

Область сходимости разложения дробной функции имеет радиус, равный расстоянию от центра разложения до ближайшего полюса (в том числе и комплексного, на комплексной плоскости). Например, для функции 1/(1+ x 2 ) полюсы i и –i (т.е. точки (0,1) и (0,-1)). Расстояние до них от точки 0 (т.е. (0,0)) равно 1. Поэтому радиус сходимости разложения по степеням x будет равен 1. А если эту же функцию раскладывать по степеням ( x –2), радиус сходимости будет равен расстоянию от точки 2 до точки i (или — i), т.е. корень из 5.

Наконец, разложения можно осуществлять по степеням величин, обратных к большим.

Например, степенное разложение арктангенса arctg x = x – x 3 /3 +. можно использовать только для -1 2 ) имеет полюсы i и –i, далее см. выше.).

Если же нам нужно степенное разложение арктангенса при больших значениях x , можно поступить так: ( arctg x ) = 1/(1+x 2 ) = (1/x 2 ) (1/(1+1/x 2 )) где второй сомножитель разложить как геометрическую прогрессию с q = –1/ x 2 . Полученное разложение проинтегрировать почленно, а константу интегрирования найти из равенства arctg (+infinity) = π /2.

В итоге arctg x= π/2 –1/ x +1/(3x 3 ) –1/(5x 5 )+. — разложение по отрицательным степеням x , которое можно использовать для больших значений x . Такие разложения называют асимптотическими .

Замечание. Использование в степенных разложениях отрицательных степеней переменной позволяет создавать степенное разложение дробно -рациональной функции с центром даже в её полюсе.

От описания приложений степенных разложений воздержусь. Не рассмотрел я и формул » остатка» степенного разложения. Всё это есть в книжках и описано без ошибок. Потому для данной статьи не нужны.

Понятие дифференциала было введено Лейбницем. Оно обладало ужасными свойствами: по Лейбницу дифференциал был бесконечно малым числом. То есть одновременно — и ненулевым числом и в то же время — по модулю меньше любого положительного вещественного числа. Современники, естественно, не могли с таким изобретением смириться. Да и мы в рамках обычной теории вещественных чисел не можем мириться.

Современная алгебра знает способ создавать такие конструкции — добавить к числам новое » число » , с необычными качествами (похожим приемом, например, изобрели комплексные числа , — добавлением » мнимой единицы » i ). Здесь добавляют » бесконечно малое » число ω . Получается система «гипервещественных» чисел. Фактически именно ее и изобрел Лейбниц ( » нестандартный анализ » ). Точно так же, как в теории комплексных чисел есть способ увидеть, что мнимая единица i есть нечто реальное и осязаемое ( пара вещественных чисел 0 и 1, точка 1 на оси ординат), — точно так же и в нестандартном анализе есть способ придать этому ω понятный вид. Но нам это все без пользы.

Лейбниц , придумывая столь своеобразное определение дифференциала, исходил из практики приближенных вычислений, опирающихся на малый прямоугольный треугольник, чьи катеты есть малые по величине разности (Δх, Δ y ), а гипотенуза, секущая для графика функции, за счет чрезвычайной малости треугольника, почти совпадает с касательной. Идея Лейбница : совпадение секущей с касательной можно сделать сколь угодно хорошим за счет выбора достаточно малых чисел (Δх, Δ y ) (первое задаем, второе получаем из формулы для функции).

Лейбницу хотелось оперировать с этими понятиями в «предельном случае», в идеально точном, когда треугольник становится сколь угодно малым, а секущая сливается с касательной. Именно для такого придуманного им треугольника он употребил слово «разность» ( differentia — по латыни разность, разница) — в виде слова «дифференциал» — в смысле » бесконечно малая разность «, вложил в него это фантастическое свойство — быть числом, но при этом «бесконечно малым». Надо заметить, что сами-то величины приращений ему были не нужны. Ему было нужно их отношение Δ y / Δх (тангенс угла наклона гипотенузы). А это позволяло ему думать, что треугольник у него на самом деле реальный, — ведь его размеры можно было не уменьшать, лишь бы отношение катетов было нужным.

Рис . B. Уменьшающийся треугольник Лейбница (gif — мультфильм) .

Можно еще так сказать : катеты треугольника связаны равенством : Δ y = k Δ x, где k — тангенс угла
Если в этом равенстве уменьшать Δ x , то Δ y тоже уменьшается, но из-за того, что график функции не прямая линия, а кривая, для сохранения равенства должно меняться число k ( коэфициент наклона секущей, тангенс угла). Для многих функций ( их называют дифференцируемыми) существует предельное значение k при стремлении Δ x к 0. Обозначим его k0

Чтобы записывать предельный случай отношения катетов треугольника, Лейбниц использовал букву d вместо буквы дельта dy = k0 dx

О Лейбницевых обозначениях старших производных.

Лейбниц, как и Ньютон, пользовался разностями, — первой ( Δ f = f(x+ Δ x)–f(x)) , второй (разность разностей Δ 2 f = f(x+ Δ x)–2f(x)+ f(x– Δ x) ), третьей (разность вторых разностей) и т.д.

Их обозначают Δ 2 f, Δ 3 f , и т.д. Именно эти разности Лейбниц и хотел довести до (воображаемого им) состояния «бесконечной малости». И в этом состоянии они и были названы им дифференциалами и получили обозначения df; d 2 f; d 3 f и т.д. На этой основе Лейбниц ввел в практику обозначения для производных, широко употребляемые нами:

Это не формулы. Это просто разные обозначения одного и того же. Здесь в левой части равенств — обозначения Лагранжа, в правой части — Лейбница.

Обозначения Лейбница удобны тем, что напоминают его идею получения производных :

f = lim Δ f / Δ x при стремлении Δ x к 0.
f » = lim Δ 2 f / Δx 2 при стремлении Δx к 0
f »’ = lim Δ 3 f / Δx 3 при стремлении Δx к 0
и т.д.

Должен предупредить, что для второй, третьей и т.д. старших производных написанные равенства верны для всех функций, известных школьнику, и подавляющего числа функций, используемых инженером. Но в современной математике вторую производную определяют не так, а как производную от первой производной функции, третью — как производную от второй и т.д. Как ни странно, для некоторых функций это определение дает не то же самое, что написанные выше два последних равенства (и следующие за ними). Чтобы объяснить это явление, надо разговаривать о предельных значениях (пределах) функций нескольких аргументов. Здесь я об этом не могу написать .

Но Лейбниц этого обстоятельства не знал, — и слава богу, как говорится.

Кстати, в некоторых вычислениях на компьютере старшие производные именно такими отношениями разностей (Δ 2 f / Δx 2 и т.д.) и заменяют. Приближенно, разумеется. Но если брать Δx маленьким, приближение получается хорошим.

Значительно позднее, благодаря работам Лагранжа по степенным рядам, люди пришли к соглашению, что дифференциалами надо называть не Лейбницевские странные » бесконечно малые » , а нечто вполне понятное и реальное — числители дробей в формуле (8) :

Например, в разложении 1 – (x–1) + (x–1) 2 – (x–1) 3 + o((x–1) 3 ) слагаемое третьего порядка есть третий дифференциал, вычисленный в точке 1, деленный на 3! :

В тех случаях, когда дифференциал рассматривают как функцию удвоенного числа аргументов, предпочитают такие обозначения:

Здесь два аргумента : x — абсцисса точки касания, Δх — величина отклонения от неё (вправо или влево в зависимости от ее знака), называемая также приращением аргумента (икса ).

Прошу навсегда отметить в памяти, что у всех дифференциалов d n f аргументов ровно в два раза больше, чем у дифференцируемой функции f : это координата точки касания x и отклонение от нее Δх. Это всегда так, в том числе и у функций нескольких аргументов.

Причем зависимость от Δх простейшая, степенная. У функций нескольких переменных — тоже, но в виде многочлена от нескольких переменных (приращений аругментов), однородного по показателю степени n.

В учебниках принято такое
определение ПЕРВОГО дифференциала (по Лагранжу):

функцию f(x ) называют дифференцируемой в точке x, если она существует в некоторой ее окрестности, и для точек x+Δх из этой окрестности ( т.е. для всех достаточно малых Δх ) может быть разложена в сумму вида

где f (x) — некоторый коэффициент, называемый » функцией , производной от f » (или » производной функции f » ), если такое разложение возможно для многих точек x;
линейное по Δх слагаемое f (xх называют первым дифференциалом df функции f в точке x;
o( Δх ) — слагаемое , убывающее быстрее, чем Δх при стремлении последнего к нулю (в том смысле, что отношение o( Δх )/ Δх стремится к нулю ).

Прямо по этому определению можно получить всю таблицу производных.

Например, квадратичная функция в такой вид приводится элементарно :
(x+ Δх ) 2 = x 2 + 2x Δх + Δх 2
поэтому ее производная 2x видна, как говорится, невооруженным глазом.
[ Проделайте то же самое для кубической степенной функции. ]

Определение дифференцируемости функции ничем не отличается от определения ее первого Тейлоровского приближения (т.е. касательной прямой).

А вот старшие дифференциалы в учебниках определяют не как дифференциал дифференциала, а через Лагранжевы формулы (10) , т.е. через старшие производные, которые определяют как производные предыдущих. Т.е. f »(x ) — это коэффициент в разложении первой производной

И хотя при этом и пишут » старший дифференциал есть дифференциал от предыдущего » , всё-таки при этом лукавят, ибо первый дифференциал есть функция не одной, а двух переменных, — и хоть лопни, но сначала надо дать определение дифференциала функции нескольких аргументов и при этом объяснять, почему у старших дифференциалов аргументов столько же, сколько у первого дифференциала, а не в два раза больше.

Отвлекусь . Этот абзац можно читать разве лишь студентам математико — физических факультетов университетов. На самом деле процедура вычисления старшего дифференциала по предыдущему состоит из нескольких этапов [4]: поляризация предыдущего дифференциала (как алгебраической » формы » ), затем линеаризация по тому комплекту аргументов, по которому он нелинеен (это точка касания, аргумент коэффициентов), т.е. собственно дифференцирование в понятных студенту словах, и затем опять симметризация полученной » формы » более высокого порядка . Это описано в [4], но я не думаю, что это всем надо знать. Единственное реальное оправдание такому знанию — оно объясняет, зачем старшим дифференциалам необходимо, чтобы смешанные производные функции нескольких переменных не зависели от порядка их вычисления ( по нескольким переменным ). Это свойство обеспечивает возможность поляризации — то есть восстановления полилинейной формы по ее симметризации. Без этого не получится, что старший дифференциал есть первый дифференциал от предыдущего.

Итак, достаточных объяснений не дают, следовательно, говорить, что для получения старших дифференциалов используют тот же принцип, что и для первого, на самом деле не могут.

В обозначениях (11) формула Тейлора приобретает вид:

где Δ f — приращение функции, порожденное приращением аргумента

У приращения функции, как нетрудно видеть, два аргумента: x и Δх, т.е. Δ f — функция двух аргументов.

В еще более краткой записи формула Тейлора такова:

Δf = df + d 2 f / 2! + d 3 f / 3! + d 4 f / 4. + d n f / n!+ o(Δx n ) (13)

Это — наиболее общая запись формулы Тейлора, пригодная и для функций нескольких переменных и для отображений. Она напоминает разложение (1) и это не случайно. К сожалению, только этим намеком я здесь и могу ограничиться, рассчитывая заинтриговать читателя похожестью (13) и (1).

ОПРЕДЕЛЕНИЕ ПРОИЗВОДНЫХ И ДИФФЕРЕНЦИАЛОВ ПО ПЕАНО

Казалось бы, на основе (12) можно определить все дифференциалы, а не только первый.
Т.е. объявить функцию f дифференцируемой n раз в точке x, если она существует в некоторой ее окрестности и для всех точек x+Δх из этой окрестности верно разложение (12). А коэффициенты этого разложения назвать производными.

Именно так и поступил Пеано в конце XIX века. Все правила дифференцирования можно получить из его определения.

Так, очевидное равенство (старшие по порядку слагаемые, включая o( Δх n ), я для простоты заменил многоточием)

означает, что первая (вторая, третья и т.д.) производная суммы и сумма производных совпадают. (Здесь для облегчения глазам производные обозначены буквами с индексами — порядком производной, — их аргумент не написан, ведь главное то, что производная — коэффициент в многочлене). То же самое — для дифференциалов (это ведь члены этих полиномов).

означает, что постоянный множитель можно выносить за знак операции вычисления производной (любой — первой, второй и т.д.)

А умножив два многочлена и сгруппировав слагаемые по степеням переменной, мы сможем увидеть правило вычисления производной (дифференциала) произведения

Глядя на коэфициенты этого равенства, получаем:

(fg)» = fg» + f g‘ + f »g или d 2 (fg) = f ∙ d 2 g + 2 df ∙ dg + d 2 fg
и т.д. Формула, дающая все эти результаты в общем виде, называется формулой Лейбница ( для старших производных произведения двух функций):

(fg) (m) = fg (m) + m f g (m-1) + m (m-1) f »g (m-1) /2! + m (m-1)(m-2) f »’g (m-2) /3! +.
+ f (m) ∙ g

Наконец, правила вычисления производных (первой, второй и т.д.) или дифференциалов сложной функции (суперпозиции функций) получаются, если составить суперпозицию их степенных разложений. Ниже это проделано.

Казалось бы — как удобно!
Но определение Пеано для старших производных, как выяснилось, является расширением обычного (в котором каждую следующую производную определяют как результат дифференцирования предыдущей). По Пеано оказались дифференцируемы некоторые функции в некоторых точках, которые в обычном смысле старших производных не имеют.
Для того списка функций, с которыми имеет дело студент технического вуза, разницы между этими двумя определениями старших производных нет. Определения же первых производных — по Пеано и обычное (по Лагранжу), как нетрудно видеть, полностью совпадают.
Поэтому рекомендую студенту взять на вооружение подход Пеано к пониманию понятия «производные». Отчитываться перед преподавателем в этом знании не нужно, а вот пользоваться им — полезно.

Замечание. Авторы учебников стараются утвердить студента в вере в то, что каждый следующий дифференциал есть дифференциал от предыдущего и потому порядок дифференциала = количество операций вычисления дифференциала, потребное для его получения. А что такое операция вычисления дифференциала, во всех учебниках объясняют плохо, потому что уже первый дифференциал — функция от двух переменных, а следующий — дифференциал от нее. Т.е. для ясного изложения дифференциалов таким способом нужно рассказать о дифференциале функции нескольких аргументов, чего авторы учебников в этом месте избегают. Вот и получается неясность.

Гораздо важнее в порядке дифференциала видеть порядок степени — той самой степени, в которую возведено Δх. То есть важнее знать, что d 4 f содержит множитель Δх 4 , нежели знать, что он получен четырехкратным применением какой-то там не вполне понятной студенту процедуры » вычисления дифференциала » d.

Замечание 2. Большая часть затруднений студентов проистекает из обилия разных обозначений для аргумента функции, абсциссы точки касания и приращения аргумента. Это надо осознать и сразу все силы бросить на их освоение. Проверьте себя, умеете ли вы по памяти записать формулу Тейлора при таких четырех способах обозначений:

Таблица. Типичные обозначения в формуле Тэйлора

аргумент функции | абсцисса точки касания | приращение арщумента
x x0 x — x0
a + x a x
x a x — a
x + Δх x Δх

[ И еще проверьте, умеете ли вы быстро написать в этих обозначениях разложения (1-6) . ]

Замечание 3. Набор слов » бесконечно малая» (точнее, «бесконечно малая в точке а«) в наших курсах анализа, в отличие от Лейбница, используют для обозначения того факта, что функция f (x) принимает сколь угодно малые значения для всех x, достаточно близких к а (жаргонное выражение — » функция f(x) стремится к 0 при x стремящемся к a» ).

Выражение «вычислить дифференциал в точке a » означает частичное вычисление — подстановку числового значения x = a лишь для первого аргумента, т.е. абсциссы точки касания. Итогом вычисления является степенная функция одного переменного Δх. Ее порядок (степень) и есть порядок дифференциала.

Разумеется, слова «вычислить дифференциал в точке a» — это жаргон, традиция и не более того. Причем традиция, провоцирующая новичка на ошибки. Ведь мало того, что у дифференциала не один, а два аргумента и следовало бы писать d f(a, Δх), так еще и обозначение d f(x ) можно понимать двояко — либо как операцию дифференцирования d, применяемую к функции f(x ), либо как результат ее применения d f (т.е. дифференциал), вычисленный в точке x в указанном выше смысле. В первом случае x — кусочек формулы для f , во втором случае x — абсцисса точки касания. Выяснить, о чем речь, можно только по тексту книжки.

Само по себе такое «вычисление» старших дифференциалов бесполезно. Оно нужно только при построении приближения Тейлора в конкретной точке касания. Т.е. для построения касательной прямой или соприкасающейся параболы и т.п.

Для дифференциала первого порядка «вычислить дифференциал» — то же самое, что написать формулу касательной прямой в терминах приращений. Формула первого приближения

только обозначением Δх = (xa ) отличается от формулы касательной прямой

Таким образом слова «вычислить первый дифференциал в точке a » и «написать формулу касательной прямой в точке касания с абсциссой а» — обозначают одно и то же.

В дифференциальной геометрии есть традиция использовать систему координат, центр которой помещен в точку касания ( a, f(a )), а оси параллельны осям исходной системы. Я буду называть ее локальной системой координат (хотя в дифференциальной геометрии часто локальной системой координат называют такую, у которой оси координат — касательная и перпендикуляр к графику в точке касания).

В этой локальной системе координат за точками кривой y = f(x ) закреплены обозначения отклонений (приращений аргументов) (Δх, Δ y ), а за точками касательной прямой закреплены обозначения (dх, dy).

Таким образом, точка (dх, dy ) в локальной системе координат просто по определению — точка касательной прямой, проходящей, как и график функции, через (0,0). И потому коэффициент ее наклона равен с одной стороны d y / d х, а с другой стороны он же равен f (a ). Иными словами, в дифференциальной геометрии

просто благодаря соглашению, закрепившему за точками касательной прямой обозначение (dх, dy ) (в локальной системе координат).

Т.е. d y — здесь — в лагранжевом смысле, отнюдь не фантастическое лейбницево бесконечно малое число, а реальная величина. Причем дифференциал функции d y от второго аргумента — приращения (не дифференциала!) dx зависит линейно, и обозначают это приращение (отклонение от 0) буквами dх чтобы отличать точку кривой (Δх, Δ y ) от точки касательной прямой (dх, dy).

Неудачная инициатива Коши в этом случае называть dx дифференциалом свободной переменной x замутила не один миллион голов. Рекомендую ее навсегда забыть. Она автоматически ведет к грубейшей ошибке — исчезновению возможности понимать под Δх приращение функции x (от t или от иного аргумента). Объяснение этого см. [1-3] или здесь ниже.

Лейбницевское обозначение производной (9) — такое же, оно вошло в противоречие с лагранжевым пониманием дифференциалов (10), ставшим общепринятым. На это никто не обращает внимания. Лейбницевские обозначения для производных — сами по себе, лагранжево понимание дифференциала — само по себе.

Однако до сих пор я вижу, как в учебниках и лекциях студентам «выводят» лейбницевские обозначения производных из лагранжевых дифференциалов:

df = f d x, «следовательно» f ‘= df / dx
d 2 f = f »dx 2 , «следовательно» f » = d 2 f / dx 2
и так далее.

Из этих «следовательно» проистекает очень много ошибок.
Чтобы их не делать, следует помнить: да, лейбницевские обозначения (9) производных, можно рассматривать как дроби.
Но чтобы не впасть в противоречие со стандартным (Лагранжевым) определением дифференциала обязательно надо помнить следующее
1) в их знаменателях написан не дифференциал, а приращение, обозначенное dx для того, чтобы обозначения координат точки касательной прямой (dх, dy) и точки графика (Δх, Δy) можно было отличать с первого взгляда;
2) в их числителях стоят не какие попало дифференциалы игрека, а те, которые взяты из разложения y по степеням величины dx которая на самом деле есть Δх (при этом не важно, будет ли x свободной переменной или функцией от иных переменных).

Хотите работать с Лейбницевскими обозначениями производных как с дробями и при этом не делать ошибок — лучше тогда пишите их в виде

И под дифференциалами в числителях разумейте таковые из разложения f по степеням Δх.

На самом деле , — повторяю, — обозначения Лейбница (9) для производных из обозначений Лагранжа для дифференциалов вывести невозможно, — дифференциалы в них имеют разный смысл. И сейчас вы в этом еще раз убедитесь — на формуле дифференцирования сложной функции.

Студенту, обученному обращению с производной, формулы дифференциалов сложной функции будет несложно получить на основе лагранжевых формул дифференциалов (11) и формул производной сложной функции.

Обычно в курсе математики выводят формулу лишь первой производной сложной функции. А старшие производные сложной функции — игнорируют. Покажем, как их можно получить.

Первая производная сложной функции. Для y( t) = f (x(t))

или, в обозначениях частных производных

В этих обозначениях мелкая буква внизу, под штрихом, указывает, по какому аргументу брали производную (дифференцировали функцию ) . Т.е. это, вообще говоря, обозначение частной производной. Оно приятнее для глаз, но в нем не упоминаются аргументы полученных производных, написанных здесь, что может вызвать грубые ошибки.

[ Памятуя о предрассудках, вырабатываемых практикой вычисления производных (см. предисловие) уточню, что f (x(t)) означает значение функции f в точке x(t).
Еще раз обращаю внимание на то, что во второй формуле не написано аргументов производных. Они там разные! ]

Эту формулу в учебниках выводят , устремляя Δ t к 0 в равенстве

Лейбниц обозначил итог этого процесса равенством (т.е. у него в нем дифференциалы — как раз те самые придуманные им » бесконечно малые «)

Т.е. в Лейбницевских обозначениях правило дифференцирования сложной функции имеет такой же вид, как правило сокращения дробей (в правой части равенства сокращается dх). Это упоминают во всех учебниках и это помогает запомнить эту формулу.

Лейбниц именно для того и придумал свои бесконечно малые дифференциалы, чтобы правила вычисления производных имели такой же вид, как действия арифметики. С первой производной сложной функции, производной суммы функций, обратной функции, — у него это получилось (напишите их сами). А со второй. Но не будем забегать вперед.

Напоминаю, в нашем понимании дифференциалов, идущем от Лагранжа, эту формулу мы обязаны видеть такой :

И любезное сердцу Лейбница сокращение дроби на dx куда-то исчезло.

Равенство вообще выглядит неверным!

Дело в коварстве обозначений дифференциалов, о котором я уже писал.
В левой части df и в правой части df — это же разные дифференциалы!
В левой части — из степенного разложения f(x(tt)) по степеням Δt.
А в правой части — из разложения f(x(t)+Δx) по степеням Δx.
Причем в обоих разложениях раскладываемая функция одна и та же,

благодаря тому, что Δ x = x(t + Δ t) – x(t), т.е. приращение Δ x не какое попало, а приращение функции x(t ), вызванное приращением Δ t ее аргумента t.
А дифференциалы f — разные. Просто из разных степенных разложений фунции f.

Вот такие детали скрывают от нас стандартные учебники, создавая у студента обманчивое впечатление простоты: сократи, деточка, дробь, и получишь правило дифференцирования сложной функции .
— Не получится ! В рамках того определения дифференциала, которое дает тот же учебник (Лагранжево определение) — не получится. Более того, если взаимно «сократить» Δх и d х , получится неверное равенство.

Чтобы иметь право на такое сокращение, надо под дифференциалами понимать лейбницевские дифференциалы, т.е. воображаемые » бесконечно малые «. А таких в наших учебниках нет. Есть только Лагранжевы.
Вот и учат студенты математику как набор заклинаний, ничего в них не понимая. А как можно понять учебник, который противоречит сам себе ?

» Сократить » Δх и d х в формуле (16) , оставаясь в рамках Лагранжевого определения дифференциала, можно только одним способом: устремить Δ t к нулю. При этом Δх и d х будут эквивалентными (но не равными) бесконечно малыми функциями (в современном понимании этих слов, т.е. стремящимися к нулю). Эквивалентность бесконечно малых, как известно, означает, что их отношение стремится к 1. Никакого иного сокращения здесь, кроме как в пределе, оставаясь в рамках Лагранжева определения дифференциала, не увидеть. Только в пределе! Хотя само равенство верно и без предельного перехода.

Вот вам и » сокращение дроби «. В скольких тысячах учебников в этом месте студентам десятилетиями морочат голову ?!

Вторая производная сложной функции.

Если равенство (14) продифференцировать, применяя правила вычисления производной произведения и производной сложной функции, получим:

А дифференцирование того же равенства в записи (15) даст

Первый дифференциал сложной функции.

Подставим первую производную (14) в лагранжеву формулу дифференциала:

Здесь запись d x(t , Δ t ) надо понимать, как значение функции двух переменных d x (это у функции имя такое) в точке ( t , Δ t ). Если бы шла речь об операции вычисления дифференциала, примененной к функции x(t ), пришлось бы писать d( x(t )), а если бы понадобилось указать еще и аргументы дифференциала, возникло бы трудно читаемое обозначение d( x(t))(t , Δ t).

Если в полученной формуле не упоминать аргументов t , Δ t — она приобретет часто употребляемый в книжках краткий, более легкий для глаз, но коварный отсутствием аргументов вид

То же самое проделаем со вторым дифференциалом сложной функции:

Убирая и здесь с глаз долой аргументы t , Δ t получим менее громоздкую запись

То же самое можно делать и далее. Например формула третьего дифференциала сложной функции в краткой записи, без употребления аргументов, такова

[ Предлагаю читателю вывести её таким же способом в качестве упражнения. ]

Есть иной, весьма прозрачный, чисто алгебраический способ получения этих формул, — использовать принцип «суперпозиции функций отвечает суперпозиция их степенных разложений». Я его воспроизвел в [1,3]. Кратко повторю здесь.

Возьмем разложение приращения функции Δ f = f(x+ Δ x) – f(x ) по степеням приращения аргумента Δ x

и подставим в него вместо числа x число x(t ), а вместо Δx — его разложение в точке t по степеням Δ t , которое, для краткости, запишем в виде (Т2), не содержащем явно аргументов

Δ x = d x +d 2 x /2! + d 3 x /3! +. d n x /n!+o(Δ t n ) (21)

Для получения формул дифференциалов третьего порядка будем использовать полиномы Тейлора 3 порядка (n = 3). Подставим (21) в (20). При возведении Δ x в степени отнесем слагаемые, имеющие порядок выше трех (относительно Δ t ) в остаток в форме Пеано.

Группируя члены по степеням Δ t (показатель степени обозначен в дифференциалах), после выделения факториалов в знаменатель получим из (20) такое разложение

— разложение приращения составной (сложной) функции f(x(t )) по степеням Δ t. Его общий вид

Δ f = d f +d 2 f /2! + d 3 f /3! +. d n f /n!+o(Δ t n ) (24)

Сравнивая (24) и (23), приравнивая члены, содержащие одинаковые степени переменной Δ t, получаем формулы (10-11) для дифференциалов сложной функции f(x(t)).

d f = f (x) dx
d 2 f = f »(x) dx 2 + f (x) d 2 x
d 3 f = f »’(x) dx 3 + 3 f »(x) dx d 2 x+ f (x) d 3 x
(25)

Я обращаю внимание читателя на то обстоятельство, что в формуле d 2 f присутствуют слагаемые из первых двух членов разложения (20), а в d 3 f — из первых трех (и т.д.)

Если бы мы, желая получить формулу второго дифференциала сложной функции f(x(t)) вздумали подставить разложение (21) в формулу одного лишь второго дифференциала d 2 f = f »(x) Δх 2 — мы как раз и сделали бы ту самую ошибку, к которой студента неявно толкают учебники, внушая ему, будто дифференциал есть нечто самостоятельное, не зависимое от формулы Тейлора. На самом деле дифференциал имеет смысл только как часть полинома Тейлора. Про всякий дифференциал ВСЕГДА надо знать, из какого полинома Тейлора (из какого степенного разложения) он взят. Все подстановки в дифференциал вытекают из подстановок функций и аналогичных им подстановок их степенных (Тейлоровских) разложений.

Уберечь нас от такой ошибки должна была такая цепочка рассуждений.

> Ну вот этот вот дифференциал, f »(x ) Δх 2 — это что такое ?
— Это слагаемое второго порядка из разложения f(x+ Δх) (или приращения Δ f) по степеням величины Δх ( с точностью до коэффциента 1/2!).
> А что мы желаем получить ?
— Второй дифференциал функции f(x(t)).
> А это что такое ?
— Член второго порядка из разложения функции f(x(t )) (или ее приращения) по степеням Δ t (т.е. слагаемое, содержащее множитель Δ t 2 ) ( с точностью до коэффциента 1/2!).
> Получим ли мы желаемое, если в d 2 f = f »(x ) Δх 2 подставим разложение Δх по степеням Δ t?
— Не получим. Ведь f »(xх 2 — не вся функция f , а только кусочек из нее, часть ее разложения по степеням Δх. Подставив в него разложение Δх по степеням Δ t , мы и получим разложение не всей функции, а только этого ее кусочка. Нам же нужно разложение всей функции по степеням Δ t. Если мы посмотрим на всю функцию, на равное ей её разложение, по степеням Δх , то увидим, что слагаемое с множителем Δ t 2 имеется не в одном, а в двух местах — во втором f »(xх 2 и в первом f (xх дифференциалах (в первом потому, что Δ t 2 имеется в разложении величины Δх ).

Аналогично — подстановкой разложения в разложение можно получить формулы для дифференциалов сложной функции более высокого порядка. Для получения формул дифференциалов сложной функции порядка m придется использовать разложения порядка m для Δ f (по степеням Δx ) и для Δx (по степеням Δt).

Общую формулу n- го дифференциала суперпозиции двух функций получить невозможно. Ни этим способом, ни каким иным.

Разговоры об » инвариантности первого дифференциала » и » не инвариантности старших дифференциалов » в учебниках, вообще говоря, изначально должны были выполнять ту же роль, — оберегать студента от подстановки x(t) и разложения Δ x по степеням Δ t (21) в одиночные формулы дифференциалов f (n) (x) Δ x n , оторванные от своего полинома Тейлора.

Но сделано это коряво, опасность такой ошибки старались устранить, приведя эту тему в состояние полной неразберихи, галиматьи. И если читатель думает, что опровергать галиматью — простое дело, он ошибается. Галиматья обладает тем свойством, что её определения нечетки и допускают несколько трактовок. А когда у нас k несвязных утверждений, допускающих m трактовок каждое, количество вариантов понимания галиматьи, требующих опровержения, равно примерно m k .

Вот иллюстрация сказанному: статья [2] есть её 18-й вариант, а эта статья — примерно 21-й (я уже сбился со счета). Я вполне понимаю, что не для всякого читателя эта цифра — аргумент. Действительно : мало ли чего написал автор в своих черновиках! Мало ли почему автор так много вариантов перепробовал. Может, у него голова не варит. К тому же с другой-то стороны, его оппоненты, — увенчанные титулами авторы, маститые ученые, миллионные тиражи учебников. Неужели вся страна и все вузы — глупые, один автор умный ?

Мдааа. Ну ладно, убедили. Вставлю и сюда слова, доказывающие, что стандартное изложение — галиматья.

Вот, мы имеем две группы формул для вычисления дифференциалов. Выпишем их в два столбца и разберём вопрос о связях между ними. В левый столбец выпишем лагранжевы формулы дифференциалов. А в правый столбец выпишем формулы дифференциалов суперпозиции двух функций f(x(t)) (дифференциалы «сложной» или «составной» функции).
[ Дальнейший разговор будет об этих двух группах формул, потому выделю их темно-синим цветом, чтобы вашим глазам их искать было легче ]

Каково между ними первое, важнейшее для нас отличие?
— Вот каково. В левом столбце указаны первичные (по Коши — свободные) переменные этих формул (аргументы), — это x (точка касания) и отклонение от нее Δх. Все остальные величины f , f », f »’, dy, d 2 y, d 3 y и т.д. получат числовые значения после того, как мы зададим числовые значения величин x и Δх.

А в правом столбце первичных (то есть тех, которые мы задаем по своему усмотрению, Коши их называл «свободными» переменными) аргументов вообще не написано. В правом столбце первичные переменные «спрятаны» внутрь букв x и d х.

Например, если явно указать, что x есть функция от переменной t, x = x(t ), то тогда d x = есть функция двух аргументов ( t, Δ t ).
Нет, конечно, мы имеем право и для формул правого столбца говорить, что x и d x являются аргументами функции dy.
Но при этом мы обязаны помнить, что d x, d 2 x, d 3 x и т.д. — сами являются дифференциалами, т.е. членами разложения (21) функции Δх по степеням Δ t:
Δ x = d x +d 2 x /2! + d 3 x /3! +. d n x /n!+o(Δ t n )

А кроме того, число свободных (первичных) переменных в формулах правого столбца фиксировано — это аргумент производных функции x (т.е. точка касания, центр разложения) и его приращение. А вот число дифференциалов d x, d 2 x, d 3 x и т.д. в них — неограниченно растет вместе с увеличением порядка n дифференциала d n y. Уже мешает нам считать аргументами дифференциалы d x, d 2 x, d 3 x и т.д.

Если формулы левого столбца разделить на факториалы и сложить — получится разложение Δ f по степеням Δх.
Если тоже самое сделать с формулами правого столбца, — получим тоже разложение Δ f , но другое — по степеням Δ t.
Т.е. в правом столбце стоят члены разложения величины Δ f = f(x(t+ Δ t)) – f(x(t )) по степеням Δ t, а не Δ x.

Нелепость № 1. Массовые учебники создают впечатление (неверное), будто формулы левого столбца из списка (26) нельзя использовать в том случае, когда x — функция. Якобы в этом случае обязательно надо использовать формулы правого столбца. Более того, в некоторых учебниках, считающихся у нас эталонными, прямым текстом написано, что формулы левого столбца якобы становятся неверны в этом случае. Сия мода у нас пошла, мне кажется, от Г.М. Фихтенгольца.

Но на самом деле формулы левого столбца верны в обоих случаях, — и когда x — функция и когда x — свободная (первичная) переменная. Этим формулам глубоко безразлично, каким образом x получил приращение Δ x, — то ли мы сами поменяли его значение, то ли поменяли иные величины, от которых он зависит. Формулам нужна только величина изменения (а не вид на жительство).

То обстоятельство, что х — функция, в формулах левого столбца может проявиться разве лишь в сужении множества значений : функция x(t ) в силу своих особенностей может ограничить множество значений переменной x, — вспомните, например, синус, у которого множество значений всего лишь [-1,1].

Чтобы убедиться в том, что в формулы левого столбца можно подставлять функцию вместо x , достаточно посмотреть на то, как используются разложения Тейлора в тех же книжках при вычислении пределов: их авторы забывают свой собственный запрет и суперпозицию функций заменяют суперпозицией их Тейлоровских разложений (см. например, задачник Кудрявцева). И ведь так поступают начиная с Ньютоновских времён. 300 лет.

В отличие от того, что написано в таких учебниках, мы сами определяем, какую из двух разных формул d y = f (xх или dy = f (x) dx нам использовать. То обстоятельство, является ли x функцией, вовсе не является решающим в этом вопросе (а именно это утверждают учебники). Это два разных дифференциала dy , потому что они являются членами разных разложений y, т.е. по степеням разных величин. Какое разложение нам нужно — ту формулу дифференциала и применяем. Только и всего. А функция ли x или свободная (первичная переменная), — на справедливость этих формул никак не влияет. Они обе верны в обоих случаях (и когда x — свобоная переменная и когда функция).

То же самое верно для дифференциалов функций нескольких переменных. Например, формулы первого дифференциала функции двух переменных z = f(x,y) могут быть таковы

— Они все правильные и притом, несмотря на одинаковость обозначения левой части равенств, это разные дифференциалы dz , т.к. это члены Тейлоровских разложений функции z , — разложений по степеням разных величин.

В этих формулах x и y могут быть и свободными (первичными) переменными и функциями — на справедливости этих формул это никак не отразится. Что бы на этот счет ни писали в учебниках.

И вторые дифференциалы одной и той же функции тоже могут быть разными

И они тоже не страдают от того обстоятельства, являются ли x или y функциями от других переменных (не присутствующих в этих формулах). Здесь d 2 z — разные дифференциалы, т.е. члены разных степенных разложений функции z.

В том случае, когда мы используем величину x или y в качестве первичной (неважно, функция она или нет), в этих формулах мы обнуляем ее старшие дифференциалы и вместо ее первого дифференциала используем ее приращение. Это — частное значение формулы, а не ее какое-то изменение, как казалось Коши.

То есть стандартные слова в учебниках про инвариантность первого дифференциала и не инвариантность старших — неверны. Формулы всех дифференциалов не теряют свой справедливости при изменении статуса аргументов со свободных величин (первичных переменных) на функции или в обратную сторону.

Нелепость №2. Формулу d y = f (x)d х якобы можно рассматривать как обобщение формулы dy = f (xх. Это якобы проистекает из того, что в том частном случае, когда x — свободная переменная, первая формула приобретает вид второй.

Да, приобретает, но следствия такого нет. Вторая формула работает и тогда, когда x — кусочно-гладкая функция, в точке потери ее гладкости. А первая — только тогда, когда x — дифференцируемая функция. То есть в таком смысле вторая формула — более общая. И вообще, это разные формулы, это члены разных степенных разложений!

Да, конечно, если x(t) имеет специфический вид x = t , получим dx = Δ t и первая формула приобретет для наших глаз явный лагранжев вид dy = f (t ) Δ tприращением аргумента). Казалось бы, мы вслед за Коши должны сказать, что формула f (x)dх в частном случае x = t превратилась в формулу f (t) Δt и потому последняя есть частный случай первой.
— Но нет не можем мы этого сказать. Ведь формула f (x)dх и раньше, до этой подстановки имела лагранжев вид. И если чьи-то глаза этого не видели — это его личные проблемы. Действительно:

— т.е. произведение производной на приращение аргумента. Теперь видно ?
Было бы глупо ожидать чего-то иного .

Так что все формулы правого столбца в списке (26) имеют лагранжеву структуру, ту же самую, что и формулы левого столбца, что бы на этот счет ни писали в учебниках. Все дифференциалы в правом столбце есть произведение производных (первой, второй, третьей и т.п.) на соответствующую степень приращения Δ t. [ Упражнение : для второго и третьего дифференциалов убедитесь в этом сами (первый пример я только что привел). ]

В чем же, однако, причина ошибки, растиражированной в миллионах учебников ? Ведь на первый взгляд рассуждение Коши кажется безошибочным!

Причина, как это часто бывает в математике, — в неточности речи. Разберемся.

> Изменится ли формула f (x(t)) ∙ d х (t) = f (x(t)) ∙ х (t) ∙Δ t если мы в нее подставим вместо некой абстрактной функции x(t ) конкретную функцию, например sin t ?
— Нет, не изменится. Она примет конкретное значение. Формула вычисления дифференциала — это не функция, а оператор, если угодно — устройство. У него на входе — не число, а функция. И на выходе — тоже функция. Когда мы в формулу подставили x(t) = t, формула (оператор) не изменилась, не стала другой, она просто обработала эту входную информацию (функцию) и выдала результат (функцию двух аргемунтов), т.е. получила конкретное частное значение .
Для сравнения : подставляя в cos x число x = 0, мы получаем частное значение этой функции — число 1. Мы же не говорим при этом, что функция косинус изменилась! Мы же не требуем при этом везде писать cos 0 вместо 1 ! Мало ли какие функции, операции и т.д. имеют число 1 своим частным результатом!

Точно так же и здесь.

Коши, спровоцировавший эту ошибку, не мог этого понимать, потому что в те времена понятия » оператор » не было. Вот он и употребил слово, наиболее близкое по смыслу. Употребил — и на почти 200 лет обеспечил в России массовую ошибку.
Ну не знал он силы традиции в России ставить букву выше смысла!

Нелепость №3. Последователи Коши решили, что можно навсегда убрать Δ x и оставить dx. Их идея была такова: если x — функция, то под d x понимать дифференциал функции, а если x — свободная (первичная) переменная, то под d x понимать ее приращение Δ x.

Это была неверная идея, потому что она исключает использование формул левого столбца в том случае, когда x — функция. Между тем приращение Δ x функции x , как число, ничем не хуже, чем приращение Δ x свободной переменной x . Такое же число.

Приращение Δ x функции x и ее дифференциал dx — не одно и то же. Нелепое соглашение навсегда убрать из анализа Δ x , оставить только dx , трактуя его как приращение, когда x — свободная (первичная) переменная, и как дифференциал, когда xфункция , лишает студента возможности использовать Δ x как приращение функции x. А это нужно для создания суперпозиции функций и их разложений.

Вообще, сама по себе мысль, что понятия свободная переменная и функция являются антонимами, антиподами, — нелепа. Управляя аргументом функции мы можем придать ей желаемое нами значение. Таким образом, и функция может играть роль первичной переменной в какой-нибудь иной формуле (т.е. свободной переменной в ней)

Нелепость № 4. Первый дифференциал функции f(x) не меняется, когда свободную переменную x заменяют на функцию x(t ), а вот старшие дифференциалы — якобы меняются.

На самом деле никак не меняются ни те ни другие, ни в левом столбце ни в правом. Формулы левого столбца, как я уже писал выше, не имеют зависимости от того, каким способом мы меняем величину аргумента (непосредственно его меняем или через посредство изменения иных величин, от которых он зависит). Говоря о формулах дифференциалов как о работниках (операторах), можем сказать, что их интересует лишь насколько изменился аргумент (величина изменения), но не интересует почему изменился. А формулы правого столбца вообще получены для произвольной дифференцируемой функции x. Можно выбирать ее как угодно. И что, это очевидное свойство надо заново повторять в книжках в виде какого-то особого свойства и называть инвариантностью ? Чего ради ?

Повторяю : то обстоятельство, что кто-то не видел, что формулы правого столбца имеют такую же структуру, как и левого (а иначе их бы и дифференциалами нельзя было бы признать!), — его личная проблема, которую не надо было делать проблемой студентов всей страны.

И вообще, крайне нелепо, бессмысленно говорить, что при подстановке той или иной функции х (t ) в дифференциал его формула меняется. С таким же успехом можно говорить, что при подстановке в cos x значения x = 0 «функция косинус меняется » . Да не меняется она! Она принимает конкретное значение! Точно так же дифференциал, когда в него подставляют конкретную функцию, принимает конкретное » значение » . Только » значение » это — не число, а функция удвоенного числа переменных! Это могли не четко понимать (или нечетко выражать словами) современники Коши. Но ведь с тех пор прошло почти 200 лет!

Нелепость №5. Лейбницевские обозначения производных якобы можно получить из лагранжевых формул для дифференциалов.

Нельзя. Я уже выше писал про то, что дифференциалы Лейбница (которые мы видим в обозначениях производных) и дифференциалы Лагранжа — принципиально разные понятия, хотя и обозначаются одинаково. Производные можно выразить через Лагранжевы дифференциалы, — но с оговорками. Выше я их указал.

Читателю может показаться, что указанные нелепости в теме «дифференциалы» легко устранить, если за основу взять определение Пеано. Т.е. объявить функцию n раз дифференцируемой, если она имеет Тейлоровское приближение n порядка . А все производные (не только первую но и старшие) определить как коэффициенты разложения.

Тогда схема курса лекций будет совсем простой. Левый столбец сверху вниз вычислением производной ( дифференциала) выводить не надо будет (просто по определению его коэффициенты будут производными), а правый столбец будет получаться указанной выше подстановкой, исключающей подобные ошибки мышления.

Так-то так да вон-то как. 19 лет назад я сходил по этой дорожке вместе с моими студентами на Отраслевом факультете (был такой). Первая проблема там та, что определение производных как коэффициентов степенного разложения (т.е. определение Пеано) дает несколько иной, более широкий класс дифференцируемых функций. Я это уже упоминал выше. Для инженерных приложений это неважно, но ревностные блюстители чистоты математики (те самые, которые описанного здесь бревнища в своём глазу 200 лет не видят) и » бдительные » «методисты». L . признающие только один » аргумент » — » так в книжке написано «.

Есть и ещё кое-какие помехи. Я их не до конца рассмотрел. «Методист» пресек мои занятия со студентами. Мне удалось читать свой курс только год.

В общем, в ближайшие годы мы еще поваримся в том же котле, но, надеюсь, с исправлениями, которые я здесь изложил. Надеюсь, что пытливость студентов заставит их искать в интернете объяснения этим несуразностям стандартного курса.
Надеюсь, что найдут мои статьи.
Надеюсь, станут поправлять своих лекторов и тем станет стыдно за повторение чепухи из учебников.
Надеюсь, что в итоге из интернета и курсов лекций исчезнут:
— бред про возможность всегда и везде в формулах первого дифференциала писать лишь dx (этот бред и называют «инвариантностью первого дифференциала»);
— нелепое присваивание понятию «свободная переменная» (т.е. первичная переменная в формуле) роли антонима понятию «функция».

Надеюсь, что никто больше не будет уверять студентов, будто в случае, когда x — функция, надо обязательно отказываться от формул левого столбца (26) и переходить к использованию формул правого столбца. Ведь такое требование равноценно требованию использовать разложения Тейлора для суперпозиции функций только в самом общем виде, т.е. запрет использовать суперпозицию готовых разложений (1-6).

Насилия Фурсенко над нашим образованием, пресловутый бакалавриат (который правильнее назвать бакалопухатом) и «оправдываемое» им резкое сокращение сроков обучения, влекущее малограмотность и отсутствие профессиональных знаний (что болонколюбы тоже за благо выдают, называя их «мобильностью» и «гибкостью», каковых раньше якобы не хватало нашим инженерам) — все это заставляет нас пересматривать курс, переопределять его цели и переставлять акценты. К чему это приведет ? В массе — ко злу. Но заодно даст и добрые ростки, которые в атмосфере стабильности, может, еще долго не появились бы.

Соотношения между дифференциалами и приращениями

Ну и напоследок — несколько иллюстраций из того моего курса 19-летней давности, из числа тех, которые тот «методист» обозвал «не имеющими отношения к делу». Видимо, он счел не относящимся к делу всё, что видел первый раз в жизни (ну не мог же доктор наук признаться, что не понимает почти ничего в конспекте первокурсника рядового технического факультета )

В стандартных учебниках рисуют только одну картинку, показывающую соотношение между Δ y и dy , между Δх и d x. Но бывают и другие слуаи, этой картинке не отвечающие.

Рекомендую помнить, что в дифференциальной геометрии за (Δх , Δ y ) закреплена роль координат точки на кривой (на графике функции), а за (d x , dy) закреплена роль координат точки на касательной прямой. Все эти величины откладываются на осях так называемой локальной системы координат (от слова локус — место, локальная — значит местная), имеющей центром точку касания.

Когда кривая задана явным относительно y выражением y = f(x ), мы имеем Δх = dx, при стремлении которых к 0 эквивалентны (но не равны) бесконечно малые Δ y

dy (т.е разница между ними имеет более высокий порядок малости, чем они сами). [См. Рис. 1]

Рис.1. Это то, что рисуют в книжках.

Когда кривая задана явным относительно x выражением x = g(y ), мы имеем Δ y = dy , при стремлении которых к 0 эквивалентны (но не равны) бесконечно малые Δ x

dx (т.е разница между ними имеет более высокий порядок малости). [См. Рис. 2]

Рис. 2. Такого в книжках обычно не рисуют.

Когда кривая задана параметрически (на t можно смотреть как на время в механике движения точки),

тогда Δ t = dt , при стремлении которых к 0 эквивалентны (но не равны) бесконечно малые Δ x

Рис.3 И этого в книжках тоже не рисуют.

Надеюсь, у читателя возникло ощущение, что на Рис.3 чего-то не хватает?
В самом деле — на первых двух рисунках видны равенства Δх = dx и Δ y = dy , а на третьем равенства Δ t = dt не видно. В чем дело ?
— Не хватает третьей оси — для t. Предлагаю Вам, читатель, нарисовать такой рисунок в качестве домашнего упражнения. Рис.3 окажется лишь проекцией на плоскость XOY построенных вами линий.

Мозги человека, как правило, умнее своего хозяина. Я замечал это много-много раз.
Поэтому доверяйте им. Если что-то вам в голову не лезет —
значит, ваши мозги обнаружили ошибку , только не могут вам об этом сообщить .
Они именно поэтому не могут запомнить то, что вы их заставляете запомнить ,
— там есть ошибка . Ищите ее, эту ошибку . Когда найдете — опять наступит мир
между вами и вашими мозгами , — материал будет усвоен .
Это я говорю такое студентам.

Я получил несколько откликов на [1,2] . Некоторые мои коллеги сообщили мне, что с юношеских лет и сами ощущали смутное беспокойство от » инвариантности -неинвариантности » дифференциалов, но «все руки не доходили» разобраться.
С мат-меха СПбГУ пришло письмо от студента с благодарностью за то, что его сомнения оказались подтверждены моей статьей.
В. И. Полищук, мой коллега, сообщил мне, что этот факт (инвариантность дифференциала в стандартной для учебников версии — полная чушь) давно известен небольшому числу преподавателей. Лет 30 назад он слышал об этом от двоих своих друзей.
Как видите, некоторые преподаватели знали об этом, но, предпочитая не конфликтовать с «методическим» начальством, помалкивали, а в своих курсах лекций пропускали эту тему. Так же поступали и некоторые из тех, у кого «руки не доходили разобраться», что в этой теме «что-то не так».

Однако Научно-методический совет по математике под руководством Л.Д. Кудрявцева (одного из главных виновников широкого распространения этой нелепости в России) включил «инвариантность первого дифференциала» в образцовую программу по математике, — и неразбериха вновь стала победно овладевать умами. Мне это всё, в совокупности с остальной частью «реформ» образования, стало совсем невтерпёж, и я опубликовал статьи.

Я должен признаться, что в интервале [- 35, — 20] лет назад был в числе тех, кто ощущал, что «что-то не так», но » руки не доходили разобраться» и помалкивал. В 1990 году, получив возможность прочесть курс математики так, как считал нужным, изложил студентам этот вопрос правильно (и отнюдь не один лишь этот вопрос). Но тут, как на зло, факультетское начальство возжаждало поставить тройку по математике сыну секретаря райкома, как было сказано, «в интересах НПО Ленинец и отраслевого факультета». Мало того, что молодой человек был математически полностью неграмотен, он еще и был студентом не моего потока. Я наотрез отказался и резко ушел с «совещания» у декана, на которое меня выдернули из аудитории по-барски, прямо с экзамена. Вслед за тем замдекана в коридоре злорадно выразил мне соболезнования по тому поводу, что дни мои на факультете сочтены. Затем мой курс лекций и практических занятий, не имевший аналогов в то время (да и сейчас я не вижу ничего подобного) неожиданно взялся исследовать некий «методист», свежеиспечённый доктор наук, жаждавший стать профессором. Возможность стать профессором зависела от руководства факультета, которое жаждало наказать меня за несговорчивость. «Методист» уверенно облил курс грязью, ничего в нём не понимая. В частности, он написал, будто мой курс насыщен иллюстрациями, не имеющими отношения к делу. Некоторые из тех иллюстраций я привел здесь, судите сами, легко ли без них понять связь между приращением и дифференциалом икса. Он даже не позволил моим студентам высказаться в мою защиту (они сами сорганизовались, без моего участия) на ректорском совещании (была горбачёвская мода на «студенческое участие в управлении институтом»). И меня, худородного, тоже на это совещание пэров, мягко говоря, не пригласили. Мне пришлось на долгие 19 лет замолчать. Я лишь изложил некоторые особенности того курса в интернет — журнале «Математика в ВУЗе».

Однако время идёт. И куда оно так быстро уходит? Дальнейшее мое молчание становится рискованным, — на то, чтобы сыграть в последний раз на дудке, может не остаться времени.
А для решения быстро нарастающих проблем обществу нужно выйти на новый уровень всеобщей грамотности; математика должна соответствовать проблемам общества в целом, а не только инженерного дела; нынешние её курсы соответствуют лишь потребностям инженеров конца XIX — начала XX веков. Уверен, найденная мной с помощью студентов Отраслевого факультета в 1990 году дорожка — верный курс развития преподавания математики в наших ВУЗах.

К сожалению, я не смог дать здесь то, что было в том курсе .
Потому эта статья — очередной » патч » на прорехи стандартного курса .
В том курсе был задействован принцип : дать всестороннее описание базовых понятий, показать их важнейшие интерпретации в разных прикладных дисциплинах, увязать их в единую систему. В частности, производная там была рассмотрена и как коэффициент влияния входа на выход так называемого » черного ящика» (аналог линейного усилителя напряжения в радиотехнике), и как элемент процесса линеаризации (т.е. построения линейного приближения ) функции, отображения, векторного поля (динамической системы). Это именно тот самый принцип, который делает математику собственно математикой — клеем, скрепляющим разные отрасли нашего знания, официальным языком науки, вытеснившим из нее философию Гегеля так же, как химия когда-то вытеснила алхимию. И именно этот, наиважнейший принцип сегодня принесен в жертву новому божеству чиновников от образования — бакалопухату. Принесен в жертву ради резкого сокращения курса, которое выдают за благо . Математику, соль наших естественно — научных знаний, превращают в скудный и потому скучный набор примитивных рецептов уровня » дерни, деточка, за веревочку, — дверца и откроется » , возвращающий нас на столетия назад , в алхимическую культуру средневековых заклинаний и знахарства .
К тому же при столь резком сокращении курса неизбежно возникают грубые нестыковки, ошибки, и мозги студентов бунтуют, отказываются эту мешанину запоминать. Они же ведь умные, наши мозги.

www.spbstu.ru

Популярное:

  • Ходатайство на арест счета должника Заявление на арест имущества судебными приставами Заявление на арест имущества Поле получения на руки определения суда по иску и исполнительного листа необходимо определиться территориально, в какую службу приставов требуется […]
  • Иск дальпитерстрой Спор о вселении и нечинении препятствий в пользовании жилым помещением 2018 Содержание: Как быть, если не впускают в квартиру, где прописан, или не впускают в квартиру, где имеется доля? С такой проблемой сталкиваются многие. […]
  • Штрафы за знак кирпич Что означает дорожный знак «кирпич» и штрафы за нарушение Знак 3.1 «въезд запрещен», в простонародье «кирпич» означает запрет на въезд всех транспортных средств в данном направлении. Проезд под кирпич сегодня вызывает множество […]
  • Употребление мягкого знака после шипящих правило интернет проект BeginnerSchool.ru Сайт для детей и их родителей Мягкий знак после шипящих в именах существительных Давайте посмотрим на рисунок. Почему эти существительные распределены в разные столбики? Обратите внимание, во […]
  • Точка движется по закону x 2-3t+t Урок–зачет по теме "Применение производной" (10–11-е классы) Разделы: Математика Цели урока: Проверить усвоение стандартного материала каждым учеником и оказание помощи учащимся по ликвидации пробелов в процессе личного […]
  • Генер прокурор Генеральная прокуратураРоссийской Федерации Генеральный прокурор Заместители Генерального прокурора О Генпрокуратуре России Международное сотрудничество Взаимодействие со СМИ Правовое просвещение Генеральная […]
  • Разрешение для браузера гугл хром Как устанавливать приложения и управлять ими Вы можете устанавливать приложения из Интернет-магазина Chrome, а также просматривать их список и удалять ненужные. Примечание. Некоторые приложения из Интернет-магазина Chrome […]
  • Адвокаты по семейным делам мурманск Юридическая помощь и консультация юриста по семейным спорам Ни одна семья не застрахована от возникновения конфликтных ситуаций. В системе семейных взаимоотношений обе стороны могут выступать в различных ролях, обладая при этом […]