Выбор наиболее подходящей линии тренда для данных. Общая статистика – лекции (дно)

Самым простым типом линии тренда является прямая ли­ния, описываемая линейным (т.е. первой степени) уравнением тренда: где - выровненные, т.е. лишенные колебаний, уровни тренда для лет с номером i;

а - свободный член уравнения, численно равный среднему выровненному уровню для момента или периода времени, принятого за начало отсчета, т.е. для t =0;

b - средняя величина изменения уровней ряда за единицу из­менения времени;

ti - номера моментов или периодов времени, к которым от­носятся уровни временного ряда (год, квартал, месяц, дата).

Среднее изменение уровней ряда за единицу времени - глав­ный параметр и константа прямолинейного тренда. Следова­тельно, этот тип тренда подходит для отображения тенденции примерно равномерных изменений уровней: равных в среднем абсолютных приростов или абсолютных сокращений уровней за равные промежутки времени.

Графическое изображение прямолинейного тренда - прямая линия в системе прямоугольных координат с линейным (ариф­метическим) масштабом на обеих осях.

Основные свойства тренд а в форме прямой линии таковы:

Равные изменения за равные промежутки времени;

Если средний абсолютный прирост - положительная вели­чина, то относительные приросты или темпы прироста посте­пенно уменьшаются;

Если среднее абсолютное изменение - отрицательная вели­чина, то относительные изменения или темпы сокращения по­степенно увеличиваются по абсолютной величине снижения к предыдущему уровню;

Если тенденция к сокращению уровней, а изучаемая вели­чина является по определению положительной, то среднее изме­нение b не может быть больше среднего уровня а;

При линейном тренде ускорение, т.е. разность абсолютных изменений за последовательные периоды, равно нулю.

Параболический тренд и его свойства. Под названием параболического будем иметь в виду тренд, выраженный параболой II порядка с уравнением

=a+b*t+c*t 2

Значения (смысл, сущность) параметров параболы II поряд­ка таковы: свободный член а - это средний (выровненный) уро­вень тренда на момент или период, принятый за начало отсчета времени, т.е. t = 0; b - это средний за весь период среднегодовой прирост, который уже не является константой, а изменяется рав­номерно со средним ускорением, равным 2 с, которое и служит константой, главным параметром параболы II порядка.



Следовательно, тренд в форме параболы II порядка при­меняется для отображения таких тенденций динамики, кото­рым свойственно примерно постоянное ускорение абсолютных изменений уровней.

Основные свойства тренда в форме параболы II порядка та­ковы:

1) неравные, но равномерно возрастающие или равномерно убывающие абсолютные изменения за равные промежутки вре­мени;

2) парабола, рассматриваемая относительно ее математи­ческой формы, имеет две ветви: восходящую с увеличением уровней признака и нисходящую с их уменьшением. Но отно­сительно статистики по содержанию изучаемого процесса из­менений трендом, выражающим определенную тенденцию развития, чаще всего можно считать только одну из ветвей: либо восходящую, либо нисходящую. В особых, более конк­ретных, ситуациях мы не отрицаем возможности объединения обеих ветвей в единый тренд;

3) так как свободный член уравнения а как значение показа­теля в начальный момент (период) отсчета времени, как правило, величина положительная, то характер тренда определяется знаками параметров b и с:

а) при b >0 и с>0 имеем восходящую ветвь, т.е. тенденцию к ускоренному росту уровней;

б) при b <0 и с<0 имеем нисходящую ветвь - тенденцию к ускоренному сокращению уровней;

в) при b > 0 и с<0 имеем либо восходящую ветвь с замедляю­щимся ростом уровней, либо обе ветви параболы, восходящую и нисходящую, если их по существу можно считать единым про­цессом;

г) при b <0 и с>0 имеем либо нисходящую ветвь с замедляю­щимся сокращением уровней, либо обе ветви - нисходящую и восходящую, если их можно считать единой тенденцией;

4) при параболической форме тренда, в зависимости от со­отношений между его параметрами, цепные темпы изменений могут либо уменьшаться, либо некоторое время возрастать, но при достаточно длительном периоде рано или поздно темпы роста обязательно начинают уменьшаться, а темпы сокращения уровней при b <0 и с<0 обязательно начинают возрастать (по абсолютной величине относительного изменения).

Экспоненциальным трендом называют тренд, выраженный уравнением: y i =a*k t i . Свобод­ный член экспоненты а равен выровненному уровню, т.е. уров­ню тренда в момент или период, принятый за начало отсчета времени, т.е. при t= 0. Основной параметр экспоненциального тренда k является постоянным темпом изменения уровней (цен­ным). Если k> 1, имеем тренд с возрастающими уровнями, при­чем это возрастание не просто ускоренное, а с возрастающим ускорением и возрастающими производными всех более высо­ких порядков. Если k< 1, то имеем тренд, выражающий тенден­цию постоянного, но замедляющегося сокращения уровней, причем замедление непрерывно усиливается. Экстремума экс­понента не имеет и при стремится либо к при k > 1, либо к 0 при k< 1.

Экспоненциальный тренд характерен для процессов, разви­вающихся в среде, не создающей никаких ограничений для рос­та уровня. Из этого следует, что на практике он может развиваться только на ограниченном промежутке времени, так как любая среда рано или поздно создает ограничения, любые ресурсы со временем исчерпаемы.

Основные свойства экспоненциального тренда:

1. Абсолютные изменения уровней тренда пропорциональ­ны самим уровням.

2. Экспонента экстремумов не имеет: при k > 1 тренд стремит­ся к + , при k< 1 тренд стремится к 0.

3. Уровни тренда представляют собой геометр про­грессию: уровень периода с номером t =т есть a*k m .

4. При k > 1 тренд отражает ускоряющийся неравномерно рост уровней, при k < 1 тренд отражает замедляющееся неравномерно уменьшение уровней. Поведение основных показателей дина­мики в этих случаях рассмотрено в табл. 5 и 6.

из различных форм гипербол рассмотрим только наиболее простую:

Если основной параметр гиперболы b>0, то этот тренд вы­ражает тенденцию замедляющегося снижения уровней и при .. Таким образом, свободный член гиперболы - это предел, к которому стремится уровень тренда.

Такая тенденция наблюдается, например (рис. 4), при изу­чении процесса снижения затрат любого ресурса (труда, мате­риалов, энергии) на единицу данного вида продукции или ее себестоимости в целом. Затраты ресурса не могут стремиться к нулю, значит, экспонента не соответствует сущности процесса; нужно применить гиперболическую формулу тренда.

Если параметр b<0, то с возрастанием t, т.е. с течением вре­мени, уровни тренда возрастают и стремятся к величине а при .Такой характер динамики присущ, например, показателям КПД двигателей или иных преобразователей энергии.

Основные свойства гиперболического тренда:

1. Абсолютный прирост или сокращение уровней, ускоре­ние абсолютных изменений, темп изменения - все эти показате­ли не являются постоянными. При b>0 уровни замедленно уменьшаются, отрицательные абсолютные изменения, а также положительные ускорения тоже уменьшаются, цепные темпы из­менения растут и стремятся к 100%.

2. При b<0 уровни замедленно возрастают, положительные абсолютные изменения, а также отрицательные ускорения и цеп­ные темпы роста замедленно уменьшаются, стремясь к 100%.

Как видим, гиперболический тренд описывает в любом слу­чае тенденцию такого процесса, показатели которого со време­нем затухают, т.е. происходит переход от движения к застою.

Если изучаемый процесс приводит к замедлению роста ка­кого-то показателя, но при этом рост не прекращается, не стремится к какому-либо ограниченному пределу, то гипербо­лическая форма тренда уже не подходит. Тем более не подходит парабола с отрицательным ускорением, по которой замедляю­щийся рост перейдет со временем в снижение уровней. В указан­ном случае тенденция изменения лучше всего отображается логарифмической формой тренда: i = а + b lnt i .

Логарифмы возрастают значительно медленнее, чем сами числа (номера периодов t i ), но рост логарифмов неограничен. Подбирая начало отсчета периодов (моментов) времени, мож­но найти такую скорость снижения абсолютных изменений, ко­торая наилучшим образом отвечает фактическому временному ряду.

Примером тенденций, соответствующих логарифмическому тренду, может служить динамика рекордных достижений в спорте: известно, что увеличение на 1 см рекорда прыжка в вы­соту или снижение на 0,1 с времени бега на 200 или 400 м требует все больших и больших затрат времени, каждый рекорд дается все большим и большим трудом. В то же время нет и «вечных» рекордов, все спортивные достижения улучшаются, но медлен­нее и медленнее, т.е. по логарифмическому тренду. Нередко та­кой же характер динамики присущ на отдельных этапах развития динамике урожайности или валового сбора какой-то культуры в данном регионе, пока новое агротехническое достижение не при­даст снова тенденции ускорения, что иллюстрирует рис. 4.5.

Рис. 4.5. Динамика валового сбора чая в Китае

Конечно, характер тенденции маскируется колебаниями, но видно, что рост валового сбора замедляется. Это показывают и средние уровни сбора чая:

за 1978-1983 гг. средний сбор равен 333 тыс. т;

за 1984-1989 гг. средний сбор равен 483 тыс. т, рост на 150 тыс. т;

за 1990-1994 гг. средний сбор равен 566 тыс. т, рост на 83 тыс. т.

На рис. 4.5 для убедительности нанесен и логарифмический тренд. Заметны также 5-6-летние циклические колебания валового сбора чая.

Основные свойства логарифмического тренда:

1. Если b >0, то уровни возрастают, но с замедлением, а если b < 0, то уровни тренда уменьшаются, тоже с замедлением.


Можно сделать общий вывод о том, что логарифмический тренд отражает, так же как и гиперболический тренд, посте­пенно затухающий процесс изменений. Различие состоит в том, что затухание по гиперболе происходит быстро при приближе­нии к конечному пределу, а при логарифмическом тренде зату­хающий процесс продолжается без ограничения гораздо медленнее.

4.6. Логистический тренд и его свойства

Логистическая форма тренда подходит для описания такого процесса, при котором изучаемый показатель проходит полный цикл развития, начиная, как правило, от нулевого уровня, сна­чала медленно, но с ускорением возрастая, затем ускорение ста­новится нулевым в середине цикла, т.е. рост происходит по линейному тренду, затем, в завершающей части цикла, рост за­медляется по гиперболе по мере приближения к предельному значению показателя.

Примером такого цикла динамики может служить измене­ние доли грамотного населения в стране, например в России, с 1800 г. до наших дней, или изменение доли семей, имеющих те­левизоры, примерно с 1945 до 2000 г. в России, доли жилищ в городах, имеющих горячее водоснабжение или центральное ото­пление (процесс, еще не законченный). В некоторых зарубеж­ных программах для компьютеров логистическая кривая называется S -образной кривой.

Можно, конечно, логистическую тенденцию считать объе­динением трех разных по типу тенденций: параболической с ускоряющимся ростом на первом этапе, линейной - на вто­ром и гиперболической с замедляющимся ростом - на третьем этапе. Но есть доводы и в пользу рассмотрения всего цикла развития как особого единого типа тенденции со сложными, переменными свойствами, но постоянным направлением из­менений в сторону увеличения уровней в рассмотренных нами примерах или уменьшения уровней, если взять противополож­ный процесс - сокращение доли неграмотных среди населе­ния, доли жилищ, не оборудованных газоснабжением или центральным отоплением, и т.д.

Рассмотрение таких временных рядов, как проявление еди­ной логистической тенденции, позволяет уже на первом этапе рассчитать всю траекторию развития, определить сроки пере­хода от ускоренного роста к замедленному, что чрезвычайно важно при планировании производства или реализации нового вида товара, спрос на который будет проходить все этапы логи­стической тенденции вплоть до насыщения рынка. Так, напри­мер, обеспеченность населения в России автомобилями в конце 1980-х годов находилась на начальном этапе логистической кри­вой, и это означало, что предстоит еще ряд лет или даже десяти­летий ускоренного роста спроса. В то же время обеспеченность фотоаппаратами уже достигла этапа замедления роста и это означало, что расширять производство или импорт прежних типов фотоаппаратов не следует. Расширение их рынка возмож­но было только для принципиально новых типов фотоаппара­тов, насыщенность которыми еще находится в самом начале первого этапа.

В вышеописанном диапазоне изменения уровней, т.е. от нуля до единицы, уравнение логистического тренда имеет вид:

При а 0 >0, а 1 <0 с ростом номеров периодов времени t i полу­чаем логистическую тенденцию роста уровней, причем если нужно начать рост почти от нулевой величины, то а 0 должно быть примерно равно 10, тогда при t = 1
= 0,000123 . Чембольше модуль а 1 , тем быстрее будут возрастать уровни. При а 0 <0, а 1 >0 имеем логистический тренд со снижением уровней, причем, если снижение должно начаться почти от единицы, то а 0 должно быть примерно равно -10. Чем больше а 1 , тем быст­рее будут снижаться уровни, например, при а 0 = -10; а 1 = 1, уже при t i = 20 уровни снизятся почти до нуля.

Если же диапазон изменения уровней ограничен не нулем и единицей, а любыми значениями, определяемыми исходя из су­щества задачи, обозначаемыми у max и у min , , то формула логис­тического тренда принимает вид:

Прогнозирование – это очень важный элемент практически любой сферы деятельности, начиная от экономики и заканчивая инженерией. Существует большое количество программного обеспечения, специализирующегося именно на этом направлении. К сожалению, далеко не все пользователи знают, что обычный табличный процессор Excel имеет в своем арсенале инструменты для выполнения прогнозирования, которые по своей эффективности мало чем уступают профессиональным программам. Давайте выясним, что это за инструменты, и как сделать прогноз на практике.

Целью любого прогнозирования является выявление текущей тенденции, и определение предполагаемого результата в отношении изучаемого объекта на определенный момент времени в будущем.

Способ 1: линия тренда

Одним из самых популярных видов графического прогнозирования в Экселе является экстраполяция выполненная построением линии тренда.

Попробуем предсказать сумму прибыли предприятия через 3 года на основе данных по этому показателю за предыдущие 12 лет.


Способ 2: оператор ПРЕДСКАЗ

Экстраполяцию для табличных данных можно произвести через стандартную функцию Эксель ПРЕДСКАЗ . Этот аргумент относится к категории статистических инструментов и имеет следующий синтаксис:

ПРЕДСКАЗ(X;известные_значения_y;известные значения_x)

«X» – это аргумент, значение функции для которого нужно определить. В нашем случае в качестве аргумента будет выступать год, на который следует произвести прогнозирование.

«Известные значения y» — база известных значений функции. В нашем случае в её роли выступает величина прибыли за предыдущие периоды.

«Известные значения x» — это аргументы, которым соответствуют известные значения функции. В их роли у нас выступает нумерация годов, за которые была собрана информация о прибыли предыдущих лет.

Естественно, что в качестве аргумента не обязательно должен выступать временной отрезок. Например, им может являться температура, а значением функции может выступать уровень расширения воды при нагревании.

При вычислении данным способом используется метод линейной регрессии.

Давайте разберем нюансы применения оператора ПРЕДСКАЗ на конкретном примере. Возьмем всю ту же таблицу. Нам нужно будет узнать прогноз прибыли на 2018 год.


Но не стоит забывать, что, как и при построении линии тренда, отрезок времени до прогнозируемого периода не должен превышать 30% от всего срока, за который накапливалась база данных.

Способ 3: оператор ТЕНДЕНЦИЯ

Для прогнозирования можно использовать ещё одну функцию – ТЕНДЕНЦИЯ . Она также относится к категории статистических операторов. Её синтаксис во многом напоминает синтаксис инструмента ПРЕДСКАЗ и выглядит следующим образом:

ТЕНДЕНЦИЯ(Известные значения_y;известные значения_x; новые_значения_x;[конст])

Как видим, аргументы «Известные значения y» и «Известные значения x» полностью соответствуют аналогичным элементам оператора ПРЕДСКАЗ , а аргумент «Новые значения x» соответствует аргументу «X» предыдущего инструмента. Кроме того, у ТЕНДЕНЦИЯ имеется дополнительный аргумент «Константа» , но он не является обязательным и используется только при наличии постоянных факторов.

Данный оператор наиболее эффективно используется при наличии линейной зависимости функции.

Посмотрим, как этот инструмент будет работать все с тем же массивом данных. Чтобы сравнить полученные результаты, точкой прогнозирования определим 2019 год.


Способ 4: оператор РОСТ

Ещё одной функцией, с помощью которой можно производить прогнозирование в Экселе, является оператор РОСТ. Он тоже относится к статистической группе инструментов, но, в отличие от предыдущих, при расчете применяет не метод линейной зависимости, а экспоненциальной. Синтаксис этого инструмента выглядит таким образом:

РОСТ(Известные значения_y;известные значения_x; новые_значения_x;[конст])

Как видим, аргументы у данной функции в точности повторяют аргументы оператора ТЕНДЕНЦИЯ , так что второй раз на их описании останавливаться не будем, а сразу перейдем к применению этого инструмента на практике.


Способ 5: оператор ЛИНЕЙН

Оператор ЛИНЕЙН при вычислении использует метод линейного приближения. Его не стоит путать с методом линейной зависимости, используемым инструментом ТЕНДЕНЦИЯ . Его синтаксис имеет такой вид:

ЛИНЕЙН(Известные значения_y;известные значения_x; новые_значения_x;[конст];[статистика])

Последние два аргумента являются необязательными. С первыми же двумя мы знакомы по предыдущим способам. Но вы, наверное, заметили, что в этой функции отсутствует аргумент, указывающий на новые значения. Дело в том, что данный инструмент определяет только изменение величины выручки за единицу периода, который в нашем случае равен одному году, а вот общий итог нам предстоит подсчитать отдельно, прибавив к последнему фактическому значению прибыли результат вычисления оператора ЛИНЕЙН , умноженный на количество лет.


Как видим, прогнозируемая величина прибыли, рассчитанная методом линейного приближения, в 2019 году составит 4614,9 тыс. рублей.

Способ 6: оператор ЛГРФПРИБЛ

Последний инструмент, который мы рассмотрим, будет ЛГРФПРИБЛ . Этот оператор производит расчеты на основе метода экспоненциального приближения. Его синтаксис имеет следующую структуру:

ЛГРФПРИБЛ (Известные значения_y;известные значения_x; новые_значения_x;[конст];[статистика])

Как видим, все аргументы полностью повторяют соответствующие элементы предыдущей функции. Алгоритм расчета прогноза немного изменится. Функция рассчитает экспоненциальный тренд, который покажет, во сколько раз поменяется сумма выручки за один период, то есть, за год. Нам нужно будет найти разницу в прибыли между последним фактическим периодом и первым плановым, умножить её на число плановых периодов (3) и прибавить к результату сумму последнего фактического периода.


Прогнозируемая сумма прибыли в 2019 году, которая была рассчитана методом экспоненциального приближения, составит 4639,2 тыс. рублей, что опять не сильно отличается от результатов, полученных при вычислении предыдущими способами.

Мы выяснили, какими способами можно произвести прогнозирование в программе Эксель. Графическим путем это можно сделать через применение линии тренда, а аналитическим – используя целый ряд встроенных статистических функций. В результате обработки идентичных данных этими операторами может получиться разный итог. Но это не удивительно, так как все они используют разные методы расчета. Если колебание небольшое, то все эти варианты, применимые к конкретному случаю, можно считать относительно достоверными.

Для наглядной иллюстрации тенденций изменения цены применяется линия тренда. Элемент технического анализа представляет собой геометрическое изображение средних значений анализируемого показателя.

Рассмотрим, как добавить линию тренда на график в Excel.

Добавление линии тренда на график

Для примера возьмем средние цены на нефть с 2000 года из открытых источников. Данные для анализа внесем в таблицу:



Линия тренда в Excel – это график аппроксимирующей функции. Для чего он нужен – для составления прогнозов на основе статистических данных. С этой целью необходимо продлить линию и определить ее значения.

Если R2 = 1, то ошибка аппроксимации равняется нулю. В нашем примере выбор линейной аппроксимации дал низкую достоверность и плохой результат. Прогноз будет неточным.

Внимание!!! Линию тренда нельзя добавить следующим типам графиков и диаграмм:

  • лепестковый;
  • круговой;
  • поверхностный;
  • кольцевой;
  • объемный;
  • с накоплением.


Уравнение линии тренда в Excel

В предложенном выше примере была выбрана линейная аппроксимация только для иллюстрации алгоритма. Как показала величина достоверности, выбор был не совсем удачным.

Следует выбирать тот тип отображения, который наиболее точно проиллюстрирует тенденцию изменений вводимых пользователем данных. Разберемся с вариантами.

Линейная аппроксимация

Ее геометрическое изображение – прямая. Следовательно, линейная аппроксимация применяется для иллюстрации показателя, который растет или уменьшается с постоянной скоростью.

Рассмотрим условное количество заключенных менеджером контрактов на протяжении 10 месяцев:

На основании данных в таблице Excel построим точечную диаграмму (она поможет проиллюстрировать линейный тип):


Выделяем диаграмму – «добавить линию тренда». В параметрах выбираем линейный тип. Добавляем величину достоверности аппроксимации и уравнение линии тренда в Excel (достаточно просто поставить галочки внизу окна «Параметры»).


Получаем результат:


Обратите внимание! При линейном типе аппроксимации точки данных расположены максимально близко к прямой. Данный вид использует следующее уравнение:

y = 4,503x + 6,1333

  • где 4,503 – показатель наклона;
  • 6,1333 – смещения;
  • y – последовательность значений,
  • х – номер периода.

Прямая линия на графике отображает стабильный рост качества работы менеджера. Величина достоверности аппроксимации равняется 0,9929, что указывает на хорошее совпадение расчетной прямой с исходными данными. Прогнозы должны получиться точными.

Чтобы спрогнозировать количество заключенных контрактов, например, в 11 периоде, нужно подставить в уравнение число 11 вместо х. В ходе расчетов узнаем, что в 11 периоде этот менеджер заключит 55-56 контрактов.

Экспоненциальная линия тренда

Данный тип будет полезен, если вводимые значения меняются с непрерывно возрастающей скоростью. Экспоненциальная аппроксимация не применяется при наличии нулевых или отрицательных характеристик.

Построим экспоненциальную линию тренда в Excel. Возьмем для примера условные значения полезного отпуска электроэнергии в регионе Х:

Строим график. Добавляем экспоненциальную линию.


Уравнение имеет следующий вид:

y = 7,6403е^-0,084x

  • где 7,6403 и -0,084 – константы;
  • е – основание натурального логарифма.

Показатель величины достоверности аппроксимации составил 0,938 – кривая соответствует данным, ошибка минимальна, прогнозы будут точными.

Логарифмическая линия тренда в Excel

Используется при следующих изменениях показателя: сначала быстрый рост или убывание, потом – относительная стабильность. Оптимизированная кривая хорошо адаптируется к подобному «поведению» величины. Логарифмический тренд подходит для прогнозирования продаж нового товара, который только вводится на рынок.

На начальном этапе задача производителя – увеличение клиентской базы. Когда у товара будет свой покупатель, его нужно удержать, обслужить.

Построим график и добавим логарифмическую линию тренда для прогноза продаж условного продукта:


R2 близок по значению к 1 (0,9633), что указывает на минимальную ошибку аппроксимации. Спрогнозируем объемы продаж в последующие периоды. Для этого нужно в уравнение вместо х подставлять номер периода.

Например:

Период 14 15 16 17 18 19 20
Прогноз 1005,4 1024,18 1041,74 1058,24 1073,8 1088,51 1102,47

Для расчета прогнозных цифр использовалась формула вида: =272,14*LN(B18)+287,21. Где В18 – номер периода.

Полиномиальная линия тренда в Excel

Данной кривой свойственны переменные возрастание и убывание. Для полиномов (многочленов) определяется степень (по количеству максимальных и минимальных величин). К примеру, один экстремум (минимум и максимум) – это вторая степень, два экстремума – третья степень, три – четвертая.

Полиномиальный тренд в Excel применяется для анализа большого набора данных о нестабильной величине. Посмотрим на примере первого набора значений (цены на нефть).


Чтобы получить такую величину достоверности аппроксимации (0,9256), пришлось поставить 6 степень.

Зато такой тренд позволяет составлять более-менее точные прогнозы.

Существует шесть различных видов линия тренда (аппроксимация и сглаживание), которые могут быть добавлены в диаграмму Microsoft Graph. Использование линии тренда того или иного вида определяется типом данных.

Точность аппроксимации . Линия тренда в наибольшей степени приближается к представленной на диаграмме зависимости, если величина достоверности аппроксимации равно или близко к 1. При аппроксимации данных с помощью линии тренда значение R-квадрат рассчитывается автоматически. Полученный результат можно вывести на диаграмме.

Арифметическая

Линейная аппроксимация - это прямая линия, наилучшим образом описывающая набор данных. Она применяется в самых простых случаях, когда точки данных расположены близко к прямой. Говоря другими словами, линейная аппроксимация хороша для величины, которая увеличивается или убывает с постоянной скоростью.

В следующем примере прямая линия описывает стабильный рост продаж холодильников на протяжении 13 лет. Обратите внимание, что значение R-квадрат = 0,9036, то есть близко к единице, что свидетельствует о хорошем совпадении расчетной линии с данными.

Логарифмическая

Логарифмическая аппроксимация хорошо описывает величину, которая вначале быстро растет или убывает, а затем постепенно стабилизируется. Описывает как положительные, так и отрицательные величины.

В следующем примере логарифмическая кривая описывает прогнозируемый рост популяции животных, обитающих в ареале с фиксированными границами. Скорость роста популяции падает из-за ограниченности их жизненного пространства. Кривая довольно хорошо описывает данные, поскольку значение R-квадрат, равное 0,9407, близко к единице.

Полиномиальная

Полиномиальная аппроксимация используется для описания величин, попеременно возрастающих и убывающих. Она полезна, например, для анализа большого набора данных о нестабильной величине. Степень полинома определяется количеством экстремумов (максимумов и минимумов) кривой. Полином второй степени может описать только один максимум или минимум. Полином третьей степени имеет один или два экстремума. Полином четвертой степени может иметь не более трех экстремумов.

В следующем примере полином второй степени (один максимум) описывает зависимость расхода бензина от скорости автомобиля. Близкое к единице значение R-квадрат = 0,9474 свидетельствует о хорошем совпадении кривой с данными.

Мощность

Степенное приближение дает хорошие результаты, если зависимость, которая содержится в данных, характеризуется постоянной скоростью роста. Примером такой зависимости может служить график ускорения автомобиля. Если в данных имеются нулевые или отрицательные значения, использование степенного приближения невозможно.

В следующем примере показана зависимость пройденного разгоняющимся автомобилем расстояния от времени. Расстояние выражено в метрах, время - в секундах. Эти данные точно описываются степенной зависимостью, о чем свидетельствует очень близкое к единице значение R-квадрат, равное 0,9923.

Экспоненциальная

Экспоненциальное приближение следует использовать в том случае, если скорость изменения данных непрерывно возрастает. Однако для данных, которые содержат нулевые или отрицательные значения, этот вид приближения неприменим.

В следующем примере экспоненциальная линия тренда описывает содержание радиоактивного углерода-14 в зависимости от возраста органического объекта. Значение R-квадрат равно 1, что означает полное совпадение кривой с аппроксимируемыми данными.

Скользящее среднее

Использование в качестве приближения скользящего среднего позволяет сгладить колебания данных и таким образом более наглядно показать характер зависимости. Такая линия тренда строится по определенному числу точек (оно задается параметром Шаг ). Элементы данных усредняются, и полученный результат используется в качестве среднего значения для приближения. Так, если Шаг равен 2, первая точка сглаживающей кривой определяется как среднее значение первых двух элементов данных, вторая точка - как среднее следующих двух элементов и так далее.

В следующем примере показана зависимость числа продаж на протяжении 26 недель, полученная путем расчета скользящего среднего.