Смекни!
smekni.com

Компьютерные технологии в товароведении и экспертизе товаров (стр. 12 из 32)

При линейной модели используется усредненное (среднее) значение между рядом стоящими данными. В экспоненциальной модели – более сложная зависимость.

2. Использование надстроек Пакета анализа.

Надстройки для прогнозирования Скользящее среднее, Экспоненциальное сглаживание, идентичные методам, используемым в первом способе, можно найти в диалоговом окне одноименной команды в меню Сервис (подробно в курсе лабораторных работ). В этом случае в таблице в диапазоне вывода данных можно получить конкретные значения точек сглаживающей линии. Для первых значений данного диапазона характерна нехватка данных для расчета прогнозируемого значения, т.к. определено количество значений, между которыми происходит сглаживание, и если это два значения, то для первого прогнозируемого не хватает одного, а если 3 – то уже двух значений. Поэтому первые значения в диапазоне вывода данных обозначаются как ошибка Н/Д.

3. Использование специальных функций.

Использование встроенных статистических функций ТЕНДЕНЦИЯ (для линейного сглаживания) и РОСТ (для экспоненциального) позволяет расширить процесс прогнозирования, получая расчетные значения признака, как за прошлые, так и будущие периоды времени. Наличие этих значений позволяет при некоторых дополнительных усилиях дать оценку точности прогноза, но явный вид функции ещё не просматривается.

Формат функции ТЕНДЕНЦИЯ имеет следующий вид:

ТЕНДЕНЦИЯ (интервал значений показателя У; интервал значений показателя Х, новые значения Х, константа).

Для выполнения расчетов требуется:

1. установить курсор в клетку таблицы, где должно быть получено первое прогнозируемое значение;

2. обратиться к функции ТЕНДЕНЦИЯ и задать значение показателя У (зависимой переменной) и показателя Х (новые значения Х можно опустить, в таком случае будет предполагаться, что они совпадают с известными значениями Х; константу также можно не задавать).

3. скопировать формулу на весь интервал.

Получение прогноза возможно также и другим способом: в функции ТЕНДЕНЦИЯ можно указать дополнительную переменную в виде адреса клетки, где требуется задать нужный период для прогноза (новое значение Х). В этом случае в клетке, где содержалась формула, использующая данную функцию от 3-х переменных, высветится величина прогноза.

Функция РОСТ в отличие от функции тенденция, которая основывается на линейной зависимости, использует экспоненциальную зависимость, т.е. формирует нелинейную функцию. Порядок работы с ней аналогичен.

4. Использование диаграммы.

При организации процесса прогнозирования первоначально предлагается построить по фактическому временному ряду диаграмму-график. Затем, обратившись к значениям функции на диаграмме, построить тренд с выводом коэффициента аппроксимации и уравнение, на основании которого проводятся расчеты теоретических значений признака. Т.о. может быть получена математическая зависимость в явном виде.

Применение этого способа позволяет расширить круг используемых математических зависимостей за счет полиномиальных, степенных и логарифмических функций. Наличие большого количества нелинейных функций дает возможность выбрать вид наиболее удачной аппроксимирующей функции для экстраполяции изучаемого признака. Для этого лучше использовать диаграмму типа «График» или «Точечная», щёлкнуть правой клавишей мыши на линии графика или маркерах, в появившемся меню выбрать команду Добавить линию тренда и затем в открывшемся окне на вкладке Тип установить тип линии (линейная, степенная, полиномиальная, экспоненциальная, логарифмическая зависимости), на вкладке параметры установить флажки в позициях выводить на экран линию тренда и выводить на экран R^2. Коэффициент R2 показывает уровень надёжности. Чем ближе его значение к единице, тем более верно описываются функции тенденции развития рассматриваемого показателя (ниже 0,5 – моделью пользоваться нельзя, выше 0,5 – можно, выше 0,7 – модель очень хорошая). Появившуюся на диаграмме функцию ввести в таблицу как формулу и путем копирования с использованием относительной адресации (можно при использовании маркера заполнения) получить теоретические значения данного показателя. Чтобы получить прогноз в функцию вместо переменной x поставить нужное значение и подсчитать результирующий показатель y. Или на этапе выбора типа линии тренда на вкладке Параметры указать количество единиц прогноза вперед и/или назад. В этом случае прогноз будет показан на графике.

5. Применение регрессионного анализа.

Этот способ также может рассматриваться как средство для получения прогнозов, поскольку итоговые таблицы позволяют сделать выводы о конкретном виде математической зависимости, а также дать оценку значимости полученной функции и её коэффициентов. Соотношения между количественными показателями множественного коэффициента корреляции, квадрата этого коэффициента и его нормированного значения дают возможность сделать вывод о наличии линейной или нелинейной связи. О приемах его проведения – в следующем вопросе темы.

Вопрос 5. Статистический анализ.

В данном вопросе рассматривается ряд статистических функций, с помощью которых можно описать и подытожить значения в наборе данных.

Под термином переменная понимают одну характеристику объекта или события. Поэтому при статистическом анализе каждый столбец созданной таблицы должен являться одной переменной, т.е. относиться к одной характеристике, например, содержать наименование товара или количество реализованных изделий.

Переменные могут быть количественными или качественными. Количественные пе­ременные должны иметь конкретные числовые значения, напри­мер штуки, вес единицы товара или его цена. Количественные переменные могут быть дис­кретными или непрерывными. Дискретная переменная может прини­мать только целые значения, например такие единицы измерения, как штуки (1, 2, 3 и т.д.). Непрерывная переменная может иметь значения в широком диапазоне величин. Например, вес товара может выражаться дробным, а не обязательно целочисленным значени­ем: 185, 185,5 или 185,562 кг.

Качественные или категориальные переменные относятся к другому типу переменных, которые характеризуют качества или свойства объекта, например цвет или имя продукта. Ка­чественные переменные обычно, но не всегда, выражаются с помощью текстовых строк. Иногда для них используются специализированные числовые коды, к которым не имеет смысла применять арифметические действия.

Специфика деятельности товароведов-экспертов определяет как наболее характерные - исследования, в которых участвуют непрерывные количественные переменные.

Следует отметить, что необходимые статистические функции, которые могут отсутствовать в модуле Пакет анализа (Сервис→Надстройки, после выполнения этой операции в меню Сервис появится команда Анализ данных) можно найти в модуле StatPlus.

Прежде всего в приведенном наборе данных интерес для специалиста представляет анализ распределения значений. Распределение — это способ расположения наблюдений в до­пустимом диапазоне значений. Например, таким образом можно определить количество положительных ответов на вопрос в рамках проведения экспертизы качества социологическим методом или выявить процентную долю изделий с ценой менее 1000 руб. и т.д.

Для получения распределения значений нужно создать таблицу частот (frequency table) для анализируемых дан­ных. Это таблица, в которой собраны сведения о том, сколько раз встречаются данные с определенной величиной. Команда для создания таблицы частот предусмотрена в подключаемом к Excel модуле StatPlus. Для создания таблицы частот необходимо выбрать команду меню StatPlus ® Описательная статистика (Descriptive Statistics) ® Таблицы частот (Frequency Tables), в появившемся диалоговом окне Создание таблицы частот (Create Frequency Table) щелкнуть на кнопке Значения данных (Data Values), затем в диалоговом окне Параметры ввода (Input Options) выбрать переключатель Использовать имена диапазонов (Use Range Names), после чего в списке диапазонов выбрать переключатель, соответствующий нужному наименованию столбца, и щелкнуть на кнопке ОК.

Важным этапом анализа данных является выявление центральных мер распределения значений (среднее, медиана). Вычисление значения каждой из них будет характеризовать весь набор данных. Это значение часто называется типичным или наиболее пред­ставительным. Медиана (median) представляет собой середину распределения, т.е. одна половина заданного набора данных имеет меньшие значения, а другая — большие значения. Точный подсчет медианы зависит от количества наблюдений в наборе данных. При нечетном количестве значений медианой является промежуточное значение, а при четном — полусумма двух центральных значений.

Еще одной распространенной характеристикой является среднее значение (average или mean), которое равно сумме значений, деленной на их количество. Одним из недостатков среднего значения является то, что оно существенно зависит от экстремальных значе­ний. Медиана в большей степени представляет "типичную" величину характеристики, поскольку игно­рирует величину экстремальных значений.

Функциями, позволяющими вычислить перечисленные центральные меры распределения, являются: СРЗНАЧ (массив) и МЕДИАНА (массив).

Следует отметить, что среднее и медиана не полностью характеризуют распределение, так как не учитывают изменчивость данных. Изменчивость характеризует различия между данными или их разброс от центра.

Простейшей мерой изменчивости является диапазон, т.е. разница между максимальным и минимальным значениями распределения. Более высокой изменчивости обычно соответствует более широкий диапазон значений. Однако диапазон значений не совсем точно характеризует изменчивость распределения, поскольку два распределения могут иметь одинаковый диапазон, но с разной изменчивостью.