Смекни!
smekni.com

Описание программы 10 Глава Наиболее часто используемые модули это должен знать каждый. Дополнительные модули. 13 Глава Методы, применяемые для исследования. 16 (стр. 3 из 4)

Clementine - это программа для data mining (добычи знаний), в которой пользователю предлагаются многочисленные подходы к построению моделей, к примеру, нейронные сети, деревья решений, различные виды регрессионного анализа. Clementine представляет собой "верстак" аналитика, при помощи которого можно визуализировать процесс моделирования, перепроверять модели, сравнивать их между собой. Для удобства пользования программой имеется вспомогательная среда внедрения результатов.

Conjoint (совместный анализ) анализ применяется при исследовании рынка для изучения потребительских свойств продуктов на предмет их привлекательности. При этом опрашиваемые респонденты по своему усмотрению должны расположить предлагаемые наборы потребительских свойств продуктов в порядке предпочтения, на основании которого можно затем вывести так называемые детализированные показатели полезности отдельных категорий каждого потребительских свойства.

Программа Data Entry предназначена для быстрого составления вопросников, а также ввода и чистки данных. Заданные на этапе создания вопросника вопросы и категории ответов потом используются в качестве меток переменных и значений.

Exact Tests (Точные тесты) данный модуль служит для вычисления точного значения вероятности ошибки (величины ρ) в условиях ограниченности данных при проверке по критерию χ2 (Chi-Quadrat-Test) и при непараметрических тестах. В случае необходимости для этого также может быть применён метод Монте-Карло (Monte-Carlo).

GOLDMineR программа содержит специальную регрессионную модель для регрессионного анализа упорядоченных зависимых и независимых переменных.

При помощи SamplePower может быть определён оптимальный размер выборки для большинства методов статистического анализа, реализованных в SPSS.

Missing Value Analysis данный модуль служит для анализа и восстановления закономерностей, которым подчиняются пропущенные значения. Он предоставляет различные варианты замены недостающих значений.

Модуль Trends содержит различные методы для анализа временных рядов, такие как: модели ARIMA, экспоненциальное сглаживание, сезонная декомпозиция и спектральный анализ [10].

Complex Samples позволяет учитывать сложные планы выборок при проведении анализа данных опросов и обследований, а также планировать сложные выборки и производить отбор. SPSS Complex Samples позволяет существенно снизить вероятность сделать ошибочные выводы для стратифицированных, кластеризованных и многоэтапных выборок.

Neural Networks cодержит нелинейные процедуры моделирования, позволяющие обнаруживать более сложные взаимосвязи в данных. Процедуры этого модуля являются дополнением традиционных статистических методов, содержащихся в SPSS Statistics Base и дополнительных модулях к нему.

Forecasting прогнозирование временных рядов: модели экспоненциального сглаживания, а также методы оценивания авторегрессионных моделей [6].

Глава 3. Методы, применяемые для исследования.

ОДНОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ – One-way ANOVA – статистический анализ, устанавливающий статистическую значимость различий между средними значениями для трех или более выборок.

Процедура сравнения средних значений выборок, на основании которой можно сделать выводы о соотношении средних значений генеральных совокупностей.

КЛАСТЕРНЫЙ АНАЛИЗ – Cluster analysis - процедура, на основе заданного правила объединяющая объекты или переменные в группы, называемые кластерами. Используется как «разведывательный» анализ в самостоятельном использовании не представляющий статистической ценности, однако позволяющий судить и направлении исследования (сокращает время поиска и подбора методов для каждого конкретно взятого случая исследования).

ОПИСАТЕЛЬНАЯ СТАТИСТИКА – Descriptive statistics – это различные вычисляемые показатели, характеризующие распределение значений переменной. Условно разделены на две группы, первая – меры центральной тенденции, вокруг которых «группируются» данные (среднее значение, медиана и мода), вторая группа характеризует изменчивость значений переменной относительно среднего: стандартное отклонение и дисперсия. Диапазон изменчивости характеризуется минимумом, максимумом и размахом. Асимметрия и эксцесс представляют меру отклонения формы распределения от нормального вида. Существуют величины, отражающие погрешности некоторых статистик.

ДИСКРИМИНАНТНЫЙ АНАЛИЗ –DA – процедура создания формулы регрессии, на основе которой производится разбиение объектов на группы, соответствующие категориям зависимой переменной.

Дискриминантный анализ представляет собой альтернативу множественного регрессионного анализа. Для случая, когда зависимая переменная представляет собой не количественную, а номинальную переменную. Дискриминантный анализ, по сути, решает следующие задачи: предсказание значения «зависимой» переменной и определение того, какие «независимые» переменные лучше всего подходят для такого предсказания. Дискриминантный анализ основан на составлении уравнения регрессии, использующего номинальную зависимую переменную. Уравнение регрессии составляется на основе тех объектов, о которых известна групповая принадлежность, что позволяет максимально точно подобрать его коэффициенты. После того как уравнение регрессии получено, его можно использовать для группировки интересующих исследователя объектов, в целях прогнозирования их принадлежности к какому-либо классу.

Команда дискриминантный анализ непроста и требует настройки множества параметров, работа с которыми лежит в области статистики, но также приводится в руководстве пользователя SPSS.

Параметры дискриминантного анализа определяются особенностями данных и задачами исследователя ввиду того, что дискриминантный анализ - сложная статистическая операция.

Для демонстрации дискриминантного анализа приведем пример пошаговой работы с программой, у опытных исследователей этот процесс с помощью программы занимает порядка 10-15 минут, в то время как при расчете всех этик коэффициентов и параметров «вручную» может занять до нескольких недель.

Таблицы исходных данных могут занимать очень большие объемы.

Рисунок 1. Таблица исходных данных.

Для дискриминантного анализа меню Analize (Анализ) выбираем команду Classify ► Discriminant (Классификация ► Дискриминантный анализ). На экране появляется диалоговое окно Discriminant Analisis (дискриминантный анализ), рис 2.

Рисунок 2. Диалоговое окно дискриминантный анализ.

Диалоговое окно содержит следующие элементы:

· Список доступных переменных (слева);

· Пять стандартных кнопок (справа) - OK, Paste, Reset, Cancel, Help;

· Четыре дополнительных элемента:

Grouping Variable (Группирующая переменная) для задания единственной зависимой переменной. Включает параметр Define Range (Задать диапазон) имеющий два уровня Minumum (Минимум)& Maximum (Максимум);

В список Independents (Независимые переменные) включается любое число переменных, участвующих в дискриминантном анализе в качестве предикторов.

Переключатели Enter independents together (Вводить независимые переменные вместе) и Use stepwise method (Использовать пошаговый метод) позволяют выбрать один из двух вариантов дискриминантного анализа.

Selection Variable (Переменная отбора) позволяет указать имя переменной и ее уровень. Включает параметр Value (Значение).

Четыре кнопки управления дополнительными параметрами: Statistics, Method, Classify, Save.

Кнопка Statistics (Статистики) открывает диалоговое окно Discriminant Analisis: Statistics (Дискриминантный анализ: Статистики), рис. 3. С помощью этих элементов исследователи выясняют наличие зависимостей между предикторами перед началом дискриминантного анализа. Содержит три группы: Descriptives (Описательные статистики): Means (Средние), Univariate ANOVAs (Однофакторный дисперсионный анализ), Box’s M (М Бокса); Function Coefficient (Коэффициенты функций): Fisher’s (Фишер), Unstandardized (Нестандартизированные коэффициенты); Matrices (Матрицы): Within-group correlation (Корреляция внутри групп), Within-group covariance (Ковариация внутри групп), Separate-groups covariance (Ковариация отдельных групп), Total Covariance (Полная ковариация).

Рисунок 3. Диалоговое окно дискриминантный анализ Statistiks.

Кнопка Method (Метод), рис. 4, открывает диалоговое окно Discriminant Analisis: Stepwise Method (Дискриминантный анализ: Пошаговый метод) позволяет выбрать один из пошаговых методов составления дискриминантного уравнения (группа Method), задать критерии для включения в дискриминантное уравнение и исключение из него предикторов (группа Criteria), а также включить в окно вывода желаемые величины – флажки в группе Display.

Рисунок 4. Диалоговое окно дискриминантный анализ Method.

Кнопка Classify (Классификация) открывает диалоговое окно Discriminant Analisis: Classification (Дискриминантный анализ: Классификация). Содержит четыре группы: Prior probabilities (Априорные вероятности); Plots (Диаграммы); Use Covariance Matrix (Использование ковариационной матрицы); Display (Отображать); Replace Missing Values within mean (заменять пропущенные значения средним).

Рисунок 5. Диалоговое окно дискриминантный анализ Classification.