Министерство Образования
Республики Беларусь
Женский Институт ЭНВИЛА
Реферат
по курсу «Маркетинговые исследования»
на тему «Корреляционно-регрессионный анализ в системе маркетинговых исследований»
Минск 2007
ПЛАН
1. Общие положения
2. Корреляция (понятия, методика, экономический смысл)
3. Регрессия (понятия, методика, экономический смысл)
Корреляция и регрессия – это методы входящие в группу экономико-математических методов, используемых при проведении маркетинговых исследований. Они используются для установления взаимосвязей между группами переменных, описывающих маркетинговую деятельность.
Но действие корреляции и регрессии затруднено в связи с:
- сложностью объекта изучения, нелинейностью маркетинговых процессов, временными лагами;
- сложностью измерения маркетинговых переменных. Трудно измерить реакцию потребителей на определенные стимулы, например рекламу;
- неустойчивостью маркетинговых взаимосвязей, обусловленной изменениями вкусов, привычек, оценок и др.
В условиях глубоких и быстрых изменений внешней среды математическая модель не в состоянии предсказать влияние изменения, которое изначально не было в ней учтено. Математическая модель не способна к импровизации и не может приспособиться к изменениям внешней среды.
Расчет корреляций и расчет регрессий - это два последовательных этапа одного и того же анализа данных, который в маркетинге принято называть корреляционно-регрессионным анализом. Они выполняются в аналитическом режиме, который предназначен, в первую очередь, для обеспечения последовательного режима правильной постановкой задачи и наиболее подходящей выборкой из имеющихся данных. Исследователь, применяющий корреляционно-регрессионный анализ, отбирает наиболее адекватные и представительные территории, периоды времени, объекты исследования, виды факторов и т.д. Аналитический режим имеет заданный "вход" - исходную постановку задачи и выборку из данных - и "выход" - фильтрованную постановку задачи и выборку. В остальном он не ограничивает методику анализа.
1.Корреляция используется для качественного анализа: отбора (скрининга) взаимосвязанных факторов, и выделения той части выборки, на которой теснота связи максимальна. Затем для отобранных факторов и подвыборки проводится количественный анализ: строятся регрессионные функции взаимосвязи. Они могут использоваться в информационном конвейере.Информационный конвейер - образует последовательность программных блоков: качество - аналог - количество - риск - цена - спрос. Каждый блок рассчитывает соответствующую группу характеристик на основе информации, получаемой с предыдущего этапа расчета или из баз данных. Результат передается следующему блоку, или же тот подключается напрямую к базе данных.
Область применимости полученных регрессионных функций устанавливается с помощью кластерного анализа или с применением генетических алгоритмов определения области экстраполяции.
Кластерный анализ - разбиение выборки на группы (кластеры). Кластеры должны быть компактными, иначе говоря, расстояние между разными кластерами должно быть больше, чем среднее расстояние между точками внутри одного и того же кластера.
Генетические алгоритмы осуществляют поиск оптимума сразу несколькими вариантами комбинаций параметров. Процесс поиска включает три основных этапа, повторяемых в цикле:
-эволюция - сдвиг варианта в направлении ожидаемого оптимума с использованием, вообще говоря, как производных критерия по параметрам, так и стохастических "скачков";
-отсеивание "неудачливых" вариантов;
-скрещивание "удачливых" вариантов: порождение вариантов - "потомков", сочетающих удачные значения параметров "родителей".
Название "генетические алгоритмы" связано с тем, что они воспроизводят современные представления о естественном отборе: скрещивание генотипов - определение удачности порожденных фенотипов - отсев неудачников из набора партнеров для следующего скрещивания.
В качестве коррелируемых факторов выбираются данные в координатных интервалах одного или двух блоков. Для каждой пары факторов рассчитывается обычный коэффициент корреляции. При этом суммирование производится по переменным развертки. Переменная развертки - переменная, играющая роль оси, вдоль которой развертываются данные, например, абсцисса на графике. Одновременно играет роль генератора статистики: в ней производится суммирование данных при вычислении статистических показателей: коэффициента корреляции, коэффициентов регрессии и др. Обычно это пространство и/или время. Таким образом, корреляция отражает пространственно-временную синхронность между, скажем, повышением конкурентоспособности и качества продукции и повышением спроса на него.
Если маркетолога интересует связь между двумя метрическими переменными, то используется парная корреляция. Данная корреляция характеризуется коэффициентом корреляции Пирсона. Частный коэффициент корреляции – мера зависимости между двумя переменными после корректировки эффектов переменных. Коэффициент корреляции изменяется от -1 до +1. Абсолютная величина коэффициента характеризует тесноту связи, а знак указывает на ее направление.
Парная корреляция отвечает на такие вопросы, как, например:
- Насколько сильно связан спрос с расходами на рекламу?
- Связано ли восприятие качества товаров потребителями с их восприятием цены?
Частная же корреляция – на:
- Если брать зависимость спроса от затрат на рекламу, то существует ли влияние ценового фактора.
- А при изучении влияния качества и цены, существует ли эффект торговой марки.
Частная корреляция может быть полезна для выявления ложных связей.
Ни с одним из этих видов корреляции не возникает проблем, если данные измерены с помощью интервальной или относительной шкал. Но есть и неметрические переменные, которые нельзя измерить с помощью интервальной или относительной шкалы и они не подчиняются закону нормального распределения. В этих случаях используются коэффициенты Спирмена и ранговая корреляция Кендала, а сама корреляция называется неметрической. Различие этих коэффициентов в том, что коэффициент ранговой корреляции Кендала используется, когда большая часть наблюдений попадает в относительно немногочисленные категории, а коэффициент ранговой корреляции Спирмена наоборот, – когда существует множество категорий.
Пример использования корреляционного анализа на практике:
Маркетологи, занимающиеся изучением отношения потребителей к торговым маркам, обнаружили, что для таких товаров, которые продаются с минимальным участием продавцов, отношение покупателя к рекламе служит промежуточным звеном между распознаванием брэнда и отношением к нему. Они сделали попытку узнать, что будет с этой промежуточной переменной, если товары покупаются через компьютерную сеть. Одна из компаний в Венгрии исследовала воздействие на покупки непосредственно рекламы. Маркетологи провели опрос, в ходе которого измерялись различные показатели. После этого необходимо было вычислить частный коэффициент корреляции между отношением к брэнду и доверием к нему с одновременным исключением влияния отношения к рекламе. Данный корреляционный анализ показал, что отношение к рекламе действительно высокозначимое и влияет на покупки потребителей, т.к. частный коэффициент корреляции был значительно меньше, чем парный коэффициент между доверием к брэнду и отношением к нему.
2. Регрессионный анализ – это метод установления формы и изучения связей между метрической зависимой переменной и одной или несколькими независимыми переменными.
Регрессионный анализ используют в тех случаях, когда:
- необходимо установить, реально ли есть взаимосвязь между переменными;
- необходимо установит тесноту связи зависимых и независимых переменных;
- нужно определить форму связи;
- нужно предсказать значение зависимой переменной;
- необходимо осуществлять контроль над независимыми переменными при определении вкладов конкретной переменной.
Для проведения регрессионного анализа необходимо следующее:
-Выбор одного блока, из которого берется координатный интервал, чьи данные дают зависимую переменную регрессии.
-Выбор одного или нескольких блоков, из которых аналогично берутся факторы в качестве независимых переменных регрессии. При этом необходимо, чтобы блок, дающий зависимую переменную, и все блоки, дающие независимые переменные, имели какие-либо общие координаты (обычно пространство и время), которые служат переменными развертки и дают точки, по которым проводится регрессионная кривая или поверхность.
-Выбор типа и "степени" функций от независимых переменных, которые включаются в регрессию.
-Задание координатных интервалов переменных сравнения, внутри которых регрессионная функция не должна значимо изменяться.
-Определяется точность предсказания. Для этого находится стандартная ошибка оценки регрессии.
Регрессия проводится последовательно с увеличением числа независимых переменных и степени регрессионной функции. При этом общесистемным оптимизатором находится минимум среднеквадратичного отклонения точек данных от регрессионной кривой.
Для регрессионной кривой вычисляются характеристики неопределенности - показатели тесноты регрессии: кривые доверительного интервала и коэффициент детерминации. Последний может вычисляться сразу для всех комбинаций "зависимая переменная - независимая переменная".
Как и корреляция, регрессия рассчитывается для фиксированных координатных интервалов каждой переменной сравнения. Проверяется устойчивость регрессии к смене координатного интервала на том же уровне иерархии.