Делицын Леонид, МГУКИ
Исследователи мнений и поведения жителей стран с высоким уровнем развития Интернета получают в распоряжение инновационный инструмент, расширяющий спектр их возможностей при одновременном снижении издержек. Так называемый цифровой разрыв, проявляющийся в углублении пропасти в использовании информационно-телекоммуникационных технологий между богатыми и бедными странами и регионами, создает очевидные конкурентные преимущества исследовательским организациям развитых стран. Определенный урон от цифрового разрыва получают и заказчики онлайн исследований, поскольку продавец последних, как правило, не делает акцента на значительном смещении используемой выборки. В частности, при помощи доступных статистических показателей (таких как количество дней месяца, в каждый из которых пользователь обнаруживал себя в Сети) несложно продемонстрировать, что популярные сегодня в России онлайн панели, измеряющие численность и состав пользователей крупных интернет-ресурсов, не репрезентируют даже среднего пользователя Интернета, а представляют лишь наиболее активных пользователей, не отличаясь в этом отношении от тривиальных онлайн опросов. Иными словами, даже если средний член такой панели похож на среднего интернетчика по полу, возрасту, доходу и некоторым другим характеристикам, он отличается уже тем, что пользуется Сетью почти каждый день, то есть заметно чаще, чем средний пользователь.
Сказанное делает актуальной проблему прогнозирования распространения Интернета в России, поскольку лишь при достижении российскими показателями проникновения «европейского» (или «московского») уровня удастся создать соответствие между выборками, используемыми при онлайн исследованиях, и совокупностями, которые такие выборки должны репрезентировать.
В период начинающейся рецессии, которая может оказаться затяжной, оказываются бесполезными прогнозы распространения Интернета в России, основанные на аналогии с европейскими странами, где основная фаза процесса пришлась на период интернет-бума и экономической стабильности. В то время как распространяющаяся крупная инновация, какой является Интернет, сравнительно малочувствительна к экономическим циклам (многие полагают, что, напротив, крупные инновации и лежат в основе экономических циклов), в России потенциал распространения этого нововведения, сравнительно дорогого для массового потребителя, по-видимому, ограничен численностью среднего класса. В период роста благосостояния населения рос и потенциал распространения Интернета, однако в период рецессии рост потенциала прекращается, причем не на уровне 80–90% населения. Последний существенно зависит от возраста, дохода и места проживания граждан, что в итоге приводит к стагнации проникновения Сети на уровне 30–35%, как это наблюдалось в латиноамериканских странах в начале XXI века. В таком случае Интернет на несколько лет остается своего рода кварталом для молодых и обеспеченных горожан, а старшему поколению, в особенности бедным и одиноким сельским жителям, остается ждать следующей технологической революции.
Бесполезными оказываются и прогнозы распространения Интернета, построенные на основе классических трехпараметрических логистических моделей [1; 2], поскольку они основаны на модели полностью однородного и связного общества («клики»). Такое приближение является слишком грубым для длительных процессов, протекающих в существенно дифференцированном обществе.
Простое обновление параметров моделей распространения нововведений по мере поступления новых данных не всегда приводит к корректным результатам. В частности, данные опросов фонда «Общественное мнение» (ФОМ) об использовании россиянами Интернета в 2002–2007 гг. точнее всего описывает трехпараметрическая логистическая модель с весьма низким потенциалом распространения среди взрослых россиян — 34% [2]. Однако уже в 2006 г. более 50% россиян в возрасте 18–24 лет пользовались Интернетом. Таким образом, предсказанный моделью однородного общества потенциал распространения в 34% подразумевает, что значительная часть россиян, взрослея, полностью отказывается от использования Интернета. Такой вывод не подтверждается наблюдениями.
В настоящей работе предложена количественная модель распространения Интернета в России, параметры которых идентифицируются при помощи данных социологических опросов ФОМ и ВЦИОМ, что позволяет построить среднесрочный прогноз динамики показателей исследуемого процесса.
Отметим, что, по данным опросов ВЦИОМ, проведенных в сентябре и ноябре 2008 г, доля пользователей Интернета среди взрослых россиян (в возрасте 18 лет и старше) составила от 31 до 35%. По данным ФОМ, собранным осенью 2008 г, полная взрослая аудитория также достигла уровня 30% [3]. В частности, для возрастной группы от 18 до 24 лет проникновение Интернета, по данным как ВЦИОМ, так и ФОМ, составило 63%.
Важным фактором будущего роста распространения Интернета стало подключение в 2006–2008 гг. всех российских школ к Сети в рамках национального проекта «Образование». В случае продолжения действия этой программы в ближайшие годы российские выпускники будут вступать во взрослую жизнь, обладая навыками использования Интернета. В благоприятных экономических условиях от применения этого нововведения молодые россияне уже вряд ли откажутся.
При построении прогнозов распространения Интернета в России учитываются историческая динамика этого процесса, возрастная структура общества, рождаемость и смертность. Уравнения одностадийного процесса распространения нововведений с учетом взросления, рождаемости и смертности, которые можно рассматривать как частный случай общих уравнений социальной динамики, приводятся нами в работе [4].
Пусть непрерывная переменная π соответствует дате рождения индивидуума. Совокупность индивидуумов, рожденных в момент π будем называть поколением. Кроме того, разделим общество на два однородных непересекающихся сегмента по полу (мужчины и женщины).
Специфика одностадийных моделей распространения нововведений, выделяющая их среди общих моделей социальной динамики, проявляется в том, что в каждый момент времени t каждый i-й сегмент каждого поколения π разбивается на три непересекающихся подмножества в зависимости от использования нововведения. Численности этих подмножеств удовлетворяют уравнению:
где Xi(t, π), Yi(t, π), Zi(t, π) — численности существующих пользователей, потенциальных пользователей и представителей «недоступного» подмножества — тех, кто никогда не станет использовать нововведение. Многостадийные модели распространения требуют выделения большего числа подмножеств.
Как правило, при исследованиях диффузии нововведений численность подмножеств не оценивают заранее, а вычисляют в ходе оценивания параметров модели. Иногда к их оценке можно привлечь дополнительную информацию или экспертные оценки. (В частности, по данным ФОМ [3], осенью 2008 года 33% населения России в возрасте от 12 лет и старше заявили, что не намерены пользоваться Интернетом — таким образом, можно предположить, что недоступное подмножество не является пустым.) В простейших моделях распространения инноваций численность недоступного сегмента постоянна, а в более сложных (в том числе и в нашей работе) — убывает со временем Изменение численности выделенных подмножеств во времени удовлетворяет уравнениям баланса:
с так называемыми нелокальными граничными условиями
где Bi(t, π) — рождаемость в поколении π сегмента j в момент времени t, μi(t, π) — интенсивность смертности, hi(t, π) — функция риска, т.е. вероятность того, что потенциальный пользователь станет пользователем, fi(t, π, u(t)) — число переходов из «недоступного» подмножества в подмножество потенциальных пользователей в единицу времени, u(t) — «траектория» управляющих параметров (например, цен) во времени, коэффициенты ci(i, j) определяют доли сегментов (в частности, мальчиков и девочек) среди новорожденных.
Наша модель является одностадийной, поэтому слагаемое, описывающее численность перешедших из сегмента потенциальных пользователей в сегмент реальных пользователей, имеет вид произведения: hi(t, π)Yi(t, π) и не включает каких-либо лагов. Таким образом, за малый промежуток времени Δt некоторое число потенциальных пользователей, доля которых составляет h, (t, π)Δt, начинают использовать нововведение. При этом игнорируется история ознакомления индивидуумов с инновацией, возникновения интереса к ней, желания ее приобрести, а также задержка, необходимая для накопления средств на покупку товара или оплату услуги. Рождаемость и интенсивность смертности одинаковы для пользователей, потенциальных пользователей и недоступного сегмента. Все новорожденные считаются потенциальными пользователями.
Для каждого нововведения следует определить конкретный вид функции риска hi(t, π), характеризующей условную вероятность начала использования нововведения потенциальным пользователем. В этой работе мы предполагаем, что влияние различных групп при межличностном общении аддитивно, поэтому используемая нами функция риска суммирует не доли пользователей инновации, а их абсолютные величины:
Такая форма функции риска распространяет наиболее популярную в литературе, посвященной диффузии нововведений, модель Ф. Басса [5] на случай зависимости влияния пользователей на потенциальных пользователей от возраста участников коммуникации. Полученные уравнения (в дискретной форме) были применены нами для моделирования данных ФОМ И ВЦИОМ о распространении Интернета в различных возрастных группах, отдельно для мужчин и женщин. Отметим, что в работе [6] к данным ФОМ о распространении Интернета в возрастных группах была применена логистическая модель Ферхюльста — Перла.