Смекни!
smekni.com

Психологическая интуиция искусственных нейронных сетей (стр. 12 из 18)

2_20. Бывает, что я говорю незнакомым людям о вещах, которые кажутся мне важными, независимо оттого, спрашивают меня, или нет.

3_21. Вы предпочитаете не заговаривать с людьми, пока они сами к Вам не обратятся.

3_23. Когда Вы узнаете об успехах близкого знакомого, у Вас появляется чувство, что Вы неудачник.

1_24. Сосет ли у Вас под ложечкой перед ответственным разговором?

2_14. Мне доставляет удовольствие совершать рискованные поступки только ради забавы

3_6. Временами в голову приходят такие мысли, что лучше о них никому не рассказывать

2_13. Иногда какая-нибудь навязчивая мысль не дает мне заснуть

2_8. Я предпочел бы иметь дачу (в оживленном дачном поселке / предпочел бы нечто среднее / уединенную, в лесу)

2_1. Я предпочитаю несложную классическую музыку современным популярным мелодиям?

2_22. Когда мною пытаются командовать, я нарочно делаю все наоборот

3_17. Вы часто беспокоитесь о чем-нибудь.

1_22. Бывает ли так, что Вы говорите о вещах, в которых не разбираетесь?

1_16. . Обычно Вам трудно переключать внимание с одного дела на другое?

2_4. У меня бывают такие волнующие сны, что я просыпаюсь

1_11. Испытываете ли Вы постоянную жажду деятельности?

3_19. В гостях Вы держитесь за столом лучше, чем дома.

3_36. Вы легко смущаетесь.

3_30. Вы не осуждаете того, кто стремится взять от жизни все, что может.

2_16. Если бы я работал в хозяйственной сфере, мне было бы интереснее

1_25. Считаете ли Вы свои движения медленными и неторопливыми?

3_32. Справляетесь ли Вы с делом лучше, обдумывая его самостоятельно, а не обсуждая с другими.

2_12. Если кто-то разозлился на меня (Я постарался бы его успокоить / я не знаю, что бы я предпринял / это вызвало бы у меня раздражение)

1_12. Быстро ли Вы читаете вслух?

3_5. Иногда Вы так настаиваете на чем-нибудь, что люди начинают терять терпение

2_18. Обычно я могу сосредоточенно работать, не обращая внимания на то, что люди вокруг меня очень шумят

1_26. Ваша речь обычно медленна и нетороплива?

2_17. Вечер, проведенный за любимым занятием, привлекает меня больше, чем оживленная вечеринка

2_15. Я делаю людям резкие критические замечания, если мне кажется, что они того заслуживают

1_4. Любите ли Вы игры в быстром темпе?

1_13. Если Вы обещали что-то сделать, всегда ли Вы выполняете свое обещание независимо от того, удобно это Вам или нет?

2_9. Я провожу много свободного времени, беседуя с друзьями о тех прежних событиях, которые мы вместе пережили когда-то.

2_6. Иногда у меня бывали огорчения из-за того, что люди говорили обо мне дурно за глаза без всяких на то оснований.

3_27. Вы часто испытываете тягу к новым впечатлениям, к тому, чтобы встряхнуться, испытать возбуждение.

2_23. Люди относятся ко мне менее благожелательно, чем я того заслуживаю своим добрым к ним отношением.

3_1. Часто ли Вы переходите на другую сторону улицы, чтобы не встречаться с кем нибудь из знакомых?

Для определения значимости субтестов теста было произведено вычисление средней значимости по вопросам каждого из них. Субтесты распределились в следующем порядке: наиболее значимый - 1-й, далее - 3-й и наименее значимый - 2-й. Данное распределение можно проиллюстрировать гистограммой (рис. 1). Для построения этой гистограммы все вопросы, отсортированные в порядке убывания значимости, были разбиты на девять десяток, а затем для каждой из них было подсчитано число вхождений вопросов, принадлежащих первому, второму и третьему субтесту.

Рис. 1. Диаграмма распределения вопросов теста по их значимости для предсказания статуса испытуемых.

Для вопросов первого субтеста виден эксцесс распределения в сторону большей значимости, второго - в сторону меньшей, а вопросы третьего - относительно равномерно распределены по всему интервалу.

Была произведена серия экспериментов с целью выяснить достаточный для нейросети объем опросника. На каждом этапе исключалась половина из имеющихся вопросов опросника.

При исключении половины вопросов скользящий контроль консилиума сетей, обученных на выборке по всем группам, дал среднюю погрешность в 24%, при исключении трех четвертей вопросов - в 28% и, наконец, при исключении семи восьмых нейросети обучиться не смогли.

Таким образом, примерно половина вопросов и без того изначально минимизированного теста оказалась для нейросети избыточной, даже приводящей к ухудшению оценки качества предсказания. Оптимальным можно признать опросник из половины вопросов, максимальных по своей значимости для нейронной сети, поскольку результаты тестирования для него лучше чем для всех остальных вариантов, включая и полный набор вопросов.

3.6 Оценка оптимизации задачника нейросетью с позиций теории информации

Разницу между первоначальным (заданным психологом) и требуемым нейросети для успешного решения задачи объемом опросника можно оценить с позиций теории информации [95].

Начальное количество информации, содержащейся в тесте можно оценить исходя из того, что вопросы первого и третьего тестов бинарны (варианты ответов «Да» и «Нет», вероятность наступления каждого из них - 0.5), а ответы на вопросы второго - могут с равной вероятностью соответствовать наступлению одного из трех событий, которые будем считать равновероятными (варианты ответов «А», «Б» и «В», p=0.333). Тогда, исходя из формулы Шеннона

и учитывая, что количество вопросов в первом субтесте - 29, во втором - 25 и в третьем - 36 можем вычислить суммарное количество информации, содержащееся в ответах на вопрос теста:

.

После исключения половины вопросов из-за их малой значимости для нейронной сети в оптимизированном опроснике осталось 16 вопросов первого субтеста, 9 - второго и 20 - третьего. Количество информации, оставшееся после оптимизации:

,

то есть количество информации при оптимизации сократилось несколько более чем вдвое.

3.7 Эксперименты по предсказанию парных взаимоотношений

В этой серии экспериментов предполагалось установить, способны ли нейросети воспроизвести взаимоотношения пары испытуемых.

Обучающие выборки имели следующую структуру: № - номер примера, ID_From - номер оценивающего, ID_From - имя оценивающего, ID_To - номер оцениваемого, Name_To - имя оценивающего, w1_1_From - w3_36_From - ответы на вопросы опросника А.Г. Копытова, данные оценивающим, w1_1_To - w3_36_To - ответы на вопросы опросника А.Г. Копытова, данные оцениваемым, Ocen - данная оценка.

В задачник включались строки, соответствующие всем клеткам социометрической матрицы кроме диагональных, отвечающих за самооценку испытуемых.

Был сформирован задачник по группе 5-го курса. В него вошли 132 примера, по которым было произведено обучение соответствующего числа сетей по методике скользящего контроля.

В силу большой трудоемкости задачи обучения по выбооркам такого объема и размерности (обучение одной сети занимает около 40 мин.) обучения консилиумов не проводилось.

Результат скользящего контроля следующий: средняя относительная ошибка предсказания парных взаимоотношений в группе составила 33,1%.

Затем было вычислено среднее расстояние

между случайными оценками
и
, вычисляемое, как и в п.3.4, по формуле

,

где N - количество примеров обучающей выборки.

Данная величина составила 6.612 (или, относительно шкалы измерения признака, 66.12%), то есть отличие предсказания сети от случайного почти двукратное.

Таким образом, можно говорить, что нейронные сети могут предсказывать не только усредненный статус члена группы, но и взаимоотношения между двумя произвольно взятыми личностями.


Выводы главы 3


Глава 4. Полутораслойный предиктор с произвольными преобразователями

4.1 Постановка проблемы

Функция F на R задана набором своих значений в случайных точках пространства

. Построим ее аппроксимацию при помощи комбинаций
- функций из набора
, гладких и непрерывно дифференцируемых. Тогда

- ошибка аппроксимации F функцией
;

- ошибка предыдущего шага аппроксимации

Аппроксимация может вестись не только подбором коэффициентов, но и выбором на каждом шаге функций

из
. Таким образом может быть получено разложение функции F в сходящийся ряд вида: