Нові тенденції і прикладні аспекти інженерії знань (стр. 2 из 6)

Сьогодні багатовимірне градуювання – це математичний інструментарій, призначений для обробки даних про попарну схожість, зв’язки або відношення між аналізованими об’єктами з метою представлення цих об’єктів у вигляді точок деякого координатного простору. Багатовимірне градуювання є одним з розділів прикладної статистики, наукової дисципліни, що розробляє і систематизує поняття, прийоми, математичні методи і моделі, призначені для збору, стандартного запису, систематизації і обробки статистичних даних з метою їх лаконічного представлення, інтерпретації і отримання наукових і практичних висновків. Традиційно багатовимірне градуювання використовується для вирішення трьох типів завдань:

- пошук і інтерпретація латентних (тобто прихованих, безпосередньо не спостережуваних) змінних, що пояснюють задану структуру попарних відстаней (зв’язків, близькостей);

- верифікація геометричної конфігурації системи аналізованих об’єктів в координатному просторі латентних змінних;

- стиснення початкового масиву даних з мінімальними втратами в їх інформативності.

Незалежно від завдання багатовимірне градуювання завжди використовується як інструмент наочного представлення (візуалізації) початкових даних. Багатовимірне градуювання широко застосовується в дослідженнях щодо антропології, педагогіки, психології, економіки, соціології [15].

В основі даного підходу лежить інтерактивна процедура суб’єктивного градуювання, коли випробовуваному (тобто експертові) пропонується оцінити схожість між різними елементами за допомогою деякої градуйованої шкали (наприклад, від 0 до 9, або від -2 до +2). Після такої процедури аналітик розташовує чисельно представленими стандартизованими даними, що піддаються обробці існуючими пакетами прикладних програм, що реалізовують різні алгоритми формування концептів вищого рівня абстракції і що будують геометричну інтерпретацію семантичного простору в евклідової системі координат.

Основний тип даних в багатовимірному градуюванні – заходи близькості між двома об’єктами (i, j) – dij. Якщо міра близькості така, що найбільші значення dij відповідають парам найбільш схожих об’єктів, то dij – міра подібності, якщо, навпаки, найменше схожим, то dij – міра відмінності.

Багатовимірне градуювання використовує дистанційну модель відмінності, використовуючи поняття відстані в геометрії як аналогію схожості і відмінності понять. Для того, щоб функція d, визначена на парах об’єктів (а, b), була евклідовою відстанню, вона повинна задовольняти наступні чотири аксіоми:

Тоді, згідно звичайній формулі евклідова відстань, міра відмінності двох об’єктів i та j із значеннями ознаки k у об’єктів i та j відповідно x_ik та x_jk:

Дистанційна модель була багато разів перевірена в соціології і психології [16], що дає можливість оцінити її придатність для використання.

У більшості робіт по багатовимірному градуюванню використовується матрична алгебра. Геометрична інтерпретація дозволяє представити абстрактні поняття матричної алгебри в конкретній графічній формі. Для полегшення інтерпретації рішення задачі багатовимірного градуювання до попередньо оціненої матриці координат стимулів X застосовується обертання.

Серед безлічі алгоритмів багатовимірного градуювання широко використовуються різні модифікації метричних методів Торгерсона [17], а також неметричні моделі, наприклад Крускала [18].

При порівнянні методів багатовимірного градуювання з іншими методами аналізу, теоретично застосовними в інженерії знань (ієрархічний кластерний аналіз або аналіз чинника), багатовимірне градуювання виграє за рахунок можливості дати наочне кількісне координатне уявлення, що переважно є простішим і тому легше інтерпретується експертами.

1.3 Використання метафор для виявлення «прихованих» структур знань

Не дивлячись на близькість завдань, інженерія знань і психосемантика істотно відрізняються як в теоретичних підставах, на яких вони базуються, так і в практичних методиках. Але головна відмінність полягає в тому, що інженерія знань направлена на виявлення, як остаточного результату, моделі міркувань, динамічній або операційної складової ментального простору (або функціональної структури поля знань S_f), тоді як психосемантика, намагаючись представити ментальний простір у вигляді евклідового простору, дозволяє робити видимою статичну структуру взаємного «розташування» об’єктів в пам’яті, у вигляді проекцій скупчень об’єктів (концептуальна структура S_k).

Крім цього слід зазначити ряд недоліків методів психосемантики з погляду практичної інженерії знань.

Оскільки в основі психосемантичного експерименту лежить процедура вимірювання суб’єктивних відстаней між стимулами, що пред’являються, то і результати обробки такого експерименту, як правило, використовують геометричну інтерпретацію – евклідовий простір невеликого числа вимірювань (найчастіше – двовимірне). Таке сильне спрощення моделі пам’яті може привести до неадекватних баз знань.

Природність ієрархії як глобальної моделі понятійних структур свідомості служить методологічною базою ОСП. Крім того, і в природній мові поняття явно тяжіють до різних рівнів узагальнення. Проте в більшості прикладних пакетів не передбачено розбиття семантичного простору на рівні, що відображають різні ступені спільності понять, включених в експериментальний план. В результаті отримувані кластери понять, просторово ізольовані в геометричній моделі градуювання, носять таксономічно неоднорідний характер і важко піддаються інтерпретації.

Єдині відносини, що виявляються процедурами психосемантики, – це «далеко – близько» за деякою шкалою. Для проектування і побудови баз знань виявлення відношень є на порядок складнішим завданням, ніж виявлення понять. Тому семантичні простори, отримані в результаті градуювання і кластеризації, повинні бути піддані подальшій обробці на предмет визначення відношень, особливо функціональних і каузальних.

Не варто очікувати, що ці протиріччя можуть бути вирішені швидко й безболісно, оскільки, математичний апарат, покладений в основу всіх пакетів прикладних програм з психосемантики, має певні межі застосування. Однак одним з можливих шляхів зближення без порушення чистоти процедури бачиться розширення простору конкретних об’єктів-стимулів предметної області за рахунок додавання деяких абстрактних об’єктів зі світу метафор, які змусять випробуваного експерта вийти за рамки об’єктивності у світ суб’єктивних уявлень, які найчастіше більшою мірою впливають на його міркування й модель прийняття рішень, ніж традиційні правильні погляди.

2. Метод репертуарних решіток

2.1 Основні поняття

Серед методів когнітивної психології – науки, що вивчає те, як людина пізнає і сприймає світ, інших людей і самого себе, як формується цілісна система уявлень і відношень конкретної людини, – особливе місце займає такий метод особової психодіагностики, як метод репертуарних решіток (repertory grid).

Вперше метод був сформульований автором теорії особистісних конструктів Джорджем Келлі в 1955 р. Чим ширший набір особистісних конструктів у суб’єкта, тим більш багатовимірним, диференційованим є образ світу, людини, інших явищ і предметів, тобто тим вище його когнітивна складність.

Репертуарна решітка є матрицею, яку заповнює або сам випробовуваний, або експериментатор в процесі обстеження або бесіди. Стовпцю матриці відповідає певна група об’єктів, або, інакше, елементів. Як об’єкти можуть виступати люди, предмети, поняття, відношення, звуки, кольори – все, що цікавить психодіагностика. Рядками матриці є конструкти – біполярні ознаки, параметри, шкали, альтернативні протилежні відношення або способи поведінки. Конструкти або задаються дослідником, або виявляються у випробовуваного за допомогою спеціальних прийомів і процедур виявлення. Вводячи поняття конструкта, Келлі об’єднує дві функції: функцію узагальнення (встановлення схожості) і функцію зіставлення. Він пропонує декілька визначень поняття «конструкт». Одне з яких:

Конструкт – це деяка ознака або властивість, за якою два або декілька об’єктів схожі між собою і, відповідно, відмінні від третього або декількох інших об’єктів.

Наприклад, виділення з трьох предметів «диван, крісло, стілець» двох «диван і крісло» виявляє конструкт «м’якість меблів». Келлі в своїх роботах підкреслює біполярність конструктів. Він вважає, що, стверджуючи що-небудь, ми завжди одночасно щось заперечуємо. Саме біполярність конструктів робить можливою побудову репертуарних решіток. Наприклад, північ – південь – це референтна вісь: елементи, які в одному контексті є «північчю», в іншому стають «півднем».

Можливості конструкта обмежені. Вони можуть бути застосовані тільки до деяких об’єктів. Це знайшло своє віддзеркалення в понятті «діапазону придатності» конструкта. Англійські психологи Франселла і Банністер вважають правило «діапазону придатності» відмінною рисою техніки репертуарних решіток. Під діапазоном придатності можна розуміти область уявлень людини про світ, поняття якої можна співвіднести з конкретною референтною віссю конструкта, що виділявся. Психологічно осмислений результат вийде тільки в тому випадку, якщо елементи, використовувані в репертуарних решітках; потраплятимуть в «діапазон придатності» конструктів випробовуваного.