Смекни!
smekni.com

Проблеми штучного інтелекту (стр. 7 из 10)

Градієнти текстури

Під текстурою у повсякденному житті розуміється властивості об’єктів, пов’язані з тактильними відчуттями, що вони викликають. А у проблемі зорового сприйняття простору – наявність малюнку, що повторюється на поверхні і який може бути віднайдений візуально. Також до текстури відноситься і поняття густоти – частоти розташування елементів малюнку текстури, текстелів. Існує дві причини, через які однаковість малюнку може викривлюватись: різні відстані між камерою і текстелами; різні ракурси на тек стели. За допомогою математичного аналізу можна створити градієнти текстури, тобто показники швидкості зміни різних характеристик текстелів. Для відтворення даних про форму машини виконують двофазне завдання

1) вимір градієнтів текстур

2) оцінка значень можливих змін форми і положення, що могли б призвести до такої зміни текстури

Затінення

Затінення – зміна інтенсивності світла, визначається геометричною

будовою сцени і характеристиками поверхонь. Задачу по відтворенню характеристик сцени за яскравістю пік селів майже неможливо розв’язати і такий спосіб обрахунку третього виміру застосовний тільки в найпростіших випадках. До складнощів призводить велика кількість взаємо відбивань променів при наявності великої кількості предметів з різними, невідомими коефіцієнтами заломлення. Безсумнівно, люди здатні до такого типу аналізу навколишнього світу, тому вказана проблема є одним з напрямків для подальшого вивчення.

Контури


Контурний малюнок може дати нам велику кількість інформації про взаємо розташування предметів на ньому, нахилі і попороті поверхонь. Таке відчуття може досягатися завдяки поєднанню знань вищого рівня (досвіду) зі знаннями нижчого (ситуативними). Всі лінії на малюнку можуть приймати багато значень, і важливою задачею постає розмітка їх, тобто оцінка значення кожної з них. Саме ця задача була однією з найперших, що вивчалася у розділі машинного зору. Кожну лінію можна віднести до проекції лімба (сукупність точок, що ми бачимо там, де лінія зору походить по дотичній до поверхні) чи краю (звичайна лінія). При цьому краї діляться на вгнуті, опуклі чи закриваючі (ті, що закривають те, що знаходиться за ними). Кожній лінії можна присвоїти символ, що буде позначати її вид, такий символ називають міткою. На прикладі тригранних об’єктів Хаффмен і Клоувс незалежно один від одного створили повний перелік всіх можливих групувань цих видів контурів. При використанні цього словника об’єднань при аналізі контурного малюнка необхідно вирішувати задачу визначення того, які поєднання є співставні. Для цього існує правило, за яким кожній лінії можна присвоїти тільки одну мітку.

Розпізнавання об’єктів.

У людській свідомості усі об’єкти класифіковані. Ця класифікація випрацьовується протягом усього життя і відрізняється високим ступенем узагальненості. В області штучного інтелекту здатність розпізнавати предмети прийнято називати розпізнаванням об’єктів. До цього відноситься як розпізнавання класів об’єктів (собака) так і одиничних об’єктів (мій собака Рекс). Люди можуть розпізнавати не тільки об’єкти, але і види діяльності, наприклад посмішку, біг, писання, тощо, але для машин розпізнавання такого високого рівня знаходиться ще у стадії розробки. Складності викликає навіть елементарне розпізнавання об’єктів, адже машина має робити це незалежно від освітлення, оточення, положення, умов бачення.

Насамперед постає проблема сегментації об’єктів. Існує два способу детектування об’єкту. «знизу-вверх» і «зверху-вниз». Перший з них може призводити до багатьох помилок, але є на багато простішим для обрахунку. Віг полягає у розбитті об’єктів на сегменти і аналіз сегментів. Другий спосіб, що зазвичай використовується у всіх системах, вимагає складних обрахунків, адже полягає у пошуку необхідного об’єкта на площині всього зображення. На даний момент перспектива вбачається у розвитку і покращенні першого методу.

Іншою задачею є розпізнавання об’єкту незалежно від модифікацій його форми чи положення. Слід зазначити, що зміни між об’єктами всередині класу і через модифікації станів носять різний характер. Одним з варіантів розв’язання цієї проблеми є зведення об’єктів до початково заданого стану, але для цього необхідно задати всі об’єкти.

Існує два підходи до розпізнавання об’єктів: розпізнавання з врахуванням яскравості і розпізнавання з врахуванням характеристик. При обранні першого методу за основу береться пошук області пікселів, що відповідає шуканому об’єкту і обробка цієї області. Цей спосіб ґрунтується на аналізі необроблених зображень. Другий метод навпаки, використовує вже сегментовані зображення. Це допомагає досягнути скорочення часу детектування образу і досягнення інваріантності освітлення.

Цікавою задачею також постає оцінка пози, тобто позиції і орієнтації, об’єкту. Це відіграє велику роль при необхідності маніпулювання предметами. Задача вирішується досить просто і визначено, для цього використовується метод вирівнювання. В його основу покладено порівняння контурів проекції тривимірної моделі при її трансформації і двовимірного зображення.

Комп’ютерна мова

Одна із важливих задач, що стоїть перед сучасними комп”ютерами – розпізнавання і генерація поми. Мова – домінуюча форма спілкування у людей. Розпізнавання мови можна інтерпретувати як власне розпізнавання порядку слів, що було сказано або ж як ідентифікацію смислу фрагментів мовлення. Мова – доже складна система, для комп’ютерів особливо складним виявляється велика її зашумленість під зашумленістю мови можна розуміти як звичайні фізичні шуми, так і нескінченну кількість варіантів вимови. Саме це підштовхнуло вчених до думки, що розпізнання мови має будуватися на імовірнісній основі. Основні моделі, що використовуються у розпізнавачах мови зазвичай дуже прості. Наприклад модель двослівних поєднань вираховує вірогідність використання одного слова, в залежності від іншого. Таке обрахування необхідне при появі у словосполученні омофонів. В основі розпізнавання мови лежить те, що у всіх мовах використовується в основному досить обмежений і однаковий набір фонем (40-50). Але є і такі, що використовуються тільки в окремих мовах.

Звуки мови

Сприйняття звуків для машини проходить з допомогою мікрофону і аналогово-цифрового перетворювача, що виміряє величину струму, у який мікрофон перетворив коливання мембрани. Для обробки мови зазвичай використовуються частоти від 8 до 16 кГц. Хоча звукові частоти мови і досягають таких високих значень, але зміна змісту сигналу проходить набагато рідше, приблизно 100 Гц. Через це, для зменшення об’єму опрацювання інформації, при аналізі використовують більші проміжки часу, фрейми (~ 10 мс). У межах кожного фрейму його характеристики задаються векторами.


1) частотний ряд деякого звуку.

2) Оброблений сигнал

3) Фрейми з виділеними характеристиками (3)

У реальних системах використовуються сотні таких характеристик фреймів, але все ж. очевидно, що при такій обробці деяка частина інформації втрачається. Задача обробки звукової інформації полягає у тому, щоб, знищивши усі шуми на кшталт гучності, швидкості промови, тощо, вичленувати центральні характеристики, що є основними для даного звуку. Допомагає у цьому також класифікація фонем за їх складом. Наприклад якщо подібним образом описувати букву «т», то можна сказати, що вона складається з трьох станів: тихий початок, невеликий вибух (звільнення повітря) в середині і, як правило, шипіння у кінці.

Логічні системи в мові

Для того, щоб підтримувати розмови з людьми необхідно вміти розпізнавати зли тну мову, а не тільки окремі її елементи.. але насправді, зв’язна мова це не просто послідовність її елементів. І послідовність найбільш імовірних слів не є найбільш імовірною послідовністю слів. Отже, вирахувавши найбільш імовірні слова за використанням фонем, машина не може точно визначити речення в цілому, адже використання слів значно змінюється в залежності від того, в оточенні яких слів воно знаходиться і на якій позиції. Інша проблема – проблема сегментації, тобто розрізнення кінця одного слова і початку іншого, адже зазвичай у повсякденному мовленні у реченні між словами немає пауз. Як і більшість проблем у розпізнанні мови, ця задача вирішується на базі імовірнісних обрахунків.

Розуміння мови

Розробка способів розуміння природного мовлення є одним з найперспективніших і найнеобхідніших напрямків розвитку галузі штучного інтелекту. Цей напрям базується на методах логічного та імовірнісного пред’явлення знань і формуванні роздумів. На відміну від інших областей штучного інтелекту, саме ця потребує детального дослідження поведінки людей, адже мова – засіб комунікації, притаманний тільки їм і у великій мірі відображає людську психологію. Люди посилаюсь інформацію, закодовану у мові, з метою досягнення деяких цілей, мовленнєві акти є нічим іншим, як спробою примусити інших суб’єктів зреагувати певним чином. Мова – єдина в своєму роді знакова система, що використовує граматику для генерації структурованих повідомлень, що характеризуються необмеженою різновидністю. Усі варіанти використання мови є ситуативними, тобто смисл фрагменту мовлення залежить від ситуації, в якій був створений.

Для покращення розуміння граматичних схем, машини можуть використовувати розширення граматики, тобто граматику визначених висловлювань (Definite Clause Grammar— DCG). Важливою проблемою при розумінні природної мови є її неоднозначність. Більшість висловлювань може приймати декілька значень, вірне з яких, на даний момент, лише одне. Відкинення неоднозначності виконується на основі знань про світ і сучасну ситуацію у ньому.