Примечание. Формат mht кодируется в соответствии со стандартом MIME (RFC2046 и RFC2047) .
13. Предъявить работу преподавателю.
Лабораторная работа № 4
(Глобальные вербальные ИПС: сравнительный анализ)
1. Работа заключается в сравнительном изучении заданных глобальных ИПС сети Интернет вербального типа.
Примечание. Набор систем и их количество может меняться по усмотрению преподавателя.
2. Перейти на сайт соответствующей поисковой системы (здесь и далее — доменное имя системы: www.название_системы.com). Найти в каждой системе ссылки на ее описание в целом, на описание языка запросов, интерфейсов, режимов работы и других особенностей системы. Описание каждой ИПС кратко законспектировать в тетради.
3. Проанализировать и сравнить возможности систем в режиме расширенного поиска. Страницы интерфейса расширенного поиска сохранить в своей папке.
4. Результаты анализа в сжатом виде представить в форме сводной таблицы (с. 38) в файле отчета Report4 (ориентация таблицы — альбомная). Размеры таблицы можно увеличить. Если что-то не помещается в таблице, в ячейке делать сноску на текст под таблицей (таблица не столько форма представления результатов, сколько схема анализа).
5. Предъявить работу преподавателю.
Результаты сравнительного изучения глобальных вербальных ИПС
№ | Параметры | Wise-nut | Goo-gle | AlltheWeb | Teoma |
1 | Логические операторы (какие и как задаются) | ||||
2 | Синтагматические операторы (какие и как задаются) | ||||
3 | Поиск по полям (составить список полей, отмечать их наличие / отсутствие в конкретных системах) | ||||
поле 1 | |||||
поле 2 | |||||
……… | |||||
поле k | |||||
4 | Выбор поисковой базы данных (в каких ресурсах можно искать) | ||||
ресурс 1 | |||||
ресурс 2 | |||||
……… | |||||
ресурс k | |||||
5 | Формат выдачи содержит следующие элементы (под таблицей привести пример из каждой системы) | ||||
элемент 1 | |||||
элемент 2 | |||||
……… | |||||
элемент k | |||||
6 | Специальные возможности или характерные особенности (описать для каждой системы) |
Лабораторная работа № 5
(Глобальные вербальные ИПС: изучение и поиск)
1. Провести поиск по теме «Компьютерная лингвистика» в заданных глобальных ИПС (набор систем и их количество может меняться по усмотрению преподавателя). Поисковое предписание логически должно выглядеть следующим образом:
(computational V computing V computer) & linguistics.
Запрос задать по-английски дважды, как конъюнкцию и как устойчивое словосочетание (фраза), используя характерные для каждой системы способы выражения операторов (для незнакомых систем найти соответствующую справочную информацию). Первую веб-страницу с результатами каждого поиска сохранить в своей папке в виде «только html». Количественные результаты отразить в таблице:
№ | Название ИПС | Найдено документов/сайтов | Комментарий (если требуется) | |
Запрос как конъюнкция | Запрос как устойчивое словосочетание | |||
1 | AlltheWeb (Fast) | |||
2 | AltaVista | |||
3 | ||||
4 | MSN Search | |||
5 | Teoma | |||
6 | WiseNut | |||
7 | Yahoo |
2. Проанализировать и попытаться объяснить полученные объемы выдачи в каждой системе.
3. В трех системах (Яндекс, Рамблер, Google) провести поиск по теме «Компьютерная лингвистика». Поисковое предписание, соответствующее логической формуле «(компьютерная V вычислительная) & лингвистика» (дизъюнкция устойчивых словосочетаний «компьютерная лингвистика» и «вычислительная лингвистика»), задать по-русски, используя характерные для каждой системы способы выражения операторов. Обратить внимание на различия в морфологической нормализации в разных системах. Первую веб-страницу с результатами каждого поиска сохранить в своей папке в виде «только html». Количественные результаты отразить в файле отчета в виде таблицы.
4. Провести поиск по той же теме, сузив область поиска заданием дополнительных терминов, позволяющих отобрать документы, где наиболее вероятны определения данного термина (учебник, курс лекций, определение, называется и т.п.). Количество найденных документов указать в файле отчета. Туда же через буфер обмена скопировать поисковые предписания по каждой системе.
5. Просмотреть в каждой системе найденные документы, найти в них по одному определению термина «компьютерная лингвистика» и записать их в файл отчета с указанием адреса (URL) соответствующего документа.
6. Предъявить работу преподавателю.
Лабораторная работа № 6
(Глобальные вербальные ИПС: изучение и поиск)
1. С помощью систем Yahoo, AltaVista, Google найти материалы по психологическим (psychological) аспектам взаимодействия человека и компьютера (human computer interaction), опубликованные на английском языке в 1998 году. При составлении поискового предписания обязательно использовать аббревиатуру HCI (human computer interaction). По каждой системе первую веб-страницу с результатами поиска и один из документов сохранить в своей папке в формате «только html». Количество найденных документов и текст поискового предписания в каждой системе сохранить в таблице в файле Report6.doc в своей папке. Цель — правильное составление запроса и знакомство с системами. Текст поискового предписания записать также в рабочей тетради.
2. Найти в системе AltaVista фотографии с изображениями Ниагарского водопада (Niagara falls) (поиск в БД изображений — images). Одну из них сохранить как графический файл в своей папке на диске, а ее URL — в своей папке в Избранном.
3. Провести поиск на английском языке в системе Vivisimo по теме «Русская литература». Первую веб-страницу с результатами поиска скопировать в файл отчета.
4. С помощью системы AlltheWeb (Fast) выявить материалы на русском языке по автоматическому синтаксическому анализу. Цель — правильное составление поискового предписания. Наилучший вариант поискового предписания через буфер обмена скопировать в файл отчета. Первую веб-страницу с результатами поиска сохранить в своей папке в формате «только html».
5. Используя системы Teoma и WiseNut, найти веб-страницы на английском языке, посвященные изучению аномальных/ паранормальных явлений в России. Для перевода запроса на английский язык и подбора синонимов воспользоваться онлайновыми словарями (www.multitran.ru, Lingvo на сайте Яндекса и др.). Отметить особенности языка запросов в каждой системе. Веб-страницу с результатами поиска по каждой системе сохранить на диске в своей папке в формате «только html».
6. Предъявить работу преподавателю.
Лабораторная работа № 7
(ИПС AltaVista и Google)
1. Ознакомиться с системой AltaVista (Базы данных, Расширенный поиск, Уточнение формулы запроса (More Precision), Настройки, Семейный фильтр). Установить режимы: База данных: Web — Область поиска: Worldwide — Языки: Russian, English. Установить объем выдачи 30 документов. Провести поиск по запросу на русском языке «Карл Маркс. Манифест Коммунистической партии». Первую веб-страницу с результатами поиска сохранить в своей папке в формате «веб-архив, один файл».
2. Один из документов выдачи (текст манифеста) перевести на английский язык средствами самой системы. Текст перевода на английский язык сохранить.
3. Провести поиск на английском языке по тому же запросу в базе данных каталога (Directory) и со страницы с результатами поиска для первых трех документов скопировать в файл отчета раздел(ы) каталога системы AltaVista, к которым отнесены эти документы (например, Category: Work & Money/Business/Economics/Writers/Marx, Karl).
4. Ознакомиться с системой Google (Расширенный поиск, Настройки, Языковые инструменты). Установить язык интерфейса — английский (Настройки). Установить объем выдачи 20 документов. Ограничить множество выдаваемых документов немецким языком (Расширенный поиск). Провести поиск по запросу Leningrad. Cкопировать в файл отчета раздел(ы) каталога Google, к которым будут отнесены первые три документа. Сохранить в своей папке в формате «только html» первую веб-страницу с результатами поиска и один из документов выдачи на немецком языке.
5. Снова войти в Настройки. Установить язык поиска (язык выдаваемых документов) — любой. Объем выдачи 10 документов. Язык интерфейса — русский. Провести поиск в ИПС Google по базе данных Groups (Группы) в режиме «Расширенный групповой поиск». Найти все новостные научные группы сети Relcom (relcom.sci.*). Список найденных групп сохранить в файле отчета. В найденном списке выбрать группу relcom.sci.philosophy, просмотреть ее содержимое и описать в файле отчета, в каком виде выдается информация (с примерами, скопированными с экрана).