Смекни!
smekni.com

Теория поиска информации

Министерство образования Республики Беларусь

Белорусский государственный университет информатики и радиоэлектроники

Факультет информационных технологий и управления

Кафедра информационных технологий автоматизированных систем

ОТЧЁТ

по лабораторной работе №1

“Технология поиска информации ”

Выполнил: Студент гр.920603 Моторный А.В.

Проверил:

Заяц

Минск 2011

1 Цель работы

Практическое освоение технологии эффективного поиска информации.

2 Краткая характеристика использованных операторов и конструкций языка запросов.

Поиск по индексу заключается в том, что пользователь формирует запрос и передает его поисковой машине. В случае, когда у пользователя имеется несколько ключевых слов, весьма полезно использование операторов и конструкций языка запросов:

· AND — все термины, соединенные AND, должны присутствовать в предлагаемом документе. Аналогичный результат будет получен при использовании символа “&” вместо AND;

· OR — как минимум одно из ключевых слов, соединенных OR, должно присутствовать в искомом документе;

· NOT — ключевое слово (слова), следующее за NOT, не должно появляться в искомом документе.;

· NEAR — одно из слов должно отстоять на определенное количество слов от другого;

· Кавычки — слова внутри кавычек являются фразой, которая должна быть найдена в пределах документа или файла.

· Скобки могут использоваться для построения вложенных запросов, изменения области действия операторов, а также для изменения принятых по умолчанию приоритетов логических операторов. При использовании скобок часть запроса, которая заключена в скобки, интерпретируется как запрос, так что на нее распространяются правила языка запросов.

Существует огромное количество поисковых систем. Наиболее популярные поисковые системы — Google (http://www.google.com/), Яндекс (http://www.yandex.ru/) и Рамблер (http://www.rambler.ru/), AltaVista (http://www.altavista.com/) и др.

3 Описание результатов поиска документов

Проводился поиск по теме «Синхронизирующие объекты ОС Windows». Использовались поисковые системы Google, Rambler ,Yahoo, Yandex.

Вначале был создан простой запрос «синхронизирующие объекты and windows». На рисунках 1,2,3,4 приведены результаты поиска в различных поисковых системах:

Рис. 1 Google

Получено результатов примерно 9 580

Рис. 2 Yandex

Получено результатов примерно 780 тыс.

Рис. 3 Rambler

По запросу найдено 9 тыс. сайтов, 49 тыс. Документов

Рис. 4 Yahoo

Получено результатов примерно 222

Рис. 5 Яндекс каталог

Найдено по сайтам — 12455

Затем был создан более сложный запрос «"синхронизирующие объекты" NEAR windows». Полученные результаты в тех же поисковых машинных представлены на рисунках 6-9:

Рис. 6 Google

Получено результатов: 6

Рис. 7 Yandex

Получено результатов: 6

Рис. 8 Yandex

Получено результатов: 3

Для поисковой машины Ramdler создаем специальный запрос: «(5,"синхронизирующие объекты" and windows)»

Рис. 9 Rambler

По запросу найдено 2 сайта, 36 документов

4 Анализ результатов

Наиболее эффективная поисковая система предоставлена Google, т.к. найденные страницы наиболее релевантные, т.е. они включают в себя те документы, которые содержат необходимую информацию. Также проводился поиск нужной информации в «Яндекс каталоге», где тоже были получены неплохие результаты. Использование операторов и конструкций языка запросов значительно улучшило качество полученных результатов. Количество найденных страниц существенно отличается в различных поисковых системах:

Количество найденных страниц

Тип поисковой системы

Google

Rambler

Yandex

Yahoo

Простой запрос

9580

49000

780000

222

Сложный запрос

6

36

6

3

По результатам поиска получено, что синхронизирующие объекты ядра Windows (семафоры, мыотексы, события) нужны для того, чтобы процессы ОС Windows могли записывать информацию в общую память.

5 Выводы

В данной работе была освоена технология эффективного поиска информации. Эта технология позволяет получить наиболее конкретные, релевантные результаты при осуществлении поиска информации, тем самым позволяет сэкономить время.