HotBot
Одним из мощных поисковых средств в World Wide Webможно отнести HotBot, содержащий сведения о полных текстах 110 млн. страниц. Адрес: http:// www.hotbot.com. HotBot принадлежит к новейшим системам, поэтому его углубленный поиск дает поразительно широкие возможности для детализации запроса. Это достигается за счет использования многоступенчатого меню, предлагающего различные варианты составления поискового предписания. Можно осуществить поиск по наличию в документе одного или нескольких терминов, поиск по отдельной фазе, поиск конкретного лица или ссылки на определенный электронный адрес. Для большей детализации запроса возможно применение условий SHOULD (может содержать), MUST (должен обязательно содержать), MUST NOT (не должен содержать) по отношению к каким-либо понятиям. Кроме того, HotBot представляет возможностьограничить поиск по дате создания или последнего обновления документа, по георафическому положению сервера. Верхом сервисных возможностей является поиск документов, содержащих определенные типы файлов, например аудио или видио. Для этого надо лишь сделать отметку в специальном пункте меню запроса (Куприянова, 1998).
WebCrawler.
Это еще один инструмент поиска типа search-bot (поисковый робот). Адрес: http://www.webcrawler.com . Поиск здесь очень прост. Введите как можно больше ключевых слов в поле поиска, нажмите Search.
Lycos.
Это большая база данных индексирующая содержание всех найденных ею страниц Web. Адрес: http://www.lycos.com .
World Wide Web Worm.
Вы найдете этот инструмент поиска на http://www.cs.colorado.edu/home/mcbryan/wwww.html . Это еще один обширный указатель участков Web.
В каждом конкретном случае целесообразно использовать свой инструмент поиска. Вам придется пытаться проводить поиск при помощи одного инструмента и, если вы не получили результатов, переходить к другому. Но все же каким инструментом пользоваться? В первую очередь лучше воспользоваться тематическим каталогом типа Yahoo, размер у них сравнительно небольшой, зато велика скорость. Если найти необходимую информацию не удалось, это говорит о том, что вы интересуетесь слишком узкой темой, или же с вашей темой плохо соотносятся выбранные вами ключевые слова. Это не значит, что нужной информации в WWW нет — просто найти ее будет сложнее. Для ее поиска вам прийдется воспользоваться более примитивными, более автоматическими и потому более всеобъемлющими системами типа Alta Vista (Кент, 1996).
Поисковые системы глобального масштаба свое основное внимание концентрируют на англоязычных ресурсах Сети. Задачу поиска информации на серверах в пределах отдельных стран выполняют системы локального характера, специально адаптированные к особенностям конкретных языков. Существуют подобные поисковые средства и в России. Всех их объединяет возможность обработки материалов во всех кириллических кодировках*. Однако по мощности и уровню предлагаемого сервиса русскоязычные поисковые системы значительно отличаются друг от друга.
К лидирующей группе в настоящее время относятся системы Rambler, «Апорт» и «Яndex».
Среди фаворитов выделяется Rambler (http://www.rambler.ru), ставший первой профессиональной отечественной поисковой системой. Эта система обеспечивает полнотекстовый поиск на 3 млн. страниц, расположенных на более чем 15 тыс. Web-узлах Росси и стран ближнего зарубежья. Помимо Web-серверов, обследуется также недельный архив телеконференций иерархии relcom.
Rambler обладает близким к оптимальному выводом результатов поиска. Даже в нормальной форме ссылка на найденный объектвключает полную информацию. Система сконструирована таким образом, что один и тот же документ в различных кодировках показывается в различных кодировках показываются только один раз, а его конкретные адреса суммируются в списке, идущим за резюме.это сокращает время на аналмз полученных результатов из-за отсутствия дублирования одних и тех же документов.
Главный недостаток Rambler заключается в невозможности осуществлять поиск по целой фазе или хотя бы указывать в запросах предельное расстояние искомых терминов друг от друга. Случайное сочетание совершенно несвязанных слов приводит к выдаче ссылок на документы, совершенно не релевантны запросу.
Апорт
Поисковая система Апорт (http://www.апорт.ru) снабжена массой различных функций, относящих ее к числу самых удобных для пользователя.
Одно из главных достоинств Апорт состоит в широких возможностях составления запроса. Помимо традиционных операторов “и” и “или”, поиска по целой фазе, система способна вычленять сочетания терминов, расположенных в тексте рядом друг с другом. Апорт предлагает возможность автоматического перевода запроса с русского на английский язык и наоборот. И Rambler, и Апорт способны выделять один и тот же документ в различных кодировках и выдавать ссылку на него лишь раз, перечисляя конкретные адреса в списке URL. К сожалению, при этом вовремя не удаляются сведения об устаревших версиях одной и той же страницы, которые перечисляются как существующие, имея разницу лишь в дате обновления. Еще одним недостатком этой системы является не всегда корректная обработка названий страниц, из-за чего в результатах поиска часто указывается «документ без названия».
Яndex
Поисковая система Яndex (http://www.yandex.ru) , где помимо серверов доменов «ru» и «su» Яndex индексирует содержание зарубежных русскоязычных Web-узлов.
Главной отличительной чертой этой системы является глубокий морфологический анализ обрабатываемых терминов. Мощнейшая лингвистика позволяет учесть практически все возможные оттенки употребления ключевых слов и составить запрос максимально точно. Яndex обладает хорошим механизмом распознавания одного документа в нескольких кодировках или на зеркальных серверах.
Вслед за лидирующей российской тройкой идут еще несколько поисковых средств, среди которых “Русская машина поиска”(http://search.interrussia.com), «TELA-поиск» (http://tela.dux.ru/) и Russian Internet Search (http://www.search.ru). Пока все эти серверы не отличаются ни широтой поиска, ни комфортностью, и могут быть использованы лишь в качестве дополнения к ведущим поисковым средствам.
Поисковый сервис в русскоязычном блоке Internet, также как и во всем мире, развивается стремительно. Нет сомнения, что в ближайшем будущем показатели существующих систем повысятся, появятся новые поколения поисковых средств, предоставляющих пользователям еще большие возможности (Куприянова, 1998).
Список литературы
1. Дмитрий Кирсанов Понятный Internet / -М. Символ-Плюс, 1996
2. Джери Хоникарт Internet без проблем /- М. 1996
3. Питер Кент Internet / М. 1996
4. Джон Левин Секреты Internet / Киев 1996
5. В. Степанов С компьютером на ты / - М., 1998
6. Кирк Черил Internet. Книга ответов / М. 1998
7. Г. И. Куприянова Информационные ресурсы Internet / М., 1998