Смекни!
smekni.com

Организация хранения и поиска информации в сети Internet (стр. 3 из 4)

2. Обзор и характеристика поисковых систем сети Internet

2.1 Rambler

Для поиска русскоязычной информации в Интернете лучше использовать русские поисковые системы. В этом опыте и в следующих других мы будем искать информацию с помощью нескольких систем, предназначенных для поиска в русскоязычной части Интернета. Как вы увидите, принципиально они не отличаются от всемирных поисковых систем. Так как мы уже рассмотрели несколько систем, и вы знаете общие принципы поиска информации в Интернете, то в дальнейших опытах мы не будем подробно останавливаться на всех тонкостях. Так как эти системы общаются с вами на русском языке, то вы сможете самостоятельно изучить их, используя знания, полученные вами при выполнении предыдущих опытов.

Выполним поиск с помощью системы Рамблер. Как вы увидите, эта система обладает удобной системой поиска и выдачи найденной информации.

Вы можете выполнить поиск как во Всемирной паутине, так и в группах новостей, а также в каталоге этой системы и в товарах. Кроме простого запроса имеется возможность работы с детальными запросами. Но мы выполним простой запрос, как и для других русских поисковых машин.

- Введите в поле ввода запроса слова поиск Интернет. Мы хотим найти документы, одновременно содержащие слово «поиск» и слово «Интернет».

- Нажмите кнопку Найти!. Мы получили список найденных страниц.

Список найденных страниц удобно организован. Вначале расположены ссылки на страницы, наиболее соответствующие критериям поиска. Наиболее полно удовлетворяют запросу документы, в которых искомые слова часто повторяются и стоят недалеко друг от друга. Кроме того, в кратком фрагменте текста найденного документа выделены обнаруженные ключевые слова.

В системе Рамблер можно посмотреть слова, которые наиболее часто используются в запросах пользователей. Кроме того, Рамблер ведёт список наиболее популярных Российских узлов Интернета. Так как вся информация в системе представлена на русском языке мы надеемся, что вы сможете самостоятельно в дальнейшем познакомиться с возможностями данной поисковой машины.

2.2 Yandex

Поисковая система Яndех располагается по адресу www.уаndех.ru. Она была официально введена в эксплуатацию 23 сентября 1997 года.

Что же такое Яndех? Вот как отвечают на этот вопрос создатели системы. Яndех – это полнотекстовая информационно-поисковая система (ИПС), учитывающая морфологию русского и английского языков. Система Яndех предназначена для поиска информации в электронных текстах различной структуры и разных способов представления (форматов). Яndех (произносится «яндекс») расшифровывается как «языковый индекс» или, в английском написании, Yandex– YetAnotherINDEX. Также можно рассматривать Яndех как частичный перевод слова Index с английского на русский язык («I» означает «Я»).

В основе поисковой системы Yandex. Ru лежит системное ядро, общее для всех продуктов с префиксом Яndex (Яndex. Site, Яndex. Lib, Яndex. Dict, Яndex.СD). Первые продукты серии Яndex (Яndex. Site, Яndex. Dict) были представлены широкой публике 18 октября 1996 года на выставке Netcom’96. Поисковая машина для «русского Интернета». явилась естественным продолжением линии Яndex. Как уже говорилось, в хорошем вопросе содержится половина ответа. Искать и находить нужное в ворохе текстов в Интернете – умение не только поисковой системы, мо и пользователя, задающего запрос. Яndex не требует от пользователя знания специальных команд для поиска. достаточно набрать вопрос («где найти дешевые компьютеры» или «нужны телефоны Москвы и Московской области»), и вы получите результат – список страниц, где встречаются эти слова. Независимо от того, в какой форме вы употребили слово в запросе, поиск учитывает все его формы по правилам русского языка. Например, если задан запрос идти, то в результате поиска будут найдены ссылки на документы, содержащие слова «идти», «идет», «шел», «шла» и т.д.

Яndexработает не только с языковыми запросами, но и позволяет выполнять поиск только на определенных серверах ИЛИже исключить из поиска заведомо ненужные серверы. Появилась возможность поиска изображений по подписям к ним и по именам файлов. Также стали доступными для поиска такие объекты, как сценарии, апплеты и стили (поиск осуществляется по названию). Удобная работа с новыми возможностями предлагается на странице расширенного поиска, где сложный язык запросов сведен к заполнению полей в форме. Кроме стандартной сортировки результатов – по релевантности (то есть по степени соответствия запросу), можно отсортировать документы по дате обновления. Интересной особенностью системы является возможность поиска в Яндексе в любом месте Интернета. Для этого нужно загрузить с сайта http://bar.уаndех.ru программу пол названием Яндекс. Бар и установить ее. После этого в окне браузера появится новая панель. Она предназначена для ввода запроса на поиск (без необходимости открывать страницу Яндекса) и выполнения ряда других функций.

По внешнему виду Яндекс представляет собой типичный портал, на главной странице которого можно найти ссылки на материалы практически любой тематики. Но это не единственное его лицо, для «серьезных» пользователей, которые не хотят тратить время на загрузку ненужной в данный момент информации, существует другой Яндекс. Его страница впечатляет скромностью дизайна и скоростью загрузки. Адрес этой эссенции поисковой машины – www.ya.ru.

2.3 Yahoo

Базы данных: в ведении находится служба поиска Internet-ресурсов, новостей, карт, рекламных информаций, спортивная информация, бизнес, номера телефонов, персональные WWW-страницы, и email-адреса (отдельная база данных).

Содержание: Основная директория содержит: адреса (URLs) лля Internet-ресурсов и краткое описание для этих связей.

Поиск: Все Yahoo страницы предлагают не только простое поисковое окно, но и опции для этого поиска, а так же поиск Usenet или Email-адреса. Поиск может ограничиваться указанием определённого промежутка времени. Boolean операторы (и, или) и последовательный поиск также поддержаны. Отметим: если поиск в Yahoo! не привёл к положительному результату, то процесс поиска автоматически переходит на Alta Vista, которая продолжает поиск, и в случае положительных результатов автоматически возвращает найденную информацию в Yahoo!.

Если Yahoo! не может установить связь достаточно быстро с Alta Vista, то в этом случае Yahoo! будет обеспечивать страницу связи с набором инструментов поиска. После того как одна из этих связей выбирается, ключевые слова передаются к поисковой машине на ваше усмотрение.

Средством, облегчающим поиск, является наличие «tip search» (TS) – поиск с помощью «намека»: Yahoo! Является подчиненным справочником, что означает, что система не имеет так много страниц, как поисковые машины, однако задание наиболее общих ключевых слов позволит найти необходимую тему на странице высокого уровня (первая страница, которая возникает перед пользователем при посещении сайта) для организации или компании.

Результаты: Связи отображаются в соответствии с очерёдностью задаваемых слов последовательностью поиска наряду с их описательным текстом и подчиненной иерархией.

Адрес: http://www.yahoo.com/

2.4 Altavista

AltaVista (www. AltaVista.com) – одна из старейших поисковых систем в Интернете. Первый web-индекс был представлен компанией в 1995 году. Ядро поисковой системы обязано своим рождением странной особенности исследовательской лаборатории компании DigitalEquipmentCorp. Сотрудники этой лаборатории зачем-то хранили всю свою электронную переписку за последние 10 лет. Чтобы эта куча информации не просто занимала дисковое пространство, а приносила хоть какую-то пользу, была создана программа для индексирования документов и поиска нужных слов в ворохе пожелтевшей от времени электронной корреспонденции. Система получилась настолько удачной, что впоследствии с успехом перекочевала на просторы Всемирной паутины.

Индекс AltaVista содержит документы на более чем 25 языках. Локализованные версии сайта AltaVista располагаются в доменах 20 стран. В область поиска можно включить документы на всех поддерживаемых языках или только в документах на определенном языке, а на специальной странице можно узнать несколько языков для поиска на всех выбранных языках одновременно.


Выводы и предложения

настоящее время в сети Internet используются практически все известные линии связи от низкоскоростных телефонных линий до высокоскоростных цифровых спутниковых каналов. Операционные системы, используемые в сети Internet, также отличаются разнообразием. Большинство компьютеров сети Internet работают под ОС Unix или VMS. Широко представлены также специальные маршрутизаторы сети типа NetBlazer или Cisco, чья ОС напоминает ОС Unix.

Фактически Internet состоит из множества локальных и глобальных сетей, принадлежащих различным компаниям и предприятиям, связанных между собой различными линиями связи. Internet можно представить себе в виде мозаики сложенной из небольших сетей разной величины, которые активно взаимодействуют одна с другой, пересылая файлы, сообщения и т.п.

Примером топологии сети Internet может служить сеть Х-Атом, состоящая из нескольких подсетей, и в то же время являющаяся фрагментом всемирной сети Internet.

На сегодняшний день в мире существует более 130 миллионов компьютеров и более 80% из них объединены в различные информационно-вычислительные сети от малых локальных сетей в офисах до глобальных сетей типа Internet. Всемирная тенденция к объединению компьютеров в сети обусловлена рядом важных причин, таких как ускорение передачи информационных сообщений, возможность быстрого обмена информацией между пользователями, получение и передача сообщений (факсов, E – Mail писем и прочего) не отходя от рабочего места, возможность мгновенного получения любой информации из любой точки земного шара, а так же обмен информацией между компьютерами разных фирм производителей работающих под разным программным обеспечением.