Мир Знаний

Европейский банк реконструкции и развития. Банки Украины (стр. 2 из 5)

2.3 Altavista

www.altavista.com

Одна из наиболее популярных поисковых систем Altavista Search появилась в декабре 1995 года. Первоначально она задумывалась как демонстрация мощи 64-разрядного сервера Alpha APX корпорации Digital Equipment, однако быстро приобрела самостоятельное значение как эффективное и мощное средство поиска.

На сегодняшний день в индексе Altavista зарегистрировано до 100 миллионов URL. Система поражает своим быстродействием - в сутки она обслуживает более 20 миллионов запросов, при этом она отвечает на запросы незамедлительно, без всякого "притормаживания".

Система обновления индекса - краулер - посещает WWW сервера во всем мире, не испытывая проблем с языковым многообразием, поскольку Altavista поддерживает поиск на 25 языках. Странички, обновляемые редко, посещаются краулером реже чем популярные и часто обновляющиеся страницы. К сожалению, автоматически из индекса никогда не удаляются "мертвые" ссылки, поэтому по некоторым запросам количество недействующих ссылок может быть довольно велико (до 12 %).

Дизайн у системы простой и удобный - в центре экрана находится окно с полем ввода запроса и кнопками "Search" и "Refine", немного ниже - ссылки на расширенный поиск, помощь, информацию о системе и страницу с настройками. Сервер не перегружен рекламой и графикой, поэтому все странички загружаются очень быстро. Даже начинающий пользователь мгновенно освоит технологию построения простого запроса к Altavist'e.

К сожалению, на этом список преимуществ системы Altavista для неискушенного пользователя заканчивается. На простой запрос она выдает огромное количество результатов, многие из которых совершенно не имеют отношения к интересующей пользователя теме, а составление сложных (расширенных) запросов требует освоения специального языка, что для многих пользователей неприемлемо.

Результаты поиска отсортированы с учетом частоты встречаемости ключевых слов в документе, учитывается также раздел, в котором встречается ключевое слово (заголовок, название страницы, и т. д.), однако не производится сортировка по тематике - Altavista попросту не поддерживает концепцию темы.

Несколько улучшает ситуацию с простым поиском имеющаяся в системе Altavista функция Refine (уточнить). На страничке с результатами поиска нужно нажать Refine, после чего появится список терминов, которые наиболее часто встречаются в одном контексте с ключевым словом. Возле каждого термина есть выпадающий список, в котором можно выбрать, относится ли это слово к теме поиска или нет.

Из всего вышесказанного следует, что Altavista не является оптимальным средством для простого поиска. Хотя результат будет достигнут, затраты времени на его получение довольно велики. Сильные стороны этой системы проявляются, когда пользователю необходимо осуществить сложный поиск с указанием многих критериев отбора или поиск редких терминов.

В этом случае Altavista предоставляет наиболее мощные и изощренные средства поиска среди всех рассматриваемых систем, среди которых такие уникальные средства как поиск документов на конкретном языке, поиск по названию страницы, поиск среди гиперссылок, поиск объектов Java/ActiveX, поиск в "якорях" и т.д.

Altavista обеспечивает набор более стандартных, но очень ценных критериев отбора, таких как логические операции над ключевыми словами, поиск с учетом вариантов написания слов, поиск целых фраз, поиск документов только на определенных серверах (или доменах), ограничения по дате создания документа, и т.д. Многие из этих возможностей доступны даже с основной страницы.

2.4 Google

www.google.ru


www.google.com


Google использует link populariry как наиболее весомый фактор в определении релевантности страницы. В результате большим и популярным сайтам проще попасть на высокие позиции в результатах поиска. Это также защищает Google от спама.

Google – одна из немногих поисковых систем, которая глубоко индексирует ваш сайт. (n.е. он старается "пройтись" по всем ссылкам вашего сайта).

Google полагает, что следующие факторы будут наиболее весомыми при ранжировании страниц:

Link popularity (индекс цитирования)

Keyword proximity and density (плотность и частота ключевых слов)

Keywords in the link text (ключевые слова в ссылках)

Emphasized text (выделенный текст)

При выдаче в списке результатов выдается: ссылка на страницу, описание, составленное из слов, которые окружают встретившийся поисковый запрос на странице. Поскольку описание страницы зависит от конкретного поискового запроса, то это немного можно использовать.

В настоящее время Google имеет самый большую базу проиндексированных URL - более 1 млрд. Поисковая система известна релевантностью и ее создатели даже ввели специальную кнопку "I'm Feeling Lucky"("Я чувствую себя удачливым"). Когда вы вводите запрос и нажимает эту кнопку, то вы сразу попадаете на наиболее адекватный вашему запросу сайт и вам уже не надо просматривать все результаты поиска.

Все страницы, которые были проиндексированы, сохраняются в кэше Google и вы можете просмотреть интересующую вас страницу, даже если сайт временно не работает. К тому же введенные вами слова запроса будут автоматически высвечены на странице.

Интерфейс Google русифицирован.

Порядок сайтов в поиске Google определят пользователи.

Google же с момента своего основания строил ранжирование на основе технологии PageRank. Метод такого ранжирования восходит к принятому в научной среде методу оценки значимости той или иной научной работы - индексу цитируемости, то есть количеству ссылок на статью в работах других ученых.

Метод полностью оправдал возложенные на него надежды, и Google, без преувеличения, стал самым популярным поисковиком в мире - Googl'y удавалось выдавать в первых строках списка результатов наиболее соответствующие запросу ресурсы.

Эксперты прежде всего подвергают сомнению чистоту результатов голосования в виду все возрастающей коммерциализации всех поисковиков, в том числе и Google. К тому же техническое осуществление онлайнового голосования неизбежно сопряжено с массой трудностей.

2.5 Yahoo

www.yahoo.com


Yahoo! Inc. – всемирная Интернет-коммуникационная, коммерческая и медиа-компания. Web-сайт Yahoo – превосходный информационный навигатор в виртуальном мире. Ежедневное число посещений основного сайта Интернет-компании превышает несколько миллионов.

Yahoo - чисто каталоговая, на Yahoo нет собственной поисковой машины. Зато список категорий на Yahoo является наиболее полным и простым - в отличие от других каталогов, на Yahoo всегда легко определить, в каком разделе находится нужная информация.

Заглавная страничка Yahoo грузится очень быстро - хотя на ней очень много ссылок, но все они текстовые. Центральная часть страницы, конечно, занята окном поиска и списком категорий. Ссылки вверху страницы (графические) обеспечивают доступ к такой информации, как "что нового", "что хорошего", "More Yahoos". В нижней части основной страницы Yahoo расположено большое количество ссылок на наиболее популярные разделы Yahoo.

При вводе ключевых слов с основной страницы Yahoo, запрос обрабатывается по методу "Intelligent default", то есть Yahoo ищет наиболее подходящие результаты в таких областях: в категориях Yahoo; в Web-сайтах, зарегистрированных на Yahoo; на Altavista (запрос передается при отсутствии результатов); в новостях.

Такой интеллектуальный поиск занимает довольно много времени. При задании критериев поиска для Yahoo нужно помнить, что Yahoo ищет эти слова только в названии и описании страницы, поскольку полнотекстового индекса на Yahoo нет.

На странице с результатами поиска выводятся сначала удовлетворяющие критерию поиска категории, а потом сайты. Возле каждой категории в скобках стоит число - это количество сайтов в данной категории. В случае если на Yahoo нет результатов, сразу выводятся результаты с Altavista. Вверху и внизу страницы выводится маленькая табличка, с помощью которой можно одним нажатием кнопки мыши произвести поиск в категориях Yahoo, на Altavista, в новостях и событиях. Количество результатов поиска на Yahoo, естественно, невелико, зато большинство из них являются релевантными.

Среди средств расширенного поиска - ограничение результатов по дате, поиск в Yahoo, Usenet и среди E-mail адресов, использование логических операций над терминами и поиск конкретной фразы. Также присутствует возможность искать слова с произвольными окончаниями, указывать слова, которые должны или НЕ должны присутствовать в документе, и т.д.

Чисто русские ресурсы в Yahoo не добавляются, потому что в Yahoo Inc. просто некому смотреть и оценивать их содержимое. Но те запросы, которые не дали результатов на Yahoo передаются на Altavista, а там есть хороший индекс русских ресурсов.

3. Способы сохранения найденной информации

3.1 Прямая печать.