Смекни!
smekni.com

Поиск информации в www (стр. 6 из 8)

Одной из команд такого поиска является команда host:.Например, на поисковой системе Alta Vista команда host: microsoft.ru разыщет все Web-страницы, принадлежащие доменному имени mycrosoft.ru.

Эту команду обычно комбинируют с другими. Если, например, нас интересуют планеты солнечной системы, но мы уже сыты по горло трудами Национального управления по исследованию космического пространства

США (NASA), то сервер NASA можно исключить из поиска командой:

+solar + system -host: nasa .:

В команду можно включать не полное доменное имя сервера, а только его часть, например только имя домена. Так, если мы хотим обыскать только российские серверы, то можно использовать имя домена ru, например:

+cookies +host: ru

По этой команде мы узнаем, что пишут о маркерах cookies на российских Web-узлах.

Не все поисковые системы позволяют проводить поиск по Web-узлам, да

и команда поиска у них может быть различной. Вот список систем, кото­рые такой поиск выполняют:

Alta Vista host:

Hot Bot domain:

& f InfoSeek site:

MSN Search domain:

GoTo domain:

Snap domain:

Поисковая система Lycos выполняет поиск Web-узлов только в режиме расширенного поиска.

Поиск URL-адресов

Этот поиск очень похож на поиск Web-узлов. Суть и смысл его те же, только Команда другая — uri:. Эту команду поддерживают следующие поисковые службы:

AltaVista Infoseek

Northern Light

Поисковый каталог Yahoo! использует команду u:, а система Lycos реализует поиск URL-адресов с помощью команд расширенного режима. В России поисковая система Яndex использует команду #url=, после которой следует записать URL-адрес в кавычках. Поисковая система Апорт 2000 , обходится более простым синтаксисом, например url=www.intel.ru, а в поисковой системе Rambler команда должна начинаться с символа <$>, например так:

$uri: www.intel.ru

Поиск ссылок

Поиск ссылок бывает полезен владельцам Web-страниц и Web-мастерам. Он позволяет, к примеру, количественно оценить динамику популярности своей страницы регулярным контролем числа ссылок, которые к ней ведут. Типовая команда для такого поиска — link:.

Например, команда link: http://www.mywebsite.com/mypage/index.htm позволит выявить ссылки, которые ведут к титульной странице index, htm на Web-узле mypage, размещенном на Web-сервере www.mywebsite.com.

Команду link: поддерживают следующие поисковые службы:

AltaVista Infoseek Google

Некоторые поисковые службы поддерживают команду linkpage:

GoTo HotBot S MSN Search Snap

Как обычно, российские поисковые системы имеют свои особенности. Например. Апорт 2000 поддерживает четыре разных представления команды:

Link=

L=

Ссылка=

Сс=

Система Яndex поддерживает команду #link:, после которой адрес ссылки должен записываться в кавычках.

Средства расширенного поиска

Выше мы рассмотрели лишь десять методов формулирования задания на поиск, однако их достаточно для проведения 90% поисковых работ в 90% поисковых служб. Все рассмотренные выше методы являются методами простого поиска. Кроме средства простого поиска обычно поисковые службы предоставляют средства расширенного поиска. Эти средства позволяют более точно формулировать поисковое задание, но требуют определенного опыта и работают заметно медленнее. В большинстве поисковых систем команды расширенного поиска формируются с помощью логических команд и рассчитаны на профессионалов. Удобство использования логических команд в частности связано с тем, что команды простого поиска у многих поисковых систем реализованы по-разному. Каждая система стремится сделать средства простого поиска наиболее удобными, а средства расширенного поиска — наиболее стандартными.

Команда OR

Логическая команда OR (ИЛИ) служит для формирования поискового зада­ния, состоящего из нескольких ключевых слов, если надо, чтобы разыс­киваемый документ содержал любые из этих слов в любой комбинации. Например, по команде solutions OR hints будут разысканы Web-страницы, содержащие решения к компьютерным играм (solutions) или подсказки к ним (hints).

Команду OR поддерживают абсолютное большинство основных поисковых служб, за исключением следующих:

Google Infoseek LookSmart Yahoo!

Службы Infoseek, LookSmart и Yahoo! по умолчанию выполняют поиск по принципу ИЛИ, если через пробел задано несколько ключевых слов, и поэтому нс нуждаются в этой команде. Лишь поисковая система Google вообще не имеет таких средств.

«Апорт 2000» позволяет использовать как английское ключевое слово OR, так н русское ИЛИ. Можно также использовать знак « | ». Система Rambler использует или слово OR, или знак « | », а система Яndeх — только знак « | ».

Команда AND

Логическая команда AND (И) служит для формирования поискового зада­ния, когда надо, чтобы разыскиваемый документ содержал одновременно все слова, введенные пользователем. Это аналог команды «+» простого поиска. Например, по команде свет AND луч будут разысканы все Web-стра­ницы, содержащие оба эти слова.

Команду AND поддерживают абсолютное большинство основных поиско­вых служб, за исключением следующих, которые используют знак «+»:

Google Infoseek LookSmart Yahoo!

Апорт 2000 позволяет использовать как английское ключевое слово AND, так и русское И, а также знаки «&» и «+». Система Rambler использует ключевое слово AND или знак «&», а система Япс1ех — знак «&» или пробел, если требу­ется одновременное присутствие слов в одном предложении, или пару знаков «&&», если требуется одновременное присутствие слов во всем документе.

Команда NOT

Логической командой NOT (HE) устанавливают исключения из результатов поиска, то есть это аналог рассмотренной выше команды простого поиска <• - ». Эту команду поддерживает большинство служб, за исключением:

Google Infoseek LookSmart Yahoo!

Системы AltaVista, Excite, Snap требуют специальной формы записи этой команды: вместо NOT в них следует давать команду AND NOT.

Наряду с командой NOT в системе Апорт 2000 разрешается использовать команду «НЕ», а в системе Rambler — команду «!». Интересна особенность системы Яndех. Она реализует логическую команду И НЕ, которая записывается значком «~», если относится к одному предложению и парой значков «~~», если относится ко всему документу.

Команда NEAR

Это одна из самых удобных команд расширенного поиска. Она позволяет совместить достоинства поиска по ключевым словам и контекстного поиска при глубоком поиске самые лучшие результаты возвращаются с помощью этой команды. Пример: поисковая команда Quake NEAR hints позволит разыскать документы, в которых присутствуют слова Quake и hints одновременна причем находятся поблизости друг от друга.

К сожалению, редкие поисковые службы поддерживают поиск с помощью команды NEAR. При этом у разных служб разное представление о том, что значит «близкое» размещение слов друг к другу:

AltaVista (в пределах 10 слов, жестко); Lycos (в пределах 25 слов, гибко); WebCrawler (в пределах 2 слов, гибко);

И Lycos, и WebCrawler позволяют управлять размером интервала, в котором разыскиваются ключевые слова. Для этого команду NEAR задают(параметром /#. Например, команда ночь NEAR/10 река позволит разыскат произведения, в которых есть описание реки ночью, если слова ночь и река отстоят друг от друга не более, чем на десять слов.

В российской поисковой системе Rambler аналогичная команда начинается со знака «$» и заканчивается двоеточием ($NEAR:). В поисковой системе Апорт 2000 расстояние между словами задается командой СЛ# (..., ..., ...), где вместо знака « # » следует подставить цифру или число, обозначающее предельное расстояние, а вместо многоточий — список ключевых слов. В поис­ковой системе Яndех расстояние задается в круглых скобках после дробной черты. При этом указать расстояния можно как «вперед», так и «назад» :

средство поиск/ (-2 4)

Такая команда позволит разыскать на только средства расширенного поиска, но и поисковые средства.

Вложение команд

Вложение команд позволяет создавать весьма сложные запросы. Оно выпол­няется с помощью круглых скобок ( ). Команда, стоящая в скобках, выпол­няется в первую очередь. Рассмотрим пример поиска решений или подсказок к компьютерной игре Diablo:

diablo AND (solution OR hint)

В этом случае сначала будут отобраны документы, в которых приводятся подсказки или решения для компьютерных игр, а потом из них будут выбра­ны те, в которых упоминается игра Diablo.

Использование круглых скобок для управления порядком исполнения зада­ния на поиск разрешается большинством крупнейших поисковых систем, за редким исключением:

Google Infoseek LookSmart Yahoo!

Выбор поисковой службы

Выбор средства поиска зависит от задачи. Есть задачи, для которых подхо­дят крупнейшие поисковые системы, но есть задачи, для которых неболь­шой список на пару сотен ссылок будет гораздо полезнее. Правда, его тоже надо еще разыскать, но это уже проще, поскольку если он существует не один год, то наверное хорошо известен поисковым системам.

Как проверить незнакомую поисковую службу

Лет пять назад лучшей считалась та служба, которая владела наибольшим индексом. Пока Web-страниц было немного, в результатах поиска можно было ориентироваться относительно легко. Тогда проверить незнакомую службу было очень просто — надо было набрать достаточно распростра­ненное слово, например Pentium, и сравнить, сколько ссылок на него дают разные поисковые системы.

Сегодня величина индекса уже не имеет того значения, как его качество, хотя принцип проверки остается тем же самым. Введите простое и понятное слово и посмотрите, насколько найденные Web-страницы соответствуют вашим ожиданиям. Если, например, при поиске по слову Шахматы поис­ковая система в качестве первой (самой важной!) ссылки выдает Web-стра-ннцу, посвященную скульптуре, то этой системе нужно еще какое-то время на адаптацию, прежде чем ею можно будет пользоваться

Реферативный поиск

Предполагается, что вам задана тема, которую надо осветить, но по ней нет никакой информации. Так обычно бывает, когда надо написать реферат, подготовить выступление, статью, отчет, справку и т. п. Часто реферат делают не по заданию, а «для себя», в порядке подготовки к другой, более крупной работе, например к написанию диссертации или книги.