Наличие заглавных букв в слове, заданном в запросе, конкретизирует поиск. В результате поиска будет найдено точно такое слово с учётом регистра. Например, на запрос интерНЕТ будет найдено только слово интерНЕТ, если оно, конечно, имеется в базе данных. Слова же интернет, Интернет и ИНТЕРНЕТ по такому запросу найдены не будут. Давайте проверим эти правила на примерах.
- Введите в поле ввода запроса слово интернет.
- Нажмите кнопку Find (Поиск), расположенную правее поля ввода. В нашем случае было найдено 1763 вхождений.
- Введите в поле ввода запроса слово ИНТЕРНЕТ.
- Нажмите кнопку Find (Поиск), расположенную правее поля ввода. В нашем случае было найдено 222 вхождений, то есть значительно меньше, чем в первом случае.
В системе Alta Vista можно задавать только часть слова, используя для этого знак *. Использование этого знака похоже на его использование в шаблонах файлов. Вместо переменной части слова ставится данный знак, например, на запрос интернет* будет найдены слова интернет, Интернета, ИНТЕРНЕТОМ, и тому подобные. Данную возможность удобно использовать для поиска однокоренных слов. Попробуем выполнить поиск в системе.
- Введите в поле ввода запроса слово интернет*.
- Нажмите кнопку Find (Поиск), расположенную правее поля ввода. В нашем случае было найдено 2984 вхождений. Это примерно на полторы тысячи больше, чем было найдено для слова интернет без использования звёздочки.
Другой удобной возможностью является использование в запросах знаков + и -. Добавив такой знак перед словом или фразой, вы требуете обязательное их присутствие или отсутствие в документе. Если вы ставите знак + перед словом, то этим вы указываете, что данное слово обязательно должно присутствовать в найденном документе. Символ – указывает на то, что следующее за ним слово не должно присутствовать. Например, запрос +интернет* -интернет выдаст вам только склонения слова Интернет, но не само слово. Мы указали с помощью +интернет*, что в искомом документе должны быть все слова, начинающиеся с «интернет». С помощью же -интернет мы задаём, что само слово «интернет» не должно присутствовать. Проверим это на практике.
- Введите в поле ввода запрос на поиск: +интернет* -интернет.
- Нажмите кнопку Find (Поиск), расположенную правее поля ввода. В нашем случае было найдено 2984 вхождений, так же как и для запроса интернет*, но итоговых документов, в которых нет слова интернет, предложено всего около трёхсот
Если при использовании звёздочки в запросе будет найдено слишком много соответствий, то система проигнорирует данное слово. Точно так же будет проигнорировано слово, которое слишком часто повторяется.
- Введите в поле ввода запрос на поиск: Русский internet.
- Нажмите кнопку Find (Поиск). Так как найдено около одиннадцати миллионов вхождений слова internet, то запрос игнорируется и вам предлагается уточнить его. Об этом сказано внизу страницы в строке Ignored: internet: 11544076 (Проигнорировано: internet: 11544076). Предложенные страницы содержат только слово «Русский».
Ещё одним удобным способом уточнения поиска является использование специальных ключевых слов. Существуют различные ключевые слова, мы рассмотрим только два наиболее полезных слова. Ключевое слово link: позволяет ограничить поиск среди страниц, на которых расположены ссылки на заданную страницу. Например, для поиска страниц со ссылками на узел Microsoft, необходимо в качестве запроса ввести link:www.microsoft.com. Ключевое слово url: позволяет искать среди страниц, в адресе которых существует заданная в качестве аргумента часть. Если вы хотите найти все страницы, в адресе которых есть название фирмы Intel, то следует ввести запрос url:intel. Эти ключевые слова можно использовать вместе. Например, если мы хотим найти все страницы Российской части Интернета, на которых имеются ссылки на систему Alta Vista, следует в качестве запроса указать link:altavista.digital.com url:ru.
- Введите в поле ввода запрос на поиск: link:altavista.digital.com url:ru.
- Нажмите кнопку Find (Поиск). Найдено менее десяти ссылок, хотя путешествуя по Российской части Интернета, мы видим очень много ссылок на систему Alta Vista.
Этот пример показывает, что многие авторы Web-страниц помещают ссылки на систему Alta Vista, но не размещают информацию о своей странице в этой системе. Поэтому при путешествии по Всемирной паутине можно найти больше ссылок, чем найдено при поиске.
В подавляющем большинстве случаев вы сможете найти необходимую информацию с помощью простых запросов, но иногда могут потребоваться и более сложные. Система Alta Vista позволяет формировать запросы с использованием логических операций. Они называются сложными, или расширенными.
- Щёлкните мышью на ссылки Advanced Search Settings (Установка расширенных запросов), которая располагается справа от кнопки Find. Вместо поля для ввода простых запросов появится поля для ввода сложных запросов (Рис. 1.2.).
Рис. 1.2. Ввод сложного запроса в Alta Vista
Для построения сложного запроса используются логические операторы и синтаксические выражения. Попытаемся пояснить, что это такое. Синтаксические выражения – это любые слова и словосочетания, аналогичные рассмотренные в простых запросах. Логические операторы служат для выполнения операций «И», «ИЛИ», «НЕТ» и «ОКОЛО» над синтаксическими выражениями. Часто синтаксические выражения над, которыми производятся логические операции, называются аргументами. В синтаксических выражениях вы также можете использовать отдельные слова или фразы, заключая несколько слов в двойные кавычки. Правила использования заглавных и прописных букв в сложных запросах так же не отличаются от данных правил в простых запросах. Главное, что отличает сложный запрос – это использование логических операторов и круглых скобок. С помощью операторов и скобок вы создаёте из отдельных синтаксических выражений необходимый запрос. Если вы ещё не совсем разобрались с тем, как строятся расширенные запросы, то рассмотрите несколько примеров. Перед примерами перечислим допустимые в расширенных запросах логические операторы:
- Оператор AND для логической операции «И». Оператор гарантирует, что в документе присутствуют оба документа.
- Оператор OR для логической операции «ИЛИ». Оператор гарантирует, что в документе присутствует хотя бы один из аргументов.
- Оператор NEAR для операции «ОКОЛО». Данный оператор гарантирует, что аргументы стоят друг от друга в тексте не дальше, чем на десять символов.
- Оператор NOT для логической операции отрицания, то есть для операции «НЕТ». Этот оператор гарантирует, что аргумент не присутствует в документе.
Что бы в найденном документе отсутствовало какое либо слово, надо перед ним в запросе поставить оператор отрицания. Полезно для удобства чтения запроса выделить слово с отрицанием круглыми скобками: (NOT описание).
Для задания одновременного присутствия в искомом документе сразу нескольких слов или словосочетаний используется логический оператор «и». Например, если вы хотите, что бы в документе было слово «провайдер» и словосочетание «очень дёшево», то следует в запросе указать провайдер AND «очень дёшево». В качестве аргумента можно использовать не только слова и словосочетания, но и логические выражения, например по запросу интернет AND (NOT описание) будут найдены документы, в которых имеется слово «интернет» и нет слова «описание». В простом запросе для этого мы использовали бы +интернет-описание.
Если вы хотите, что бы в искомом документе находилось хотя бы одно из нужных слов, то следует воспользоваться логической операцией «ИЛИ». Например, запрос телевизор OR радио OR видео найдёт документы, в которых есть хотя бы одно из перечисленных слов. Более сложный запрос «дешевый доступ в Интернет» OR (провайдер END «очень дёшево») задаст поиск документов, в которых есть словосочетание «дешевый доступ в Интернет» или встречаются одновременно слова «провайдер» и «очень дёшево».
Операция «ОКОЛО» не является классической логической операцией. С её помощью можно задать, то, чтобы слова находились рядом друг с другом. Например, провайдер AND «очень дёшево» указывает, что данные слова просто присутствуют, однако они могут располагаться в разных концах документа. Запрос же провайдер NEAR «очень дёшево» описывает, что слово «провайдер» и словосочетание «очень дёшево» должны находится друг от друга недалеко, то есть между ними не должно находиться более десяти слов.
С помощью логических операций можно создавать достаточно сложные запросы, например ((провайдер* NEAR московск*) OR ((NOT описание) AND интернет*)) AND «очень дёшево». Разберём этот запрос по частям. Выражение (провайдер* NEAR московск*) описывает, что в искомом документе должно быть слово , начинающееся с «провайдер», то есть «провайдер», «провайдера», «провайдеру» и тому подобное, причём это слово должно находиться рядом со словом, которое начинается с «московск». Этим мы ограничиваем поиск московскими провайдерами. В следующих скобках выражении ((NOT описание) AND интернет*) описывает, что в документе должно быть слово, начинающееся с «интернет», и недолжно присутствовать слово «описание». Рассмотренные два выражения соединяются логическим оператором OR, то есть мы ищем документ в котором или описываются московские провайдеры, или имеется информация об Интернете, которая не является описанием. Такой поиск осуществляется по запросу ((провайдер* NEAR московск*) OR ((NOT описание) AND интернет*)). В нашем же запросе ещё присутствует последняя часть AND «очень дёшево». С её помощью мы задаём, что в дополнение к предыдущим условиям, необходимо, что бы в найденном документе присутствовало словосочетание «очень дёшево». Таким образом мы сформировали достаточно сложный запрос, хотя, скорее всего, по нему вы не найдёте не одного документа.