Смекни!
smekni.com

Интернет - глобальная компьютерная сеть (стр. 4 из 7)

Объем информации, содержащейся в Интернете, и в частности, в его олицетворении — системе WWW, не поддается измерению. Можно лишь оценить его порядок.

В начале 90-х гг. ХХ в., когда серверы WWW еще можно было сосчитать, существовали так называемые отправные точки. Это были страницы, на которых перечислялись ссылки на все WWW-серверы, сгруппированные по тематическому либо географическому признаку. Например, «Все WWW-серверы по биохимии» или «Все WWW – серверы Финляндии» (вместо термина «WWW - сервер» чаще произносят «сайт»).

Таким образом, открыв нужную отправную точку, можно было последовательно обойти все ссылки. Отправные точки стали прообразом современных каталогов ресурсов Интернета. Каталоги ресурсов подобны справочникам, содержащим систематизированные ссылки на сайт. Ссылки объединяются в группы по определенным признакам, как правило, по тематике. Каждая группа может иметь несколько уровней, т.е. каталоги имеют древовидную структуру. Кроме того, каталоги обеспечивают разнообразный дополнительный сервис: поиск по ключевым словам, списки последних поступлений, списки наиболее интересных из них. Ссылки в каталоги вносят администраторы, которые стараются сделать свои коллекции наиболее полными, включающими все доступные ресурсы на каждую тему. Также ссылки на свои ресурсы предлагают и владельцы. Администраторы каталога проверяют ссылку и вносят ее в соответствующий раздел.

Старейший каталог ресурсов (Yahoo! www.yahoo.com.) состоит из 14 разделов:

• Искусство и гуманитарные науки;

• Бизнес и экономика;

• Компьютеры и Интернет;

• Образование;

• Развлечение;

• Ресурсы правительства США;

• Здоровье;

• Новости и СМИ;

• Отдых и спорт;

• Справочная информация;

• Ресурсы по регионам;

• Естественные науки;

• Общественные науки;

• Общество и культура.

Поиск с помощью каталога ресурсов выглядит следующим образом: пользователь определяет, к какой из тем относится разыскиваемая информация; передвигаясь вглубь по дереву, находит в каталоге соответствующий раздел; обходит все страницы, перечисленные в разделе. Например, надо найти информацию о кошках породы Корниш Рекс. Тогда можно постепенно углубляясь, перейти в раздел Science > biology> zoology> Animals, Insects, аndPets> Mammals> Саts >Вrееds>СоrnishRex.

Если же надо найти кто продает котят этой породы, поможет раздел Businessand Есоnomy>ShoppingandServices>Animals>Саts>Breeders>CornishRex. К удобству применения каталогов ресурсов относится то, что, если пользователю известна тема искомого документа, он будет исследовать соответствующую ветвь, не отвлекаясь на посторонние, не относящиеся к делу документы.

Однако объем каталога ограничен возможностями его администраторов и их субъективностью в выборе материала. Кроме того, тематику искомого документа не всегда можно сформулировать в пределах классификации каталога. В этом случае приходят на помощь поисковые системы.

Поиск в Интернете.

Удобство Интернета в том, что в нем можно найти практически любую информацию, даже когда мы не знаем точно, где она находиться. Если адрес страницы с интересующим нас материалом неизвестен и страницы с подходящими ссылками тоже нет, приходиться разыскивать материалы по всему Интернету. Для этого применяют поисковые системы Интернета – специальные web-узлы, позволяющие найти нужный документ.

Типы поисковых систем.

Существует два основных метода поиска в Интернете. В первом случае вы ищите web-страницы, относящиеся к определенной теме. Поиск производится путем выбора тематической категории и постепенным ее сужением. Подобные поисковые системы называют поисковыми каталогами.Они удобны, когда вам нужно вые познакомиться с новой для себя темой или добраться до широко известных «классических» ресурсов по данной теме. Второй способ поиска используется, когда тема носит узкий, специфический характер или нужны редкие, малоизвестные ресурсы. В этом случае вы должны представлять себе, какие ключевые слова должны встретиться в документе по интересующей вас теме. Эти слова надо выбрать таким образом, чтобы они, скорее всего, имелись в нужных документах, не имеющих отношения к выбранной теме. Системы, позволяющие выполнять подобный поиск, называют поисковыми указателями. Поисковые каталоги отличаются от поисковых указателей не только методом поиска, но и способом формирования. Любая поисковая система Интернета состоит из двух частей. Специализированная web-страница, доступная всем желающим и позволяющая выполнять поиск, опирается на большую, постоянно пополняемую и обновляемую базу данных, которая содержит сведения о ресурсах Интернета.

Способ пополнения этой базы данных зависит от типа поисковой системы, поисковых каталогов самое главное — это точность отбора. Каждый найденный ресурс должен быть полезным. Тематика страницы определяется или проверяется вручную. Из-за этого объем поисковых каталогов относительно невелик. Когда объем приближается к миллиону страниц, объем ручного труда настолько велик, что дальнейший рост каталога останавливается.

Поисковые указатели, напротив, ориентированы на широту охвата. С определением слов, имеющихся на web-странице, вполне справляется автоматика, данных поискового указателя может охватывать многие миллионы web-страниц. При этом выполнять поиск в указателе труднее, чем в каталоге, потому что одни те же ключевые слова могут встречаться на web-страницах, посвященным разным темам.

Поисковые системы

Принципы поиска информации в Интернете.

Став полноправным пользователем Интернета, вы получаете доступ к огромному числу информационных ресурсов. Например, количество имеющихся в Сети НТМL-документов измеряется уже не десятками, а сотнями миллионов. А ведь в Интернете можно найти не только текст, но и программы, изображения, звуковые и видеофайлы и т. д. С одной стороны, в этом море информации наверняка найдется и та, которой вы интересуетесь, даже если сфера ваших интересов весьма специфична. С другой стороны, найти среди сотен миллионов web-страниц именно те, которые вам интересны, — задача не из легких. Облегчить пользователям Сети поиск необходимой информации призваны поисковые системы.

Информационно-поисковые системы размещаются в Интернете на общедоступных серверах. Основой поисковых систем являются так называемые поисковые машины, или автоматические индексы. Специальные программы-роботы (известные также как пауки) в автоматическом режиме периодически обследуют Интернет на основе определенных алгоритмов, проводя индексацию найденных документов. Созданные индексные базы данных используются поисковыми машинами для предоставления пользователю доступа к размещенной на узлах Сети информации. Пользователь в рамках соответствующего интерфейса формулирует запрос, который обрабатывается системой, после чего в окно браузера выдаются результаты обработки запроса. Механизмы обработки запросов постоянно совершенствуются, и современные поисковые системы не просто перебирают огромное число документов.- Поиск ведется на основе оригинальных и весьма сложных алгоритмов, а его результаты анализируются и сортируются таким образом, чтобы представленная пользователю информация в наибольшей степени соответствовала его ожиданиям.

В настоящее время в развитии поисковых систем наблюдается тенденция объединения автоматических индексных поисковых машин и составляемых вручную каталогов Интернет-ресурсов. Ресурсы этих систем удачно дополняют друг друга, в объединение их возможностей вполне логично.

Тем не менее исследования возможностей поисковых машин, даже самых мощных из них, таких как AltaVista или HotBot, показывают, что реальная полнота охвата ресурсов Всемирной паутины отдельной такой системой не превышает 30%. Поэтому не стоит ограничиваться использованием какой-либо одной из них. Если вам не удалось отыскать интересующую вас информацию с помощью одной системы, попробуйте воспользоваться другой.

Каждая поисковая Система имеет свои особенности и, и качество полученного результата зависит от предмета поиска и точности формулировки запроса. Поэтому, приступая к поиску информации, прежде всего, нужно четко представлять себе, что именно и где вы хотите найти. Например, зарубежные системы поражают числом проиндексированных документов. Для поиска в области профессиональных знаний, особенно информации на иностранном языке, такие системы, как AltaVista, HotBot или Northern, подходят наилучшим образом.

Однако для поиска информации на русском языке, особенно в российской части Интернета, лучше приспособлены русские поисковые машины. Во-первых, они специально ориентированные именно на русскоязычные ресурсы Сети и, как правило, отличаются большей полнотой охвата и глубиной исследования эти ресурсов. Во-вторых, российские системы работают с учетом морфологии русского языка, то есть в поиск включаются все формы искомых слов. Российские системы лучше учитывают и такую исторически сложившуюся особенность российских Интернет-ресурсов, как сосуществование нескольких кодировок кириллицы.

Интерфейс всех поисковых систем построен примерно одинаково. Пользователю предлагается ввести запрос о специальное поле, а затем инициировать поиск щелчком на кнопке. Система выполняет поиск и выдает результаты в окне браузера. Кроме того, многими поисковыми системами пользователю предоставляется возможность задать дополнительные критерии поиска. Например можно искать только в определенной тематической категории или только определенных серверах.(15, с.523-525)

Расширенный поиск.

Кроме обычного запроса на естественном языке пользователи большинства систем могут также воспользоваться режимом «расширенного поиска» (в зарубежных системах — AdvancedSearch), в котором с помощью специальных символов можно задать более точные критерии и область поиска. Русское название этого режима, родившееся, видимо, из не совсем точного перевода с английского, нельзя признать удачным, так как на самом деле расширенным является только набор критериев поиска, а ног область поиска в большинстве случаев существенно сужается.