Смекни!
smekni.com

Что такое интернет? (стр. 2 из 4)

Система WAIS представляет собой огромную распределенную базу данных, т.е. отдельные части этой базы данных расположены на разных узлах сети по всему миру. Программа-клиент для работы с серверами WAIS не только умеет общаться с ними по специальному протоколу, но и хранит список всех баз данных WAIS с их адресами и названиями, а иногда и с краткими описаниями. Там можно найти архивы телеконференций, всевозможные каталоги, справочники, сборники научных статей и рефератов, индексы и словоуказатели и многое другое. Практически любая информация, для которой база данных является удобной формой представлениями которая достаточно интересна для широкой аудитории, может быть представлена в WAIS.

База данных WAIS настолько велика, что простое “листание” записей — крайне бесперспективный способ доступа к информации. Поэтому в WAIS применяется довольно сложный метод поиска по ключевым словам и фразам. Документы, полученные в результате поиска, сортируются WAIS-сервером по количеству вхождения в них ключевых слов и по тому, насколько полно в каждом из них представлен весь набор заказанных ключевых слов. Такая система способна давать хорошие результаты, особенно если разбить процесс поиска на несколько этапов.

Первым этапом поиска обычно является запрос специальной в базе данных под названием “directory-of-servers ”, которая содержит небольшие по объему описания (рефераты) всех остальных баз WAIS. При этом лучше указывать не те ключевые слова, которые вас в конечном счете интересуют, а те общие понятия, относящиеся к вашей области знаний.

Выбрав на первом этапе одну или несколько баз, можно приступить к поиску собственно документов — что также можно делать в несколько заходов, знакомясь после каждого поиска с результатами и изменяя список ключевых слов, пока не будет найден нужный документ. Кроме того WAIS обладает одним полезным свойством: если на очередном этапе поиска вы нашли документ, содержимое которого особенно близко к тому, что вы ищите, то его можно добавить к списку релевантных документов. В результате на следующем этапе WAIS найдет документы, не только содержащие набор ваших ключевых слов, но и похожие по своему словарному составу на те тексты, которые вы указали как наиболее подходящие.

Хотя Netscape способен работать с серверами WAIS, для этого он должен знать адрес особого прокси-сервера для протокола WAIS, которого вашего провайдера может не оказаться. Специальные WAIS-клиенты, работающие в том числе и под Windows, не только удобные для интерактивного поиска в базах данных, но и позволяет обходиться без услуг какого-либо сервера-посредника(Левин, 1996).

URL-адрес для WAIS выглядит как:

wais:// < адрес сервера>/<название базы>

Gopher

Каждый из рассмотренных до сих пор интернетовских протоколов вполне мог бы существовать сам по себе: telnet предоставляет доступ к программам, FTP — к файлам, WAIS — к базам данных. Все эти системы создавались и развивались почти независимо друг от друга и ставили перед собой конкретную цель — построить механизм доступа к одному определенному виду ресурсов.

Однако по мере того как Internet рос и усложнялся, он сам подталкивал людей к мысли, что информация по природе своей едина и что не слишком разумно делить ее на разные “виды ресурсов” с непохожими методами доступа. К концу 80-ых годов идея нового универсального средства работы с разнородной информацией носилась в воздухе.

Первой системой, призванной воплотить в жизнь эти мечты стал Gopher, появившийся на свет 1991 году в американском университете штата Меннесота. Фундаментальным понятием, заложенным в ее основание была структура вложенных друг в друга меню (Кирсанов,1996).

Связавшись Gopher- клиентом с одним из Gopher-серверов, вы в первую очередь попадаете в корневое, главное меню этого сервера. Сориентировавшись в его содержимом и переходя далее из одного подменю в другое, можно заняться собственно поиском информации. Информация в системе Gopher организована строго иерархически, “от общего к частному”. На каждом шаге сервер посылает вашему Gopher - клиенту не только содержимое очередного меню, но и служебную информацию о том, где находятся объекты, соответствующие пунктам этого меню. Клиент выводит на экран только само перечисление пунктов, но когда вы выберите один из них, он, сверившись с имеющейся у него информацией, либо пошлет на какой-то из Gopher - серверов запрос на выдачу следующего меню, либо попытается установить FTP- или telnet- соединение с некоторым узлом Internet.

Очевидно из всех информационных инструментов Internet Gopher больше всего похож на WWW — обе эти системы призваны служить оболочкой с разнородными ресурсами. Однако Gopher лишен тех богатых изобразительных средств, которые делают WWW не только информационным каталогом, но и новым средством массовой информации и даже новым жанром искусства. Можно сказать, что Gopher является “подмножеством” WWW — что очень упрощает интегрирование самого Gopher как одного из видов ресурсов в WWW. Практически все что сказано о работе с Gopher - клиентом справедливо и для путешествия по системе Gopher с помощью броузера WWW (Хоникарт, 1996).

URL одного из пунктов Gopher - меню состоит из адреса Gopher- сервера и перечисленных тех пунктов меню, которые приведут вас к исходному пункту:

gopher://< адрес сервера>/< пункт меню>

WWW

Несмотря на то, что в первые годы своего существования Gopher завоевал большую популярность, назревала нужда в какой-то более простой и в тоже время максимально универсальной системе, в которой связи между ресурсами были бы более свободными и ассоциативными. Такая система была разработана в 1993 году и названа World Wide Web (WWW). Система WWW строиться на понятии гипертекста, или, точнее гипермедиа. Гипертекст — это текст составные части которого связаны друг с другом и с другими текстами с помощью ссылок. Гипермедиа — это то что получится из гипертекста, если заменить в его определении слово “текст” на “любые виды информации”: графические изображения, видео, звук и т.д.

World Wide Web означает буквально “всемирная паутина”. Почему она так называется. Как ясно из названия, она глобальна. Вы не всегда знаете в какой части света находится компьютер, к которому вы подключаетесь. Вы можете начинать читать страницу Web в Далласе, затем перейти в Австралию, и все это по одному нажатию кнопки мыши. WWW похожа на паутину. Это сложная информационная сеть, соединенная гипермедиа связями. WWW позволяет не отказываться от информационных ресурсов уже накопленных в Internet, доступных с помощью других средств — FTP, telnet и Gopher. Больше того, работа с этими ресурсами через WWW настолько удобна, что, скажем, FTP-клиенты, бывшие когда-то отдельным классом программ, теперь используются лишь немногими.

И все-таки главное в World Wide Web — это не удобства доступа к FTP- архива и Gopher-меню. Большинство серверов системы WWW предлагают информацию, которая без WWW вряд ли вообще когда- либо попала бы в сеть. Быстрота создания и обновления, богатые изобразительные возможности в сочетании с легкостью доступа и огромной аудиторией сделали WWW новым средством массовой информации. Запуск WWW-серрверов и создание WWW-страниц уже превратилось из повальной моды в новый бизнес — со всем что свойственно современному бизнесу: платой за квадратные сантиметры рекламной площади.

С другой стороны, быстрому распространению системы, столь естественно объединяющей разнородные ресурсы, способствовало не в последнюю очередь ее зарождение не в недрах коммерческой фирмы, а в научном учреждении — Европейской лаборатории физики частиц, сотрудники которой не стали делать секретов из своей разработки и даже не попытались на ней разбогатеть.

К счастью, сама природа WWW как прежде всего средства поиска и организации информации позволяет надеяться, что это замечательное изобретение не превратиться в инструмент одной лишь коммерции и рекламы (Кирсанов, 1996).

Серверы и клиенты WWW связываются между собой по специальному протоколу HTTP (Hyper Transfer Protocol, протокол передачи гипертекста). URL для WWW выглядит как :

http://< адрес сервера>

Переходить от одной странице Web к другой — интересный способ исследования World Wide Web, однако вам рано или поздно понадобится найти что-то конкретное. Но таким образом это сделать не удастся. В Internet имеются специальные инструменты Web-поиска.

Инструменты поиска в WWW.

Инструментов поиска информации в Internet, построенных на разных принципах и преследующих разные цели, существует немало. Но все их объединяет то, что они располагаются на специально выделенных сетевых компьютерах с мощными каналами связи, обслуживают ежеминутно огромное количество посетителей и требуют от своих владельцев значительных затрат на поддержку и обновление. Тем не менее, почти все они отвечают на запросы пользователей совершенно бескорыстно, а платят за это удовольствие спонсоры и рекламодатели. По масштабам влияния на сетевое сообщество поисковые системы, без сомнения, являются одним из краеугольных камней Internet.

Классификацию поисковых систем удобнее всего строить на основании того, на сколько автоматизирован в них сбор и обработка информации, предоставляемой пользователям, — иначе говоря, кто набирает базу данных, в которой производится поиск: люди или сами компьютеры.

2. Инструменты поиска

Условно инструменты поиска подразделяются на поисковые средства справочного типа (directories) и поисковые системы в чистом виде (search engines).

2.1 Тематические каталоги

Поисковые инструменты первого типа чаще всего называют предметными, или тематическими каталогами. Компания, владеющая таким каталогом, непрерывно ведет огромную работу, исследуя, описывая, каталогизируя и раскладывая по полочкам содержимое WWW-серверов и других сетевых ресурсов, разбросанных по всему миру. Результатом ее титанических усилий является постоянно обновляющийся иерархический каталог, на верхнем уровне собраны самые общие категории, такие как “бизнес ”, ”наука”, ”искусство” и т.п., а элементы самого нижнего уровня представляют собой ссылки на отдельные WWW-страницы и сервера вместе с кратким описанием их содержимого.