Фрагменты гипертекста связаны между собой посредством гиперссылок. Пользователь, работая с клиентским программным обеспечением, может легко переходить от одного фрагмента к другому, перемещаясь по гиперссылкам и не заботясь о том, на каком из WWW-серверов находится требуемый фрагмент.
Совокупность фрагментов гипертекста, находящуюся на всех WWW-серверах сети Интернет называют гиперпространством.
Установка WWW-серверов учреждениями высшей школы и перевод перевод наработанных учебно-методических материалов в гипертекстовую форму приведут к возникновению в сети гиперпространства образовательных ресурсов( ГОР). Успешное развитие образовательных ресурсов в состоянии решить проблему эффективного переиспользования наработанных учебно-методических материалов по всем специальностям в масштабах высшей школы страны в целом, что должно резко повысить качество образовательного процесса во всех учреждениях высшей школы.
Для этого необходимо решить ряд организационных и технических задач. Рассмотрим одну из важнейших технических задач -- сокращение издержек в ГОР. Издержки определяются двумя взаимосвязанными величинами: затратами времени пользователя на получение информации и загрузкой сети при выполнении транзакций по поиску и доставке информации.
Следует отметить, что задача сокращения издержек на получение информации актуальна и для всего гиперпространства в целом, поэтому применительно к образовательным ресурсам предлагается решать ее с помощью апробированных методов, а именно за счет оптимизации структуры ГОР.
Такую оптимизацию целесообразно проводить на двух уровнях:
- всего ГОР в целом,
- отдельных WWW-серверов.
На уровне ГОР предлагается создать службу, позволяющую проводить распределенный поиск учебно-методических материалов на образовательных WWW-серверах по ряду критериев, например, по номеру специальности и названию дисциплины, для которых предназначен тот или иной учебно-методический материал. Это в свою очередь накладывает определенные требования на оформление WWW-серверов как образовательных ресурсов.
Поэтому на уровне WWW-серверов необходимо разработать рекомендации по их оформлению, которые бы гарантировали работоспособность глобальной поисковой службы и минимизировали издержки на получение информации в рамках одного фрагмента. Рекомендации должны быть обеспечены программными средствами, облегчающими создание WWW-серверов, а также средствами, позволяющими в автоматическом режиме проводить проверку WWW-серверов на соответствие данным рекомендациям.
Для сокращения издержек на получение информации на уровне WWW-серверов рекомендации должны учитывать следующие требования:
- конструкции языка HTML, используемые при создании гипертекста, должны обеспечивать получение информации для пользователей, применяющих разное клиентское программное обеспечение,
- предоставляемая информация не должна в общем случае зависеть от возможности получения иллюстраций, видео и аудио фрагментов;
- размер иллюстраций, видео и аудио фрагментов должен учитывать среднюю пропускную способность каналов передачи информации;
- WWW-сервер должен содержать оглавление разделов и список ключевых слов с указанием страниц, на которых эти слова встречаются;
- на WWW-сервере должна быть обеспечена возможность поиска информации по словам, задаваемым пользователем.
Несмотря на то, что в первые годы своего существования Gopher завоевал большую популярность, назревала нужда в какой – то более простой и в то же время максимально универсальной системе, в которой связи между ресурсами были бы более свободными и ассоциативными. Такая система была разработана в 1993 г. и названа WWW. Система WWW строится на понятии гипертекстом, или, точнее, гипермедиа. Гипертекст – это текст, составные части которого связаны друг с другом и с друг и с другими текстами с помощью ссылок. Гипермедиа – это то, что получится из гипертекста, если заменить в его определении слово «текст» на выражение «любые виды информации». WWW означает буквально «всемирная паутина». WWW позволяет не отказываться от информационных ресурсов уже накопленных в Internet, доступных с помощью других средств: FTP, Telnet и Gopher. Больше того, работа с этими ресурсами через WWW настолько удобна, что FTP клиенты, бывшие когда - то отдельным классом программ, теперь используются лишь немногим.
И все - таки главное в WWW – это не удобства доступа FTP архиву и Gopher меню. Большинство серверов системы предлагают информацию, которая без WWW вряд ли вообще когда – либо попала бы в сеть. Быстрота создания и обновления, богатые изобразительные возможности в сочетании с легкостью доступа и огромной аудиторией сделала WWW новым средством массовой информации. С другой стороны, быстрому распространению системы, столь естественно объединяющий разнородные ресурсы, способствовало не в последнюю очередь ее зарождение не в недрах коммерческой фирмы, а в научном учреждении – Европейской лаборатории физики частиц, сотрудники которой не стали делать секретов из своей разработки и даже не попытались на ней разбогатеть. К счастью, сама природа WWW как средства поиска и организации информации позволяет надеяться, что это изобретение не превратится в инструмент одной лишь коммерции и рекламы. Серверы и клиенты WWW связываются между собой по протоколу НТТР. URL для WWW выглядит так http://<адрес сервера>.
Поисковые инструменты первого типа чаще всего называются предметными, или тематическими каталогами. Компания, владеющая таким каталогом, непрерывно ведет огромную работу, исследуя, описывая, каталогизируя и раскладывая по полочкам содержимое WWW серверов и других сетевых ресурсов, разбросанных по всему миру. Результатом ее титанических усилий является постоянно обновляющийся иерархический каталог. На верхнем уровне каталога собраны самые общие категории, такие как «бизнес», «наука» и др. Элементы самого нижнего уровня представляют собой ссылки на отдельные WWW страницы вместе с кратким описанием их содержимого. Гарантий того, что такой каталог действительно охватывает все содержимое WWW, никто не даст, однако возможная неполнота и даже однобокость подбора материалов с лихвой искупается тем, что пока еще не под силу никакому компьютеру – осмысленность отбора.
Предметные каталоги представляют и возможность поиска по ключевым словам. Однако поиск этот происходит не в содержимом самих WWW серверов, а их кратких описаниях, хранящихся в каталоге. Предметные каталоги Internetа можно пересчитать буквально на пальцах, так как их создание и поддержка требуют огромных затрат. К наиболее известным относятся Yahoo, WWW Virtual Library, Galaxy и некоторые другие.
Одно из самых известных систем такого рода – каталог Magellan. Эта база данных содержит сведенья о 80 тыс. WWW страниц, что очень немного в сравнении с теми миллионами, которые существуют в сети. Однако если Yahoo в качестве описания ресурса использует одну – две строчки текста, то сотрудники системы Magellan на некоторые из страниц, заносимые в их базу данных, сами пишут небольшие рецензии, а также оценивают качество этих информационных ресурсов по пятибалльной шкале. Помимо базы рецензии, Magellan владеет также собственным автоматическим индексом, для поиска в котором нужно перебросить переключатель под полем ввода в положение entire database. Как правило, запрос представляет собой одно или несколько ключевых слов, разделенных пробелом.
Похожая по своим принципам служба фирмы Point вообще основной упор делает не на поиск, а на работу с тематическим каталогом. Служба Point известна в сети тем, что ее сотрудники постоянно заняты оцениванием сетевых ресурсов и ведут списки тех узлов, которые как они считают, принадлежат к «лучшим пяти процентам WWW».
Сама фирма Point ведет общедоступную базу данных всех «пятипроцентных» WWW страниц, где о каждом можно прочитать подробную лицензию. Самым старым предметным каталога WWW является каталог Virtual Library. Эта система достаточно полно охватывает научную прослойку WWW серверы университетов, лабораторий и учебных заведений.
Для пользователей в нашей стране определенный интерес может представлять тематический каталог Russia – on- line Subject Guide. Этот каталог содержит довольно пестрое собрание ссылок на зарубежные источники плюс тематический обзор российских и русскоязычных ресурсов WWW.
К проблеме поиска информации в Internet можно подойти и с другой стороны. Существуют программы, в которые загрузили несколько тысяч общеизвестных программ, в которые загрузили несколько тысяч общеизвестных URL адресов. Будучи запущена на компьютере с доступом к WWW, эта программа начинает автоматически скачивать из сети документы по этим URL, причем из каждого нового документа она извлекает все содержащиеся в нем ссылки и добавляет их в свою базу адресов. Поскольку все WWW документы связаны между собой, рано или поздно такая программа обойдет весь Internet. Разумеется, программа не может ни понять, ни как – либо классифицировать то, что она видит в сети. Программы такого типа называются роботами. Они ограничиваются сбором статической информации и построением слов – указателей (индексов) по текстам документов. Собираемая роботом база данных – индекс – хранит в себе сведения о том, в каких WWW документах содержатся те или иные слова. Именно такой автоматически собираемый индекс и лежит в основном поисковых систем второго типа, которые часто так и называют – Автоматические индексы. Автоматический индекс состоит из трех частей: программы – роботы, собираемой этим роботом базы данных и интерфейса для поиска в этой базе, с которым работает пользователь. Все эти компоненты вполне могут функционировать без вмешательства человека. Поскольку какая – либо классификация или оценивание материалов в системах такого рода отсутствует, к ним следует прибегать только тогда, когда вы точно знаете ключевые слова, относящиеся к тому, что вам нужно, например фамилию человека или несколько достаточно редких терминов из соответствующей области.