графику, видео и звук.
Гипертекст: информация в WWW представляется в виде документов, каждый из которых
может содержать как внутренние перекрестные ссылки, так и ссылки на другие
документы, хранящиеся на том же самом или на любом другом сервере.
Такие ссылки называют гиперссылками или гиперсвязями. На экране компьютера в
окне программы просмотра ссылки выглядят как выделенные каким-либо образом
(например, другим цветом и/или подчеркиванием) участки текста или графики.
Выбирая гиперссылки, пользователь программы просмотра может быстро перемещаться
от одной части документа к другой, или же от одного документа к другому. При
необходимости программа просмотра автоматически связывается с соответствующим
сервером в сети и запрашивает документ, на который сделана ссылка. Кстати, идея
гипертекстового представления информации должна уже быть хорошо знакома
пользователям различных версий системы Microsoft Windows, каковых среди
читателей этой книги, вероятно, большинство. Именно по этому принципу построена
в Windows система подсказок (Help), с той лишь разницей, что гипертекстовая
система подсказок Windows не является распределенной.
Итак, WWW-документ может содержать стилизованный и форматированный текст,
графику и гиперсвязи с различными ресурсами Internet. Чтобы реализовать все эти
возможности, был разработан специальный язык, названный HyperText Markup
Language (HTML), то есть, Язык Разметки Гипертекста. Документ, написанный на
HTML, представляет собой текстовый файл, содержащий собственно текст, несущий
информацию читателю, и флаги разметки. Последние представляют собой определенные
стандартом HTML последовательности символов, являющиеся инструкциями для
программы просмотра; согласно этим инструкциям программа располагает текст на
экране, включает в него рисунки, хранящиеся в отдельных графических файлах, и
формирует гиперсвязи с другими документами или ресурсами Internet. Таким
образом, файл на языке HTML приобретает облик WWW-документа только тогда, когда
он интерпретируется программой просмотра. О языке HTML мы подробно расскажем в
соответствующих разделах книги, поскольку без знания основ этого языка
невозможно создать свой собственный гипертекст для публикации в WWW.
2.3. Как в WWW задается местонахождение документа?
Виртуальный мир WWW населен миллионами документов, обитающих на сотнях тысяч
серверов. Задача WWWпутешественника - найти среди них тот, который содержит
необходимую информацию, и прочитать его при помощи программы просмотра, - а для
этого программа просмотра должна знать точное местонахождение данного документа.
Оно однозначно определяется адресом сервера, номером порта, именем директории и
именем файла с этим документом. Для успешной загрузки требуемого документа
сервера программе просмотра также нужно указать протокол, используемый этим
сервером. Это связано с тем, то кроме WWW-серверов, программы просмотра могут
обращаться к серверам пересылки файлов (так называемым FTPсерверам), серверам
телеконференций, серверам электронной почты и некоторым другим типам серверов.
Комбинация протокола, адреса сервера, номера порта, имени директории и имени
файла получила название Uniform Resource Locator, или сокращенно URL. Синтаксис
URL показан ниже:
протокол://адрес_сервера:номер_порта/имя_директории/имя_файла
Протокол, как уже было сказано выше, это совокупность правил, по которым
происходит взаимодействие клиент-сервер. Мы уже знаем, что “родной” протокол WWW
называется http. Кроме http, WWWклиенты могут общаться с серверами,
поддерживающими протоколы ftp, gopher и некоторыми другими, на которых я здесь
останавливаться не буду, а расскажу о них далее.
Название протокола отделяется от остальной части URL двоеточием. В названии
протокола прописные латинские буквы и соответствующие им строчные буквы
эквивалентны.
Начало адреса отмечается двумя косыми чертами // Он состоит из нескольких частей
- так называемых поддоменов. Поддомены, представляющие собой сочетания букв и
цифр, разделяются точками, причем, “уточнение координат адресата” от более
крупных к более мелким поддоменам происходит справа налево. Так же как и в
названии протокола, в адресе сервера прописные латинские буквы и соответствующие
им строчные буквы эквивалентны.
Номер порта выражается целым положительным числом и отделяется от адреса
двоеточием. Порт - это как бы “дверь”, через которую можно зайти в сервер.
Сервер может иметь несколько доступных портов; если номер порта WWW-сервера
равен 80, то в URL его можно не указывать.
Файлы с документами, публикуемыми в WWW, часто имеют суффиксы .html или .htm.
Эти суффиксы являются аббревиатурой от названия языка, на котором пишут
WWW-документы, HyperText Markup Language, о котором будет подробно рассказано
далее.
Если имя директории начинается с символа ~ (тильда), это означает, что это - так
называемая домашняя директория (home directory) пользователя данной компьютерной
системы. На компьютерах с многопользовательской операционной системой UNIX
каждому пользователю присваивается имя пользователя, под которым он
регистрируется в системе, и выделяется собственная “домашняя” директория,
предназначенная для хранения принадлежащих ему файлов. Имя домашней директории
совпадает с именем пользователя. Вместо абсолютного имени домашней директории с
указанием всех ее поддиректорий можно использовать имя пользователя, которому
предшествует символ ~ (тильда).
Обратите внимание на следующие особенности задания имен директорий и файлов в
URL:
Директория, указанная в URL, как правило, не совпадает с истинной директорией в
файловой системе на том сервере, где находится требуемый файл. Преобразование
директорий, заданных в URL, в истинные директории в файловой системе
осуществляется WWW-сервером согласно правилам, заданным при его установке и
настройке.
Если в URL указано только имя директории, а имя файла не задано, то сервер на
такой запрос вышлет файл с определенным именем, зависящим от настройки сервера.
Если же такого файла в заданной директории нет, то большинство серверов
автоматически вышлют вам список всех файлов в данной директории.
2.4. Программы просмотра
Мы уже знаем, что, программа, с которой непосредственно общается пользователь
при работе с ресурсами WWW, называется программой просмотра WWW-документов.
Напоминаем, что работа такой программы заключается в посылке запроса к заданному
серверу, интерпретации полученной информации и представления ее пользователю.
Кроме того, она выполняет ряд вспомогательных задач, например, поддерживает
список прочитанных документов, чтобы пользователь мог к ним вернуться в
дальнейшем.
В настоящее время получили распространение более десяти программ просмотра
WWW-документов. Из графических программ просмотра наибольшего внимания, на наш
взгляд, заслуживают NCSA Mosaic, Netscape Navigator и Microsoft Internet
Explorer.
Программа NCSA Mosaic была создана в Национальном Центре Суперкомпьютерных
Приложений Университета штата Иллинойс в Урбана-Шампэйн в начале 1993 года
группой программистов, возглавляемых студентом по имени Марк Андреессен. В то
время Mosaic являлась единственной программой просмотра, написанной на
профессиональном уровне, дружественной по отношению к пользователю и работающей
на многих типах компьютеров. Не вызывает сомнений, что именно Mosaic открыла
World Wide Web для большинства пользователей. В настоящее время в NCSA группа
разработчиков (в основном, студентов старших курсов) продолжает трудиться над
новыми версиями Mosaic, несмотря на то, что по своим возможностям эта программа
уже существенно уступает более новым программам. Mosaic является некоммерческим
программным продуктом, доступным для пользователей бесплатно. Исходный код
программы Mosaic открыт и активно используется разработчиками многих других
программ просмотра.
Netscape Navigator (сокращенно - Netscape) - это в настоящий момент, пожалуй,
самая популярная программой просмотра, работающая на тех же типах компьютеров,
что и Mosaic. Netscape - детище компании Netscape Communications Corporation,
основанной в начале 1994 года Джимом Кларком, который в свое время основал
крупную компанию Silicon Graphics, знаменитую своими графическими станциями.
Джиму Кларку удалось переманить в Netscape Communications Corporation
первоначальных разработчиков программы Mosaic из Иллинойса, в том числе и самого
Марка Андреессена. Netscape - это коммерческий продукт, за пользование которым
надо платить. Однако, для пользователей в университетах Netscape доступна
бесплатно. Кроме версий, работа над которыми завершена, компания периодически
выпускает отладочные версии Netscape (так называемые бетаверсии), которыми можно
пользоваться бесплатно до наступления определенной даты, после которой программа
перестает функционировать.
Microsoft Internet Explorer (сокращенно - IE) - творение фирмы Microsoft
Corporation. По функциональным возможностям и удобству использования IE примерно
эквивалентен упомянутой выше программе Netscape Navigator. В отличие от
последней, IE работает на значительно меньшем количестве компьютерных платформ.
IE распространяется бесплатно для всех пользователей.
Кроме Mosaic, Netscape и IE, стоит упомянуть такие программы как Lynx, IBM Web
Explorer и AOL Browser.
Анализ доступа на сервер Engineering показывает, что наиболее широко
используется Netscape Navigator. В настоящее время между Microsoft Corporation и
Netscape Corporation идет острейшая борьба за первенство на рынке программного
обеспечения для Internet, и весьма вероятно, что Microsoft вскоре существенно
потеснит Netscape и остальных своих конкурентов.
2.5. Основные команды программ просмотра
Оконный интерфейс графических программ просмотра прост и интуитивно понятен всем