В войне Microsoft и Netscape не было и не будет победителей. Когда очарованность браузерами пройдет (что уже началось), обе компании будут владеть крупными долями рынка. Однако если отделы ИС сделают все возможное, чтобы, как Швейцария, соблюсти свой нейтралитет, они смогут воспользоваться некоторыми результатами борьбы. Аргументы в пользу оптимистичного прогноза таковы. Когда Netscape неожиданно появилась на рынке, Microsoft пришлось немедленно отреагировать, чтобы не потерять часть своего бизнеса. Без такой яростной конкуренции между двумя гигантами не было бы ни такого широкого использования Web, ни коммерческих Web-серверов, ни недорогих браузеров с графическими интерфейсами. Это соперничество породило недорогие продукты, которые, благодаря использованию протоколов Internet, способны к взаимодействию. Преодолеть несовместимость различных HTML проще, чем те трудности, которые могли бы возникнуть, считают оптимисты.
Импортирование и конвертирование документов
Как уже говорилось в главе о поисковых машинах, лучший вариант при поиске документов - наличие справочников Internet-адресов. В случае же их отсутствия следует начать поиск с помощью сетевых машин. Кроме того, сами гипертекстовые документы заключают в себе возможность поиска по помещенным в них ссылках, что часто приводит к желаемому результату.
После нахождения необходимого документа помимо его просмотра часто имеется необходимость получения файла, его содержащего. В этом случае возникает ряд трудностей. Файлы в WWW написаны на HTML (Hyper Text Makeup Language) имеют расширение ,,.htm’’ и хранятся в ASCII-кодах. После копирования такого файла с помощью броузера и просмотре его с помощью какого-либо редактора (например MultiEditor, Norton Editor, или Word, который в свою очередь выполняет конвертирование собственными средствами в необходимый формат, с расширением ,,.doc”), отображается много служебной информации, что загромождает текст. Можно, конечно же, ,,в ручную’’ выделить исходный текст, что в случае обьёмных документов требует значительной затраты времени.
Чтобы избежать этого существуют программы-конверторы, некоторые из которых можно найти по адресу:
http://www.ucsa.uiuc.edu/~mag/work/HTMLEditors
однако практически всё это обеспечение не является ,,shareware” и поэтому становится труднодоступным. Имеются конечно же и свободно распространяемое обеспечение, но не всегда они могут соревноваться по количеству выполняемых функций с коммерческими продуктами. Один такой конвертор, работающий под DOS можно свободно получить по адресу:
ftp://193.25.152.10
Этот конвертер ,,убирает’’ из файла всю HTML-информацию, после чего файл вместо расширения ,,.htm’’ получает расширение ,,.asc’’ c сохранением разбиения на абзацы. После этого с этим конвертированным файлом можно работать в желаемом редакторе.
К недостаткам этого файла следует отнести не восстановление таблиц.
Существует так же способ копирования файла через буфер обмена, при котором файл в броузере выделяется, либо с помощью мыши, либо с помощью ,,горячей клавиши” ,,Ctrl+A’’, а затем, вставляется из буфера в Word-овский документ. В этом случае вся HTML-информация так же копируется.
Как уже упоминалось, при импортировании файлов такими способами таблицы теряют свой вид, картинки так же не сохраняются.
Картинки, однако, можно получить довольно несложным способом(для определённости рассмотрим Netscape Navigator 2.0): после того как расположить указатель мыши на требуемой картинке следует ,,щелкнуть” правой клавишей мыши. В результате раскроется диалоговое окно в котором следует указать имя данного файла и место, где его следует сохранить. В результате требуемая картинка будет сохранена в формате ,,.gif”. Так же просматривая содержимое кэша броузера, если к тому же сделать его значительного размера, то можно там обнаружить ряд файлов с картинками, которые хранятся в таком же формате (,,.gif”) но под собственными именами. Нахождение требуемой сводится к простому просмотру.
Отличие таблицы от картинки в данном случае следующее: картинка хранится в готовом файле и этот из него ,,закачивается” на web-страницу; таблица же создаётся средствами HTML-редактора, поэтому представляет собой просто часть программы поэтому её приходится восстанавливать вручную непосредственно в редакторе.
Следует отметить, что найденный документ можно просто распечатать используя собственные возможности броузера.
Другим способом получения файлов Internet является использование программы ,,ftp”. Cвое название она получила от названия протокола передачи файлов в сети FTP (File Transmission Protocol).При работе эта программа использует IP-адреса сети [5].
IP-адреса - уникальные номера, которые применяются для идентификации компьютеров в Internet. IP-адрес состоит из
четырех номеров (каждый по величине не больше 255 в десятичной записи), отделенных друг от друга точками. 192.33.33.22 - это IP-адрес, так же как и 138.40.11.1. Крайнее слева число обозначает крупную
сеть; числа, которые стоят правее, указывают на более мелкие участки внутри этой крупной сети, и так до тех пор, пока мы не попадем на конкретный компьютер. Очевидно, что с подобными адресами сразу же возникает проблема: они длинные и их трудно запомнить. Чтобы облегчить запоминание, компьютеры стали обозначать специальными именами, например liberty.uc.wlu.edu (такое имя называется доменным). С подобной адресной информацией работать легче, потому что доменные имена обладают постоянной структурой, опираясь на которую можно понять, к чему они относятся. Вы набираете имя, а маршрутизаторы, которые обрабатывают сетевой поток данных, подставляют вместо него соответствующие цифры IP- адреса.
Система доменных имен (Domain Name Server - DNS), описывающая компьютеры и организации, в которых они установлены, устроена зеркально по отношению к цифровой IP-адресации. Если в IP-адресе наиболее общая информация указана слева, то в доменных именах она стоит справа. Доменные имена могут многое сказать о конкретном адресе, как видно из следующего описания: com - коммерческие домены США, т. е. эти адреса принадлежат фирме или компании; edu - в американских адресах обозначает образовательную организацию. wisc.edu, например, соответствует университету шт. Висконсин; gov - домен верхнего уровня для компьютеров правительственных организаций США; mil - относится к военному ведомству США; net - относится к организациям, управляющим сетями; org - как правило, применяется для частных компаний, которые не подходят под вышеуказанные категории. Так, Internet Society использует домен isoc.org. Если .com, .edu, .gov и .mil используются в основном применительно к американским учреждениям и организациям, то у других стран есть собственные домены верхнего уровня. Доменное имя Германии - .de, Швейцарии - .ch, Италии - .it, Соединенные Штаты тоже имеют свой домен - .us. Чтобы обратиться к конкретному пользователю по данному компьютерному адресу, нужно к последнему прибавить слева имя пользователя с помощью символа @ (коммерческое at). Имена позволяют компьютерам в сети всего лишь получить информацию о запрашиваемых адресах. Когда вы указываете конкретный компьютер с помощью доменного имени, например quake.think.com, сервер имен, отвечающий за соответствующую область адресов (домен), переведет это имя в IP-адрес. В зависимости от местонахождения машины и географического расстояния от нее до вас такие запросы могут пройти через несколько серверов имен, прежде чем будет получен окончательный адрес. Привлекательность этой системы заключена в следующих двух обстоятельствах: во-первых, вам не нужно обрабатывать ни один из запросов/ответов, поскольку это происходит автоматически; во-вторых, по сравнению с централизованным списком адресов система DNS позволяет сети расти с гораздо меньшими организационными усилиями.
Несомненно существенно, что если на двух соединённых компьютерах установлена программа ftp, то не имеет значения работают ли они на одной платформе, или нет.
Поскольку ftp разрабатывалась на основе ОС UNIX, то она использует команды этой платформы.
При работе с ftp, посте получения доступа на требуемый сервер, как и в ОС UNIX будет запрошено имя и пароль. Однако практически се сервера имеют директорию для свободного доступа, где, как правило, и хранятся общедоступные документы. Вход в неё осуществляется с паролем ,,anonymous”, а вместо имени вводится e-mail - адрес пользователя, что используется сервером для регистрации клиентов. После этого, используя опять же команды ОС UNIX можно просмотреть содержимое каталога и подкаталогов и переместить необходимый файл на свой компьютер.
Следует иметь в виду, что ftp поддерживает два способа пересылки файлов: в ASCCI-кодах и в двоичном (binary) формате, поэтому, исходя из вида пересылаемого файла следует указать формат пересылки [6]:
Файл | Режим | |
ASCII | Двоичный | |
Текстовый файл | * | |
Электронная таблица | * | |
Файл базы данных | Возможен | Как правило |
Файл текстового процессора | Возможен | Как правило |
Сообщение электронной почты | * | |
Исходный текст программы | * | |
Резервная копия файла | * | |
Файл | Режим | |
ASCII | двоичный | |
Сжатый файл | * | |
Файл PostScript (для лазерного принтера | * | * |
Графический файл (формате GIF, JPEG, MPEG) | * | |
Гипертекстовый документ (формат HTML) | * |
Заключение
Internet продолжает развиваться с неослабевающей интенсивностью, по сути дела стирая ограничение на распространение и получение информации в мире. Однако в этом информационном океане бывает не очень легко найти необходимый документ. следует также иметь в виду, что в сети наряду с давно действующими серверами возникают новые.