HTML
1. Web-страницы. Основные понятия
Web-страница является элементарной частью Всемирной Паутины (World Wide Web, www). WWW, в свою очередь, — одна из возможностей компьютерной сети Internet, связывающей компьютеры по всему миру.
Вся информация www хранится в виде отдельных документов. В основе каждого такого документа лежит текст, который может быть оформлен различными шрифтами, стилями и т. п. В тексте могут быть помещены иллюстрации, таблицы, видео-клипы, также возможно добавление фоновой звуковой дорожки. Основное свойство документов во Всемирной Паутине — наличие ссылок на другие документы, находящиеся в Сети. Такие ссылки называются гиперссылками (hyperlink), они позволяют при просмотре быстро переходить от одного документа к другому, и тем самым связывают все документы в единое целое. Документы, о которых идёт речь, называются web-страницами. Содержимое web-страниц часто называют гипертекстом.
Набор страниц, объединённых общей тематикой, называется сайтом (web site). Обычно весь сайт целиком хранится на одном компьютере сети, называемом web-сервером. Довольно часто серверы содержат несколько сайтов.
У каждого объекта, к которому можно получить доступ через Internet (в частности, у сайтов и отдельных web-страниц) имеется свой адрес в сети, который называется иначе унифицированным адресом ресурса (Uniform Resource Locator, URL).
Рассмотрим пример адреса для web-сайта: http://www.uni-vologda.ac.ru (сайт ВГПУ). Первая часть адреса (“http://”) — название протокола, по которому нужно производить передачу данных по Сети. Протокол — набор правил, которые определяют, в каком виде данные должны передаваться по сети. Для разных видов данных используются разные протоколы. В случае web-страниц применяется протокол передачи гипертекста (HyperText Tranfer Protocol, HTTP). Для передачи произвольных файлов по Сети используется протокол передачи файлов (File Transfer Protocol, FTP). Существуют и другие протоколы (Gopher, Telnet и т. д.).
За именем протокола в адресе следует собственно адрес, который лучше читать справа налево. Часть “ru” означает, что сайт находится в России, она называется доменом (группа сайтов) первого уровня. Домен 1-ого уровня может быть географическим (ru — Россия, us — США, uk — Великобритания, ger — Германия, ua — Украина и т. п.) или тематическими (com — коммерческий сайт, edu — образование, gov — правительство, net — сетевые службы, mil — военное дело и оборона и т. п.). Внутри домена первого уровня находится домен второго уровня, в нашем случае — “ac” это значит, что сайт имеет отношение к образованию и науке. В принципе возможны домены третьего и более высоких уровней. Слева в адресе содержится название самого сайта (“uni-vologda”). Иногда, для того чтобы подчеркнуть то, что адрес относится к Всемирной Паутине, добавляют часть “www”.
Для просмотра web-страниц используются специальные программы, называемые браузерами (web browser). Они позволяют загружать из Сети для просмотра страницы с заданным адресом и переходить от документа к другому по гиперссылкам. Наиболее известными являются браузеры Netscape Navigator фирмы Netscape и Internet Explorer фирмы Microsoft.
2. Понятие языка HTML
Наша цель состоит в том, чтобы научиться создавать собственные страницы для WWW. Для этого придётся познакомиться с правилами, в соответствии с которыми страницы хранятся на диске компьютера. Любая страница представлена в виде отдельного текстового файла, который можно создать любым текстовым редактором. Так как страница может содержать не только текст, но и множество других элементов (шрифтовое оформление текста, иллюстрации и т. п.), то в текст встраиваются специальные управляющие конструкции, называемые тегами. Весь набор правил, по которым нужно создавать файл с web-страницей и записывать отдельные теги, называется языком разметки гипертекста (HyperText Markup Language, HTML). Браузеры при открытии файла в формате HTML способны расшифровать теги и показать страницу в своём окне так, как она была задумана создателем. В операционной системе Windows файлы web страниц должны иметь расширения “htm” или “html”. При обучении правилам HTML нет необходимости помещать наши страницы на действующий сайт в Internet, достаточно хранить их в виде файлов на конкретной рабочей станции или на сервере локальной сети.
3. Структура файла в формате HTML
В первую очередь нам потребуется создать файл с расширением “htm” или “html” и открыть его для редактирования в текстовом редакторе (работая под Windows, можно использовать стандартную программу “Блокнот”).
Текст для HTML-документа набирается в том виде, в котором его должен показать браузер, а при выделения фрагментов, которые предназначены для разметки документа (тегов), используются угловые скобки (знаки “больше” и “меньше”), например: <BODY>.
Любой документ HTML начинается с открывающего тега <HTML> и заканчивается соответствующим ему закрывающим тегом </html>. Закрывающий тег отличается от закрывающего наличием косой черты перед названием тега. В языке HTML нет различий между большими и малыми буквами при записи тегов, однако принято записывать открывающий тег большими буквами, а закрывающий — малыми. Часть документа, которая находится в пределах от открывающего до соответствующего ему закрывающего тега, называется контейнером (to contain — содержать что-либо). Теги, у которых есть закрывающий и открывающий варианты записи называются парными, а те, которые используются только в одном виде (например, тег <BR>), называются непарными. Весь файл web-страницы — это по сути дела один большой контейнер HTML (так как начинается с <HTML> и заканчивается </html>).
Внутри контейнера HTML последовательно записываются два контейнера:
1. <HEAD> . . . </head> (заголовок документа). Внутри этого контейнера записываются параметры, общие для всей страницы. Для примера можно поместить сюда контейнер <TITLE>, позволяющий поместить текст для отображения в заголовке окна браузера.
2. <BODY> . . . </body> (тело документа). Этот контейнер содержит всё то, что должен показать браузер внутри своего окна при открытии документа. Если документ содержит только текст, то этот текст нужно записывать именно здесь, если есть другие элементы (графика, таблицы, ссылки и т. д.), то они вставляются в текст с помощью тегов, которые будут рассмотрены позже.
Рассмотрим простейший пример текста, который может быть использован в качестве HTML-документа:
<HTML>
<HEAD>
<TITLE>Самая простая web-страница</title>
</head>
<BODY>
То, что вы сейчас читаете в окне браузера, записано в контейнере BODY внутри HTML-файла.
</body>
</html>
4. Способы оформления текста в HTML
В первую очередь, отметим несколько особенностей поведения большинства браузеров при отображении текста, набранного внутри контейнера BODY.
1. Пробелы между словами в количестве более одного заменяются одним пробелом
2. Символы перехода на новую строку игнорируются, а точнее заменяются пробелом. Браузер выполняет перевод строки автоматически в тот момент, когда строчка достигает правого края окна.
3. Если есть необходимость вставить в каком-либо месте в тексте принудительный перевод на новую строку, то можно использовать непарный тег <BR>. Он разрывает текущую строку, а текст, следующий за этим местом в HTML-файле, продолжает с новой строки.
4. Кроме тега разрыва строки имеется тег начала нового абзаца, <P> (от слова paragraph — абзац). Отличие его от <BR> состоит в том, что тег абзаца кроме разрыва строки вставляет новую пустую строку. Обычно он используется как непарный, хотя не запрещено ставить в конце абзаца закрывающий тег </p>.
5. Если нужно сохранить все пробелы и символы перевода строки, которые записаны в HTML-файле, то соответствующую часть текста можно поместить в контейнер <PRE> . . . </pre>.
4.1. Логические стили для оформления текста
При отображении текста часто бывает необходимо некоторые фрагменты выделить особым образом. В тексте часто встречаются заголовки разной степени важности, адреса электронной почты и узлов web, верхние и нижние индексы, цитаты и т. п. Чтобы выделять эти фрагменты, их нужно помещать в определённые контейнеры, каждый из которых предназначен для одной определённой цели, или, другими словами, определяет логический стиль. Один и тот же логический стиль может отображаться на разных браузерах по-разному. Ниже перечислены некоторые стили.
1. Контейнер <H1> . . . </h1>. Сюда помещают те фразы, которые служат заголовками первого уровня, то есть, наиболее важные заголовки (например названия глав в книге). Внешне они чаще всего выглядят как текст увеличенного размера и полужирного начертания. Кроме этого контейнера есть и контейнеры H2, H3, ... H6, позволяющие использовать ещё пять уровней заголовков.
2. <ADDRESS> . . . </address>. Этот контейнер позволяет особо оформить адрес (почтовый, адрес сайта, электронной почты и т. д.).
3. Контейнеры STRONG (усиленное выделение) и EM (от англ. emphasis — акцент). Сюда помещают текст, содержащий важные мысли, термины и т. п. Стиль STRONG обычно отображается браузерами с использованием полужирного начертания, а EM — курсивом.
4. Для записи текстов программ и текста, введённого с клавиатуры, можно использовать три контейнера: CODE (код программы), SAMP (sample — пример) и KBD (keyboard — клавиатура). Все они могут отображаться по-разному, но общее у них — использование моноширинного шрифта (например, Courier), все буквы в котором имеют одинаковую ширину. Такой шрифт позволяет разным строчкам не смещаться относительно друг друга, символы с одинаковым номером в строке всегда находятся на одной вертикальной прямой.
5. Возможно выделение текста с помощью уменьшенного и увеличенного шрифтов, для этого применяются контейнеры BIG и SMALL.
6. Если фрагмент текста должен быть показан как верхний индекс, то для его выделения используется контейнер SUP, а для нижнего индекса — SUB. Например, для того, чтобы записать y=x2, потребуется в HTML-текст поместить такую строчку: y=x<SUP>2</sup>.
4.2. Физические стили
В отличие от логических, эти стили не оформляют текст по его назначению, а указывают внешний вид символов, отображаемых браузером: