Речевой ввод
Непосредственное машинное распознавание устной речи – особенно удобная форма подготовки текста. Однако технология распознавания речи пока что не стала главной альтернативой клавиатурному вводу. Приемлемая производительность достигается в том случае, если используется ограниченный запас слов и терминов, например, при работе только с научной специальной литературой. Кроме того, система распознавания речи должна быть приспособлена к тембру голоса оператора, вводящего текст. В области машинного распознавания речи ведутся интенсивные разработки [1-3–1-6]. Повышающаяся мощность систем и расширение при этом удобств для авторов дают повод ожидать, что речевой ввод найдет применение в будущем.
Прием документов/пересылка данных
Как правило, в настоящее время автор приносит текст в издательство или типографию на дискете с приложенной распечаткой ее содержания на бумаге. (Как уже упоминалось, бумажная распечатка необходима для обсуждения содержания и оформления страниц). Можно также направлять в типографии тексты через сети и службы данных. Перед типографией при этом стоит задача принять в собственную систему файлы с данными, которые чаще всего записаны в одной из компьютерных программ обработки текстовой информации. Таким образом, файлы с данными, как правило, должны быть конвертированы. Для этих целей используются специальные программы – так называемые "фильтры" или "интерпретаторы", которые проводят конвертирование. Несмотря на то, что типографии располагают подобными программными средствами, для документов, составляемых по заказу издательств и типографий, целесообразнее предварительное согласование форматов и носителей данных. Распространенными операционными системами являются Macintosh (Mac OS) и MS-Windows, а программными прикладными пакетами – MS Word, Star Office и MS Works. Некоторые проблемы возникают при передаче данных в формате PostScript из одной системы в другую. Массивы данных PDF (Portable Document Format) в значительной степени позволяют передавать информацию без проблем и в будущем найдут широкое применение
Набор и обработка - шрифты, параметры, характеристики
Для обработки введенного текста применяются компьютерные издательские системы (DTP) (DTP – Desktop Publishing). DTP – это технология подготовки изданий, при которой полностраничный документ обрабатывается на автономном рабочем месте, которым может служить персональный компьютер или рабочая станция. Текст, графика и изображения оформляются в соответствии с макетом и объединяются на полосе. Недорогие технологии издательских систем в настоящее время вытеснили предшествующую им фотонаборную технику. Программные средства имеют широкие возможности обработки текстовой информации и большой выбор шрифтов, поэтому позволяют получить результаты, не уступающие прежним, достигавшимся с помощью фотонаборной техники. Ведущими программами верстки являются Design (Adobe Systems) и QuarkXPress.
Кодирование знаков
Кодирование текста – необходимое условие его обработки в электронных системах. Каждому знаку шрифта соответствует цифровой машинный код. Во всем мире для текстов применяется стандарт представления символов ASCII (American Standard Code for Information Interchange). 7-битовое описание символаявляется стандартом, с помощью которого можно закодировать 128 различных знаков. При этом идентифицируется 96 знаков, используемых для создания содержимого полосы, а 32 кода используются для знаков контрольной информации. Умлауты и специальные знаки определяются комбинацией с восьмым битом, способ применения которого обычно определяется производителем программного продукта. Это часто приводит к проблемам при конвертировании в процессе пересылки данных.
Шрифты
Для набора текста существует множество различнооформленных шрифтов , т.е. наборов знаков, объединенных языковыми и художественны ми особенностями. Каждый шрифт включает все строчные и прописные буквы алфавита, знаки препинания, цифры от 0 до 9 и другие элементы (скобки, подчеркивания и т.д.). Под компьютерным "шрифтом" подразумевается совокупность всех знаков, находящихся в памяти и периферийных устройствах.
Существует несколько принципов описания формы знаков шрифта, включая основные: растровые шрифты (bitmapfonts) и векторные шрифты (outline fonts). В растровом шрифте все знаки представлены битовыми картами для каждого кегля. Для любого знака, соответствующего данному кеглю и начертанию, хранится пиксельный образец. Каждая из представленных на рис. 1-2,а точек, образующих "изображение", задана адресом (т.е. координатами х и у). Точность воспроизведения должна соответствовать требуемому качеству печатной продукции и максимальному разрешению выводной системы. Растровые шрифты требуют большой емкости памяти.
Векторные шрифты – это набор знаков, у которого начертание каждого отдельного элемента знака описывается линиями, заданными математически. Для их описания используют математические зависимости. Векторная графика основывается на выстроенных друг за другом направленных прямых, векторах (рис. 1-2,б). Каждый из этих векторов имеет начальную и конечную точку. Для описания вектора требуются лишь эти две точки с их координатами. И хотя знаки шрифта построены из нескольких векторов выстроенных друг за другом, по сравнению с растровыми шрифтами достигается очень большая экономия в плане объема данных.
Разновидностью векторной графики является контурная графика. Она позволяет, дополнительно к прямолинейным соединениям, использовать кривые линии, которые описываются способами математического приближения. Например, плавное сочленение криволинейных участков описывается отрезками парабол, кривыми функций Безье или сплайнфункциями (рис. 1-2,г). Данный метод, в отличие от других, являются аппаратнонезависимыми. И, следовательно, позволяет неограниченно изменяется масштаб.
Произвольное изменение масштаба векторных шрифтов обеспечивает экономию в смысле количества кеглей шрифта, сохраняемых в памяти системы. Кроме того, математическое описание штриховых шрифтов позволяет независимо от типов выводных устройств при конвертировании получать истинный вид оформления. В связи с этим вошел в обиход акроним WYSIWYG: "Что видишь на экране, то и получишь" (What You See Is What You Get). Собственную технологию отображения шрифта имеет язык описания полос PostScript фирмы Adobe Systems. Шрифт PostScript состоит из контурных шрифтов, масштаб которых можно произвольно изменять.
Параметры, применяемые при формировании полос, определяют форматирование текста. Технически проблема решается так, что длины строк, их порядок в блоке, абзацные отступы, расположение заголовков, сносок, индексации и т.д. снабжаются формальными атрибутами, которые играют роль переключателя функций в программном обеспечении. Важнейшими функциями являются следующие:
оформление заголовков и промежуточных заголовков, применением шрифтов различного кегля и размещением их соответственно установленной в макете иерархии заголовков;
образование строк из сплошного текста (соответственно заданной их длине с учетом переносов, кегля шрифта, выбранного начертания);
расположение строк с выключкой текстового блока по левому или правому краю, или по центру;
приведение строк к одинаковой длине, если нужно изготовить блочный набор;
группировка строк при наборе с выключкой влево (строки должны заканчиваться в заданной допустимой области; чем меньше размер этой области по сравнению с шириной колонки, тем лучше общее впечатление от рисунка шрифта);
автоматический перенос слов. Развитые программные продукты являются незаменимым средством для того, чтобы подготовить выключенный набор с хорошим результатом. Несмотря на то, что разбивка слов во многих случаях является подходящим способом для создания выключенных строк, в принципе нужно стараться обходиться наименьшим количеством переносов. Слишком большое количество знаков переноса портит картину текста и снижает его удобочитаемость.
Вывод текста для изготовления фотоформы или печатной формы
В процессе обработки текста его представление или отображение постоянно находится перед оператором на экране монитора компьютера. Для корректуры изготавливаются распечатки на бумаге.
Рис. 1-3. Качество контуров при цифровом выводе /фотовыводные устройства: a низкое разрешение; б улучшение качества контуров благодаря использованию более высокого разрешения (увеличение разрешения и уменьшение диаметра пятна в два раза)
Если предусмотрена дальнейшая обработка текста для изготовления фотоформы (вывод фотоформы для изготовления печатной формы) традиционным способом, т.е. посредством ручного монтажа, необходимо осуществить экспонирование фототехнические пленки. Текстовая информация может выводиться либо в виде гранок, либо как текстовые полосы со свободными местами под иллюстрации, которые затем монтируются вручную, либо в виде готовой полосы, включающей иллюстрации. Гранки содержат исключительно текст, выключенный по ширине колонки или полосы. При этом затраты ручного труда на верстку полос (создание макета полосы) очень велики. Целесообразнее предварительно обработать текстовую полосу с помощью программы верстки, которая позволяет оставить площади, на которые затем будут монтировать уже имеющиеся на фотоформах изображения. Электронное составление полностью сверстанных полос с отображением текста и изображений, а также одновременный их вывод на фотопленку предполагают, что все изображения представлены в цифровой форме в компьютере и могут обрабатываться вместе с текстом в программе верстки.