Координация работы по созданию классификаторов и унифицированных систем документации осуществлялось Госстандартом СССР и непосредственно – Всесоюзным научно-исследовательским институтом классификации и кодирования информации (ВНИИКИ).
Классификаторы подразделяются на категории. Категория классификатора указывает на его принадлежность к определенной группе в зависимости от уровня утверждения сферы применения. Различают классификаторы общероссийские, отраслевые и классификаторы предприятий. Вся совокупность общероссийских классификаторов в зависимости от вида информации, являющейся объектом классификации и кодирования, распределена на восемь групп:
1. Социальная информация. Сюда входит Общероссийский классификатор информации по социальной защите населения (ОКИСЗН), разработанный в 1993г. Объектами классификации в нем являются виды пенсий и пособий; условия назначения пенсий, их размеры; причины и группы инвалидности; трудовой стаж и его исчисление; исчисление пенсии и заработка; надбавки к пенсиям и т.п.
2.Информация по описанию организации экономики. В эту группу входят наиболее широко используемые классификаторы:
- Общероссийский классификатор объектов административно-территориального деления (ОКАТО), разработанный в 1995г и введенный в действие с 01.01.1997г;
- Общероссийский классификатор органов государственной власти и управления (ОКОГУ), разработанный в 1993г и введенный в действие с 01.07.1997г;
- Общероссийский классификатор предприятий и организаций (ОКПО), разработанный в 1993г;
- Общероссийский классификатор экономических регионов (ОКЭР) – утвержден Госстандартом России в 1995г и введен в действие с 1997г;
- Классификатор форм собственности (КФС) и Классификатор организационно-правовых форм (КОПФ), введенные в действие с 1 января 2000г.
3. Информации о продукции, видах экономической деятельности и оказываемых услугах. Сюда относится, в частности, Общероссийский классификатор видов экономической деятельности (ОКВЭД), введенный в действие с января 2003г и сменивший ранее действовавший, разработанный еще в 1975г Общесоюзный классификатор отраслей народного хозяйства (ОКОНХ).
4. Информация о природных и трудовых ресурсах – Общероссийский классификатор информации о населении (ОКИН), Общероссийский классификатор специальностей по образованию (ОКСО), введенный в действие с 1 января 2004г (ОК 009-2003) и др.
5. Информация о финансово-кредитной сфере – представлена, в частности, Общероссийским классификатором валют (ОКВ).
6. Информация об управленческой документации, показателях и единицах измерения. Сюда входят Общероссийский классификатор управленческой документации (ОКУД), Общероссийский классификатор единиц измерения (ОКЕИ) и др. В частности, в ОКУД кодируются наименования унифицированных форм восьми унифицированных систем документации, включая организационно-распорядительную, банковскую, отчетно-статистическую, первичную учетную и др. В этот классификатор включено в общей сложности около 1900 форм документов.
7. Информация о стандартах и технологических процессах – Общероссийский классификатор стандартов (ОКС); Общероссийский классификатор изделий и конструкторских документов машиностроения и приборостроения (ОК ЕСКД).
8. Прочие виды технико-экономической и социальной информации. В частности, Общероссийский классификатор стран мира (ОКСМ), Общеправовой классификатор отраслей законодательства (ОКОЗ), Общероссийский классификатор информации об общероссийских классификаторах (ОКОК)[8].
Общероссийские классификаторы технико-экономической и социальной информации относятся к нормативным документам. По своему статусу они соответствуют государственным стандартам.
Использование классификационных схем (классификаторов) в практической деятельности потребовало создания системы условных обозначений, которые присваиваются объектам и классификационным группировкам. Такие системы называются индексами или кодами, а сам процесс подобного присвоения обычно именуется индексированием или кодированием.
Различают следующие виды кодирования:
- регистрационные
- классификационные.
В свою очередь, регистрационные методы кодирования бывают двух видов: порядковый и серийно-порядковый.
Порядковый метод кодирования предполагает использование в качестве кодов чисел натурального ряда, то есть каждому из объектов классификации присваивается текущий порядковый номер (например, номера страниц в книге). При серийно-порядковом методе кодами служат также числа натурального ряда, однако отдельные серии этих чисел закрепляются за объектами классификации с одинаковыми признаками. Классификационные методы кодирования основаны на предварительной классификации объектов. Они также бывают двух видов: последовательный и параллельный. Последовательный метод кодирования используется обычно при иерархическом методе классификации. Здесь код классификационной группировки и объекта классификации образуется посредством использования кодов последовательно расположенных подчиненных группировок. Параллельный метод кодирования используется при фасетном методе классификации. В данном случае код классификационной группировки и объекта классификации образуется с использованием кодов независимых группировок, то есть признаки объекта кодируются независимо друг от друга. Это позволяет группировать объекты по любому сочетанию признаков[9].
Все классификаторы строятся на кодах, представляющих собой знак или совокупность знаков, используемых для обозначения классификационной группировки и (или) объекта классификации. (В данном случае термины «код» и «кодирование» используются в более узком смысле. Под кодом понимается такое представление информации, которое удобно для ее хранения, передачи или обработки, а термином кодирование обозначается переход к подобному представлению информации от исходного ее представления). По коду можно найти и распознать тот или иной объект среди множества других объектов. Чтобы максимально облегчить это распознавание и поиск, индексы или коды в классификационных схемах разрабатываются таким образом, чтобы даже по их внешнему виду, алфавиту кода можно было определить объект классификации и получить максимум информации о нем. К примеру, буквенный код России по Общероссийскому классификатору стран мира – RU, а США – US. Код российского рубля по Общероссийскому классификатору валют – RUR, а доллара - USD[10].
Структура кода состоит из следующих элементов:
- алфавит
- разряд
- длина
- основание
Алфавит – это система знаков, принятых для образования индекса или кода. Различают:
- цифровой
- буквенный
- буквенно-цифровой
- штриховой алфавиты кода.
Последовательность расположения знаков в коде определяется его разрядом, то есть позицией знака в коде. К примеру, код унифицированной формы документа в ОКУД состоит из 7 цифровых десятичных знаков и контрольного числа (КЧ). Он строится следующим образом:
ХХ ХХ ХХХ Х, где первые две цифры обозначают класс форм документов, то есть принадлежность унифицированной формы документа к соответствующей унифицированной системе документации (например, 02 – Унифицированная система организационно-распорядительной документации); следующие две цифры обозначают подкласс форм документов (к примеру, 11 – документация по созданию организации, предприятия); затем следуют три цифры, которые содержат регистрационный номер унифицированной формы документа внутри подкласса (например, 231 – конкретная унифицированная форма документа, которой обозначается Устав); наконец, контрольное число, которое вводится во избежание ошибок при считывании и используется при проверке записи кода. Условным обозначением в структуре кода могут быть цифра, буква, штрих или пробел. Пробел – определенное расстояние между знаками (буквами, цифрами, штрихами), которое выполняет разделительную функцию и (или) выраженное в мм может означать число.
В штрих-кодах цифровую информацию несут ширина штрихов, пробелов и цифры внизу.
Длина кода – число знаков в коде без учета пробелов.
Основание кода представляет собой длину кода с учетом количества пробелов[11]. Любой технико-экономический или социальный показатель имеет одно наименование и один код независимо от того, в информационной системе какого типа или уровня этот показатель будет использоваться. В настоящее время для идентификации в информационных системах разработаны и широко используются также и некоторые другие классификаторы. В частности, ГОСТ регламентирует стандартную нумерацию книг – ISBN и сериальных изданий ISSN. Подобного рода нумерация изданий представляет собой совокупность цифр, например, ISBN 5-94621-080-7, где первая цифра 5 означает код России, следующие цифры 94621 – код конкретного издательства, полученный в Национальном агентстве ISBN Российской книжной палаты (в данном примере это код Участка оперативной ризографии и офсетной печати Редакционно-издательского отдела Томского государственного университета), цифры 080 – порядковый номер названия конкретной книги данного издательства («Документ в меняющемся мире»), наконец, цифра 7 – контрольное число кода ISBN. Подобного рода коды позволяют идентифицировать публикации независимо от времени и места их издания. Наряду с цифровым, используется также штриховой (линейный) код, в основе которого лежит, тем не менее, опять же цифровой код. Штрих-код представляет собой графическое изображение – комбинацию вертикальных полосок разной ширины и пробелов между ними. При этом в качестве базовой выступает ширина узкой полоски. Широкие же полоски являются кратными по ширине узким, либо находятся с ними в определенных соотношениях. При информационном обмене с информационными системами других стран или международных организаций используются международные классификаторы информации, в частности, Международная патентная классификация (МПК), Международная классификация товарных знаков и услуг (МКТЗ) и другие.