Управляющие, латинские и специальные символы с кодами от 0 до 160 эквивалентны соответствующим символам в кодировке ISO 8859-1 (Latin Alphabet No. 1).
Буквы русского алфавита и их коды в стандарте ISO 8859-5 приведены в таблицах 1, и 2. В таблицах также приведены дескриптивные имена и коды символов согласно стандарту ISO 10646, а также имена символов, используемые в приложениях языка SGML, например, широко известного языка гипертекстовой разметки HTML (HyperText Markup Language).
Кроме них существуют еще кодировка MacOS, а также почти забытая альтернативная кодировка (CP855), и уже совсем забытые кодировки основная (или болгарская) и ГОСТ.
Замечание: в настоящий момент в сети Internet для этой кодовой таблицы используются и другие синонимы (alias) для указателя charset.
Из всех перечисленных кодировок только кодировка ISO8859-5 "узаконена" Международной Организацией по Стандартизации (ISO), но, к сожалению, она очень редко используется на современных компьютерах.
Сеть Internet развивалась первоначально как сеть UNIX машин и унаследовала все свойства представления информации в OS UNIX. Для передачи информации первоначально использовался только 7 битный код (т.е. передавалась только первая половина кодовой таблицы). Позже были разработаны различные способы передачи всей кодовой таблицы (transfer encoding=8 bit).
Наследие UNIX'а коснулось и системы передачи электронной почты. Неписаным телекоммуникационным стандартом передачи русских букв изначально стал стандарт OS UNIX кодировка KOI8. Практически все почтовые оболочки (изначально разработанные для MS DOS) перекодировали DOS'овскую кодировку CP855 в KOI8 и после этого передавали сообщение.
Такое единообразие нарушилось с появлением в нашей стране других сетей, входящих в систему Internet, таких как HEPNet (Radio-MSU) (этой сети принадлежит "Сеть Internet Новосибирского научного центра"), FreeNet, RUNNet (сеть университетов России) и др., и новых операционных систем, таких как MS Windows NT, MacOS, OS/2 и др. и системы передачи всей кодовой таблицы. Начиная с 1995 года старая система передачи русских сообщений стала постоянно давать сбои и корреспонденты то и дело вместо русского текста стали получать абракадабру, которую правда можно было расшифровать, или хуже всего сплошные квадратики (или точки), которые уже не поддавались расшифровке. Тем самым единый способ перекодировки русских букв оказался неприемлемым для использования в передаче почтовых сообщений.
Для правильной работы, используемая оболочка для передачи почтовых сообщений, которые содержат русские символы, должна правильно выставлять указатель кодовой таблицы (Code Page) (transfer encoding=8 bit Charset="УКАЗАТЕЛЬ ТАБЛИЦЫ") (см. список синонимов - alias - кодовых таблиц).
К сожалению старые DOS'овские почтовые системы не понимают различных систем кодировок. Поэтому, если корреспондент сидит за рабочей станцией, которая является DOS'овской машиной, то, чтоб не создавать лишних трудностей, рекомендуется отправлять почту в кодировке KOI8-R, а DOS'совская почтовая оболочка аккуратно переведет сообщение в альтернативную (или в кодировку CP866) кодировку.
1. Богданова Д.А., Телекоммуникации в школе. //Информатика и образование, №№ 1-3, 1996
2. Кенин А.М., Печенкина Н.С., IBM PC для пользователей или как научится работать на компьютере.- Екатеринбург: АРД ЛТД, 1997
3. Шафрин Ю., Основы компьютерной технологии.- М.: АБФ, 1997
4. Якубайтис Э.А., Информатика-электроника-сети.- М.: Финансы и статистика, 1989