Сигналы, в которых содержится информация, могут быть представлены в дискретной и в непрерывной форме. Дискретные сигналы могут принимать лишь определенное конечное количество значений. Непрерывный сигнал может принимать бесчисленное множество значений, которые могут отличаться один от другого сколь угодно малыми приращениями.
Каждому состоянию системы х соответствует определенное сообщение xc. Множеству возможных событий соответствует множество сообщений, передаваемых при помощи сигналов. Формирование сообщения следует рассматривать как преобразование системы
в xc - одно из множества возможных состояний Это преобразование происходит посредством некоторого оператора Р:Оператор Р преобразования какого-либо операнда в его образ сообщения называется кодом. Это комплекс правил, согласно которым информации придается определенный сигнал. Сама операция преобразования посредством кода называется кодированием. В узком смысле слова под кодированием понимают присвоение кодового обозначения объекту или всякую операцию сопоставления множества сообщений одного источника множеству сообщений другого источника, согласно определенной системе правил.
В качестве операнда может рассматриваться не только состояние системы x или событие (х, t), но и сообщение
. В этом случае имеет место перекодирование. Операция перекодирования часто бывает необходима в случаях секретности. При этом сообщение, закодированное одним способом, преобразуется в сообщение , закодированное другим способом. В коммуникационной цепи возможно многократное перекодирование. Такое преобразование сообщений можно представить как последовательное воздействие на состояние системы х операторов P1, Р2, ..., Pi по схеме:Экономичность передачи сообщения зависит от правильности его кодирования, т.е. от рациональной системы кодирования. Кодирование сигнала по существу означает сравнение символов одного алфавита с символами другого алфавита. При этом код представляет собой комплекс правил сравнения символов. Поскольку при кодировании сравниваются символы двух алфавитов, то при этом может изменится количество символов и их вероятностное распределение. В силу этого изменяется и энтропия сообщения. Задача заключается в том, чтобы найти наиболее экономичный для данной передачи код. Наиболее экономичным является код, который требует минимального числа символов и минимального времени на передачу. Хороший код должен сохранить все нужное в сообщении и исключить ненужное.
Большинство кодов имеют избыточность. Это значит, что при передаче сообщений умышленно не используются все возможности кода.
Избыточность - это свойство языков, кодов и знаковых систем состоящее в том, что сообщение содержит больше сигналов, чем фактически требуется для передачи информации: это свойство улучшает связь в условиях помех. Простейшей формой избыточности является дублирование.
Наличие избыточности в сигнале равносильно его удлинению. Однако считать избыточность исключительно отрицательным явлением нельзя, т.к. чем больше избыточность сообщения, тем меньше оно подвержено искажению за счет действия помех. Нахождение оптимальной избыточности кода при данном уровне помех - одна из главных задач теории информации.
Одной из основных проблем при передаче информации по каналу связи с ограниченной пропускной способностью является максимальное увеличение фактической скорости передачи сообщений, которая зависит не только от параметров технических устройств, но и от принятой системы кодирования. Выбором эффективного способа кодирования и декодирования для каждого конкретного канала связи можно добиться наилучшего использования его пропускной способности.
Наибольшее распространение получили двоичные коды, обладающие существенным преимуществом. Наличие всего двух символов позволяет просто и надежно представлять числа в виде импульсов тока или напряжения. Большинство цифровых вычислительных систем предназначается для обработки дискретной информации, закодированной в двоичной системе счисления. Коды, в которых сообщения представлены комбинациями с неравным количеством символов, называются неравномерными или некомплектными. Коды, в которых сообщения представлены комбинациями с равным количеством символов, называются равномерными, или комплектными,
Очевидно, что при использовании равномерного кода в отличие от неравномерного не требуется специального знака, отделяющего одну букву от другой. Для однозначного декодирования принятых сообщений, а также для передачи больших объемов информации при меньших временных и материальных затратах коды должны удовлетворять следующим требованиям:
разные символы передаваемого сообщения должны иметь различные коды;
код должен быть построен так, чтобы можно было четко отделить начало и конец букв алфавита, из которого составлено сообщение;
код должен быть максимально кратким - чем меньшее число элементарных символов требуется для передачи данного сообщения, тем ближе скорость передачи информации к пропускной способности данного канала.
Первое требование очевидно, так как при одинаковых кодовых обозначениях различных букв сообщения нельзя будет однозначно декодировать.
Второе требование может быть удовлетворено следующим образом: введением в код дополнительно разделительного символа-паузы, что значительно удлиняет время передачи сообщения; созданием кода, в котором конец одной буквы не может быть началом другой; либо применением равномерного кода. В этом отношении равномерные коды обладают преимуществом, вместе с тем они имеют существенный недостаток — независимо от вероятности появления отдельных букв сообщения они закодированы последовательностями символов одинаковой длины. Такой код может быть оптимальным с точки зрения затрат времени на передачу только в случае, если все буквы сообщения равновероятны и независимы.
Третье, основное требование к кодам обеспечивает наибольшую скорость передачи информации по каналу связи посредством возможного сокращения кодов. Длину последовательности символов, кодирующих каждое сообщение, назовем длиной кодового слова. Основные свойства оптимальных кодов:
1. Минимальная средняя длина кодового слова оптимального кода обеспечивается в том случае, когда избыточность каждого слова сведена к минимуму (в предельном случае - к нулю).
2. Алфавит оптимального кода должен строиться из равновероятных и независимых символов.
Из свойств оптимальных кодов вытекают принципы оптимального кодирования: выбор очередного символа в кодовом слове необходимо производить так, чтобы содержащееся в нем количество информации было максимальным, и сообщениям, имеющим большую вероятность появления, необходимо присваивать более короткие кодовые слова.
Эти принципы определяют метод построения оптимальных кодов, предложенный независимо друг от друга Р. Фано и К. Шенноном. Поэтому соответствующий код называется кодом Шеннона-Фано.
Построение оптимального двоичного кода сводится к следующей процедуре:
1. Множество из N сообщений располагают в порядке убывания вероятностей.
2. Множество сообщений разбивают на две группы так, чтобы суммарные вероятности сообщений обеих групп были по возможности равны.
3. Первой группе присваивают символ 0, второй группе - символ 1.
4. Каждую из групп делят на 2 подгруппы так, чтобы их суммарные вероятности были по возможности равны.
5. Первым подгруппам каждой из групп вновь присваивают 0, а вторым - 7, в результате чего получаются вторые цифры кода. Затем каждую из четырех подгрупп вновь делят на равные (по суммарной вероятности) части и т.д. до тех пор, пока в каждой из подгрупп останется по одной букве. Очевидно, что для равновероятностных сообщений оптимальный код будет равномерным, т.е. длина кодового слова постоянна.
Вопрос об отыскании практически удобных методов кодирования для различных каналов связи с помехами составляет содержание теории кодирования, являющейся самостоятельным разделом теории информации.
Экономическая информация
Так же, как и информация вообще, экономическая информация может быть понята, проанализирована и рационально сконструирована только при изучении экономических систем, процессов управления в них и конкретных задач, решаемых в системах управления. С этой точки зрения под экономической информацией следует понимать:
сведения, знания наблюдателя об экономическом объекте;
наличие связи между элементами экономической системы, т.е. именно то, что определяет ее цельность как системы (внутренняя информация системы);
нематериальные составные части системы — знания, навыки, методы, т.е. информационные подсистемы экономической системы;
сообщения, которые циркулируют в экономической системе, и которыми она обменивается с внешней средой или другими экономическими системами. Они отражают те реальные связи, которые существуют между различными экономическими объектами, отображаемыми в виде систем;