Энтропия. Теория информации (стр. 5 из 8)

Пока существует разность температур T₁ – T₂, часть теплового потока может быть преобразована в полезную (антиэнтропийную) энергию либо в естественно протекающих процессах (например, биологических), либо с помощью тепловых машин.

При условии T₁= T₂ энергия полностью утрачивает свои антиэнтропийные свойства. Этот вывод был положен в основу теории тепловой смерти Вселенной.

Заметим, что сам термин «энтропия» был введен Клаузиусом, образовавшим его от корня греческого слова «тропе», означающего «превращение» с добавлением заимствованной из слова «энергия» приставки «эн-».

1б. Предложенная Клаузиусом формула энтропии (1.1) не раскрывала внутренних механизмов процессов, приводящих к возрастанию энтропии.Эта задача была решена Л.Больцманом, предложившим исчислять энтропию идеального газа по формуле :

S = K H

(1.4)

где K= 1,38 · 10 ^-16 ^эрг/_градус – коэффициент Больцмана

Н - математическая энтропия.

Согласно Больцману, величина H определяется так :

H = ln	N !	(1.5)
	N₁! N₂! … N_k!

где N - общее число молекул газа, находящегося в рассматриваемом объеме.

N_i - число молекул, движущихся со скоростями, соответствующими i-ой ячейке условного пространства скоростей.

При этом 1= 1,2, ... К ( 1.6)

Условие (1.6) означает, что все N молекул распределены по соответствующим ячейкам пространства скоростей, в количествах N₁, N₂, … N_k,, учитываемых уравнением (1.5)

Согласно (1.5) перестановка молекул, находящихся внутри каждой из ячеек, не влияет на величину Н . Отсюда следует, что подсчитанная по формуле (1.5) величина Р соответствует числу возможных микросостояний системы (в частности газа), при котором макросостояние системы остается неизменным.

1в. М.Планк преобразовал формулу Больцмана (1.5), использовав для этого математическую формулу Стирлинга, справедливую для больших значений N :

ln(N !) = Nln N – N

(1.7)

В результате подстановки (1.7) в (1.5) получается соотношение :

H = Nln N – N –(S N_iln N_i– S N_i)
ⁱ	ⁱ

С учетом условия S Ni = N, выражение для Н приводится к виду:

H = Nln N –S N_iln N_i			(1.8)
ⁱ

Далее Планк ввел в рассмотрение вероятности различных состояний молекул, определив их как :

p_i =	N_i	(1.9)
	N

При этом второе слагаемое в правой части (1.8) можно представить как:

S N_iln N_i =S p_iN ( ln p_i+ ln N ) = N S p_iln p_i + N ln N S_i p_i								(1.10)
ⁱ		ⁱ		ⁱ		ⁱ		(1.10)

С учетом известного из теории вероятностей условия нормировки S p_i = 1, подстановка (1.10) в (1.8) приводит выражение для Н к окончательному виду :

H = –S p_iln p_i			(1.11)
ⁱ

Проделанные Планком с помощью формулы Стирлинга чисто формальные преобразования не только позволили получить новое выражение для исчисления энтропии, но помогли более глубоко осознать смысл вычисляемой величины Н . Выражение (1.11) позволяет сделать два важных вывода :

1. Введение в формулу энтропии значений вероятностей расширило рамки применимости этой формулы далеко за пределы исследуемых термодинамикой молекулярных систем. Символ p_i может обозначать вероятность не только тех или иных состояний молекул, но и различных состояний элементов любых систем (в частности, вероятностей появления букв текста или других символов передаваемых сообщений).

2. Выражение (1.11) соответствует полной энтропии системы. Поделив подсчитанную по формуле (1.11) величину на Ni , можно определить усредненную величину энтропии Н , относящуюся к одному элементу рассматриваемой системы, т.е.

(1.8)
	H = –S p_iln p_i
	ⁱ

Именно в таком виде использовал функцию энтропии Шеннон для определения среднего значения энтропии одной буквы текста (опуская при этом знак усреднения).

1г. Согласно Шеннону, средняя энтропия одной буквы текста вычисляется по формуле (1.2) путем суммирования слагаемых pi log pi , в которых символом pi , обозначены вероятности соответствующих букв. Таким образом :

ⁱ^=я	(1.13)
H = –S p_iln p_i= - (p_а log p_а + p_б log p_б +…+ p_я log p_я)
ⁱ^=а

Для удобства исчисления энтропии сообщений, передаваемых двоичным кодом, Шеннон заменил используемый термодинамикой натуральный логарифм ln двоичным логарифмом log₂.

МЕТОДЫ ИСЧИСЛЕНИЯ КОЛИЧЕСТВА СТРУКТУРНОЙ ИНФОРМАЦИИ И ИНФОРМАЦИОННОЙ ЭНТРОПИИ ТЕКСТОВ

До опубликования созданной К.Шенноном теории Р.Хартли предложил определять количество информации по формуле :

I = log₂ N

(2.1)

где I - количество информации ;

N - число возможных (ожидаемых) сообщений.

Для учета различной степени неожиданности (вероятности) сообщений К.Шеннон предложил использовать заимствованную из статистической физики вероятностную функцию энтропии, приведенную к виду (1.13)

В случае равной вероятности появления любой из N букв алфавита выполняется условие:

P_а = P_б = P_в = … = P_я = 1/N

(2.2)

В результате подстановки (2.2) в (2.1) и с учетом того, что:

- log1/N = + log N

получаем :

H = – (	1	log	1	)=log N	(2.3)
	N		N

Сопоставляя (2.1) и (2.3), приходим к выводу, что количество информации, вычисляемое по формуле Хартли, соответствует устранению неопределенности Н при получении сообщения об одной из букв алфавита, при условии равной вероятности появления любой из букв (условие 2.2).

При равных вероятностях появления всех букв алфавита текст становится наиболее хаотичным. Подсчитанная по формуле (2.3) величина информационной энтропии достигает максимальной величины :

H_max = log N

(2.4)

За единицу количества информации принята величина информации, содержащейся в сообщении об одном из двух равновероятных событий.

До получения сообщения выполняются условия :

P₁ = P₂ =	1	=	1	(2.5)
	N		2

При подстановке (2.5) в (1.13) получаем :

H = (½ log₂½ + ½ log₂ ½) = + log₂ 2 = 1 bit

Наименование «бит» (“bit”) происходит от сокращения английских слов «двоичная единица» (binary unit).

В реальных текстах появлению разных букв соответствуют разные вероятности. Так, например, для русских текстов вероятность появления буквы "О" в 30 раз превышает вероятность появления буквы «Щ» или «Э» (Р_о= 0,09;
Р_щ= Р_э= 0,003).

При подстановке в формулу (1.13) реальных значений вероятностей букв русского текста величина реальной информационной энтропии Н_r уменьшается по сравнению с максимальной энтропией, определяемой выражением (2.4).

Разность между величиной максимальной энтропии Н_max и реальной энтропии Н_r соответствует количеству избыточной (предсказуемой ) информации I_n.

Энтропия. Теория информации (стр. 5 из 8)

S = K H

H = ln

N !

pi =

N

p_i =