Генетический алгоритм (стр. 2 из 2)

Скрещивание представляет собой процесс случайного обмена значениями соответствующих элементов для произвольно сформированных пар строк. Для этого выбранные на этапе воспроизводства строки случайным образом группируются в пары. Далее каждая пара с заданной вероятностью p_скр подвергается скрещиванию. При скрещивании происходит случайный выбор позиции разделителя d (d=1, 2, ..., l-1, где l - длина строки). Затем значения первых d элементов первой строки записываются в соответствующие элементы второй, а значения первых d элементов второй строки - в соответствующие элементы первой. В результате получаем две новых строки, каждая из которых является комбинацией частей двух родительских строк.

Операция скрещивания создаёт новые строки путём некоторой комбинации значений элементов наиболее ценных в популяции G(t) строк. Получившиеся в результате строки могут превосходить по ценности родительские строки.

Рассмотрим некоторую схему H, для которой определим порядок o(H) - число фиксированных позиций схемы и определяющую длину d (H) - расстояние (число позиций) между первой и последней фиксированными позициями. Допустим, что до операции скрещивания строка S была представителем схемы H, т.е.

. Допустим, что строка S¹ получена из строки S в результате скрещивания. Строка S¹ будет представителем схемы H в том случае, если позиция разделителя при скрещивании не располагалась между фиксированными позициями схемы. Вероятность того, что позиция разделителя окажется между фиксированными позициями схемы, равна:

Учтём, что скрещивание происходит с вероятностью p_c, а также то, что даже если позиция разделителя окажется между фиксированными позициями схемы, строка S¹ может являться представителем схемы H, если данная строка была получена скрещиванием двух представителей схемы H. Тогда вероятность p_s,1 того, что строка S¹ является представителем схемы H, определяется выражением:

Полагая независимость операций воспроизводства и скрещивания, оценим совокупный эффект от этих операций, т.е. число представителей схемы H в популяции G(t+1):

Так как открытие новых областей поиска в операции скрещивания происходит лишь путём перегруппирования имеющихся в популяции комбинаций символов, то при использовании только этой операции некоторые потенциально оптимальные области могут оставаться не рассмотренными. Для предотвращения подобных ситуаций применяется операция мутации.

Мутация представляет собой процесс случайного изменения значений элементов строки. Для этого строки, получившиеся на этапе скрещивания, просматриваются поэлементно, и каждый элемент с заданной вероятностью мутации p_мут может мутировать, т.е. изменить значение на любой случайно выбранный символ, допустимый для данной позиции. Операция мутации позволяет находить новые комбинации признаков, увеличивающих ценность строк популяции.

Допустим, что до мутации строка S¹ была представителем схемы H, т.е.

. Допустим, что строка S² получена из строки S¹ в результате мутации. Строка S² будет представителем схемы H в том случае, если ни один из элементов строки, соответствующий фиксированным позициям схемы, не был изменён.

Учитывая, что мутация происходит с вероятностью p_мут, вероятность p_s2 того, что строка S² является представителем схемы H, определяется выражением:

, где o(H) - число фиксированных позиций схемы H.

Полагая независимость операций воспроизводства, скрещивания и мутации оценим совокупный эффект от этих операций, т.е. число представителей схемы H в популяции G(t+1):

. (3)

Так как, при малых значениях p_m приближенно можно считать

, то выражение (3) можно записать в виде:

или

Таким образом, схемы, у которых малы определяющая длина и порядок, и для которых соответствующая подпопуляция имеет среднюю ценность, превышающую среднюю ценность популяции, экспоненциально увеличивают число представителей в последующих поколениях.

Очевидно, что эффективность описанной операции скрещивания значительно зависит от способа кодировки строк. Это свойство оказывается полезным для задач оптимизации функций, заданных на числовых множествах. Однако, если функция задана на произвольном множестве, например, на множестве комбинаций значений признаков объекта, где все признаки одинаковы по предпочтительности, то описанный выше способ скрещивания оказывается не вполне корректным, так как вероятность сохранения значений для групп признаков зависит от расстояния между элементами группы в кодовой строке, а это нарушает принцип равной предпочтительности признаков. Поэтому для таких задач операцию скрещивания предполагается производить путём обмена не частями строк, а отдельными элементами. При этом задаётся некоторое число позиций n_П (n_ПО {1, 2, …, l}), которое определяет количество элементов строк, для которых производится обмен значениями. Число позиций n_П может быть задано непосредственно или определяться случайно для каждой пары строк. Далее для каждой пары строк (S¹, S²)_i, где i - номер пары, случайно выбираются n_П номеров n_i,j (n_{i,j О} {1, 2, …, l}; jО {1, 2, …, n_П}). Затем для строк пары (S¹, S²)_i производится обмен значениями элементов с номерами n_i,j, т.е. каждому элементу с номером n_i,j строки S¹ присваивается значение элемента с номером n_i,j строки S² , а элементу с номером n_i,j строки S² присваивается значение элемента с номером n_i,j строки S¹.

Допустим, что до операции скрещивания строка S была представителем схемы H, т.е.

, а строка S¹ получена из строки S в результате поэлементного скрещивания. Вероятность p^’_s,1 того, что строка S¹ будет представителем схемы H, равна:

где o(H) - число фиксированных позиций схемы H.

Совокупный эффект от операций воспроизводства и поэлементного скрещивания, и мутации, т.е. число представителей схемы H в популяции G(t+1) определяется выражением:

Таким образом, при поэлементном скрещивании скорость увеличения представителей схемы в последующих поколениях зависит от средней ценности схемы и количества фиксированных позиций и не зависит от расстояния между ними, а значит, не зависит от порядка расположения элементов в строке.

Итак, в результате описанных выше операций получаем K*N N новых строк, которые либо полностью формируют новую популяцию G(t+1) (при K=1), заменяя при этом все строки популяции G(t), либо составляют часть популяции G(t+1), заменяя собой K*N N наименее ценных строк предыдущей популяции.

Как видно из описания алгоритма, закон

вероятности распределения значений целевой функции определяется и корректируется путём использования набора (популяции) строк, содержащих наилучшие в смысле значений целевой функции комбинации элементов.