Непрерывные генетические алгоритмы (стр. 3 из 5)

Другой важный момент – определение критериев останова. Обычно в качестве них применяются или ограничение на максимальное число эпох функционирования алгоритма, или определение его сходимости, обычно путем сравнивания приспособленности популяции на нескольких эпохах и остановки при стабилизации этого параметра.

3. Непрерывные генетические алгоритмы.

Фиксированная длина хромосомы и кодирование строк двоичным алфавитом преобладали в теории генетических алгоритмов с момента начала ее развития, когда были получены теоретические результаты о целесообразности использования именно двоичного алфавита. К тому же, реализация такого генетического алгоритма на ЭВМ была сравнительно легкой. Все же, небольшая группа исследователей шла по пути применения в генетических алгоритмах отличных от двоичных алфавитов для решения частных прикладных задач. Одной из таких задач является нахождение решений, представленных в форме вещественных чисел, что называется не иначе как «поисковая оптимизация в непрерывных пространствах». Возникла следующая идея: решение в хромосоме представлять напрямую в виде набора вещественных чисел. Естественно, что потребовались специальные реализации биологических операторов. Такой тип генетического алгоритма получил название непрерывного генетического алгоритма (RGA, или real-coded genetic algorithm), или генетического алгоритма с вещественным кодированием.

Первоначально непрерывные гены стали использоваться в специфических приложениях (например, хемометрика, оптимальный подбор параметров операторов стандартных генетических алгоритмов и др.). Позднее они начинают применяться для решения других задач оптимизации в непрерывных пространствах (работы исследователей Wright, Davis, Michalewicz, Eshelman, Herrera в 1991-1995 гг). Поскольку до 1991 теоретических обоснований работы непрерывных генетических алгоритмов не существовало, использование этого нового подвида было спорным; ученые, знакомые с фундаментальной теорией эволюционных вычислений, в которой было доказано превосходство двоичного алфавита перед другими, критически воспринимали успехи алгоритмов с вещественным кодированием. После того, как спустя некоторое время теоретическое обоснование появилось, непрерывные генетические алгоритмы полностью вытеснили двоичные хромосомы при поиске в непрерывных пространствах.

Преимущества и недостатки двоичного кодирования

Прежде чем излагать особенности математического аппарата непрерывных генетических алгоритмов, остановимся на анализе достоинств и недостатков двоичной схем кодирования.

Как известно, высокая эффективность отыскания глобального минимума или максимума генетическим алгоритмом с двоичным кодированием теоретически обоснована в фундаментальной теореме генетических алгоритмов («теореме о шаблоне»), доказанной Холландом. Ее суть в том, что двоичный алфавит позволяет обрабатывать максимальное количество информации по сравнению с другими схемами кодирования.

Однако двоичное представление хромосом влечет за собой определенные трудности при поиске в непрерывных пространствах большой размерности, и когда требуется высокая точность найденного решения. В генетических алгоритмах с двоичным кодированием для преобразования генотипа в фенотип используется специальный прием, основанный на том, что весь интервал допустимых значений признака объекта

разбивается на участки с требуемой точностью. Заданная точность p определяется выражением

где N – количество разрядов для кодирования битовой строки.

Эта формула показывает, что p сильно зависит от N, т.е. точность представления определяется количеством разрядов, используемых для кодирования одной хромосомы. Поэтому при увеличении N пространство поиска расширяется и становится огромным.

Известный книжный пример: пусть для 100 переменных, изменяющихся в интервале

, требуется найти экстремум с точностью до шестого знака после запятой. В этом случае при использовании генетических алгоритмов с двоичным кодированием длина строки составит 3000 элементов, а пространство поиска – около

хромосом.

Эффективность генетических алгоритмов с двоичным кодированием в этом случае будет невысокой. На первых итерациях алгоритм потратит много усилий на оценку младших разрядов числа, закодированных во фрагменте двоичной хромосомы. Но оптимальное значение на первых итерациях будет зависеть от старших разрядов числа. Следовательно, пока в процессе эволюции алгоритм не выйдет на значение старшего разряда в окрестности оптимума, операции с младшими разрядами окажутся бесполезными. С другой стороны, когда это произойдет, станут не нужны операции со старшими разрядами – необходимо улучшать точность решения поиском в младших разрядах. Такое «идеальное» поведение не обеспечивает семейство генетических алгоритмов с двоичным кодированием, т.к. эти алгоритмы оперируют битовой строкой целиком, и на первых же эпохах младшие разряды чисел "застывают", принимая случайное значение. В классических генетических алгоритмах разработаны специальные приемы по выходу из этой ситуации. Например, последовательный запуск ансамбля генетических алгоритмов с постепенным сужением пространства поиска.

Есть и другая проблема: при увеличении длины битовой строки необходимо увеличивать и численность популяции.

Математический аппарат непрерывных генетических алгоритмов

Как уже отмечалось, при работе с оптимизационными задачами в непрерывных пространствах вполне естественно представлять гены напрямую вещественными числами. В этом случае хромосома есть вектор вещественных чисел. Их точность будет определяться исключительно разрядной сеткой той ЭВМ, на которой реализуется real-coded алгоритм. Длина хромосомы будет совпадать с длиной вектора-решения оптимизационной задачи, иначе говоря, каждый ген будет отвечать за одну переменную. Генотип объекта становится идентичным его фенотипу.

Вышесказанное определяет список основных преимуществ алгоритмов с непрерывными генами:

Использование непрерывных генов делает возможным поиск в больших пространствах (даже в неизвестных), что трудно делать в случае двоичных генов, когда увеличение пространства поиска сокращает точность решения при неизменной длине хромосомы.

Одной из важных черт непрерывных генетических алгоритмов является их способность к локальной настройке решений.

Использование непрерывных генетических алгоритмов для представления решений удобно, поскольку близко к постановке большинства прикладных задач. Кроме того, отсутствие операций кодирования/декодирования, которые необходимы в генетических алгоритмах с двоичным кодированием, повышает скорость работы алгоритма.

Как известно, появление новых особей в популяции канонического генетического алгоритма обеспечивают несколько биологических операторов: отбор, скрещивание и мутация. В качестве операторов отбора особей в родительскую пару здесь подходят любые известные из двоичных генетических алгоритмов: рулетка, турнирный, случайный. Однако операторы скрещивания и мутации не годятся: в классических реализациях они работают с битовыми строками. Нужны собственные реализации, учитывающие специфику real-coded алгоритмов.

Оператор скрещивания непрерывного генетического алгоритма, или кроссовер, порождает одного или нескольких потомков от двух хромосом. Собственно говоря, требуется из двух векторов вещественных чисел получить новые векторы по каким-либо законам. Большинство real-coded алгоритмов генерируют новые векторы в окрестности родительских пар. Для начала рассмотрим простые и популярные кроссоверы.

Пусть

– две хромосомы, выбранные оператором селекции для скрещивания. После формулы для некоторых кроссоверов приводится рисунок – геометрическая интерпретация его работы. Предполагается, что

Плоский кроссовер (flat crossover): создается потомок

– случайное число из интервала

Простейший кроссовер (simple crossover): случайным образом выбирается число k из интервала

и генерируются два потомка