knok1613 фев 2012 в 18:53

Генетические алгоритмы. От теории к практике

6 мин

65K

Алгоритмы *

Из песочницы

+32

Комментарии 36

skive 13 фев 2012 в 18:56

Подсветку кода сделайте пожалуйста, читать трудно. :)

knok16 13 фев 2012 в 19:22

Готово.

Swordsman 13 фев 2012 в 19:53

И поправьте в статье к какому языку вы привязываетесь, видно что к Си, но… всякое бывает…

skive 13 фев 2012 в 19:54

Я тоже сначала подумал что Си, а потом в тегах увидел java… :))

НЛО прилетело и опубликовало эту надпись здесь

LeoCcoder 13 фев 2012 в 20:20

Зачем изобретать велосипед? есть же библиотеки для этого…

вот это место непойдет:

while (l!=r){

 c = (l+r) >> 1; 

 if (wheel[c]<index){

 l=c;

 }else{

 r=c;

 }

}

задача бинарным поиском найти максимальный индекс элемента в массиве wheel, значение которого меньше переменной index

а вы находите непонятно что, вы смотрите только элементы в середине отрезков, и если значение элемента в середине предыдущего отрезка меньше, а в середине следующего отрезка больше index, вы считаете, что середина предыдущего отрезка это наш искомый элемент и берете его индекс… но это неправильно, это не рулетка.

а еще эта штука иногда зацикливается, например если:
wheel = [1; 1000];
r = 1; l =0; index = 900; c =0;
то из вашего while мы никогда не выйдем

knok16 13 фев 2012 в 20:40

спасибо. Код должен быть таким:

while (l < r){
	c = (l+r) >> 1;
	if (index <= while[c]){
		r = c;
	}else{
		l = c + 1;
	}
}

GreatKoshak 14 фев 2012 в 00:19

«ложим их в массив.»
Неужели теперь так можно говорить/писать?

disinvis 14 фев 2012 в 06:05

Нельзя, но зачем «палить» автора в комментариях? Для этого вполне подойдут личные сообщения. Автор бы быстро всё исправил и никто бы больше не заметил эту ошибку.

GreatKoshak 14 фев 2012 в 16:00

Простите, я новичок здесь. В следующий раз именно так и сделаю.

guyfawkes 14 фев 2012 в 06:36

Можете пояснить, какую роль в вашем коде играют переменные, которые вы называете innerOffset и outerOffset и во всех местах используете одинаковым способом? Почему они являются результатами операций от деления на длину лонга в битах и взятия остатка, но используются для сдвига маски и указания индекса в массиве лонгов, из которых состоит геном?

knok16 14 фев 2012 в 13:28

Биты в гене храняться в таком виде (в данном случае для простоты считаю, что кол-во бит, отведенных под long, равно 8):

Если нам нужно получить доступ к 15 биту, то outerOffset будет указывать в каком long'е хранится бит, а innerOffset в какой позиции в long'e стоит этот бит.

int index =  15;
outerOffset = index / LENGTH_OF_LONG; //  == 15/8 == 1
innerOffset = index % LENGTH_OF_LONG - 1; // == 15 % 8 - 1 == 7 - 1 == 6 (!)нумерация начинается с 0

А бинарные сдвиги и && заменяют целочисленное деление и взятие остатка от деления, так как выполняются быстрее.

guyfawkes 14 фев 2012 в 13:35

Понял, просто не вник сначала, что это подсчет номера бита. Про битовые операции я в курсе. Спасибо!

asmyasnikov 26 июн 2015 в 16:19

Из статьи неясно как Вы кодируете/декодируете последовательность обхода городов коммивояжером. Как нолики и единицы хромосомы становятся номерами городов?

difiso 14 фев 2012 в 06:41

Насколько я знаю, в генетических алгоритмах мутация необходима, иначе в общем случае алгоритм, хоть и сходится, но не факт, что к решению. Поэтому думаю, что нет необходимости в

private boolean useMutation; //Использовать мутацю

Поправьте меня, если не прав.

knok16 14 фев 2012 в 12:42

Да, без использования мутации невозможно 100% получить все возможные комбинации. Но «private boolean useMutation;» — не сильно влияет на производительность, и если вдруг нам захочется НЕ использовать мутацию, то это будет легко сделать, установив нужный флаг в false.

hom 14 фев 2012 в 07:05

Насколько я помню в DE алгоритмах у нас 3 вероятности:
probability pi_1: z1[i] < — N(0, sigm1) else z1[i] < — 0
probability pi_2: z2[i] < — N(0, sigm2) else z2[i] < — 0
probability pi: NEW_POPULATION(p, i) = POPULATION(c1, i) + (F + z1) * (POPULATION(c2, i) — POPULATION(c3, i) + z2) else NEW_POPULATION(p, i) = POPULATION(c1, i)

тоесть с вероятностями pi_1, pi_2 генерируются вектора характеризающие мутацию, и с вероятностью pi мутация переносится в следующее поколение, собственно вопрос:

Подскажите, где у вас pi_1, pi_2 или я описываю нечто другое?

knok16 14 фев 2012 в 13:36

Я использую вариант проще: есть вероятность мутации, если random.nextDouble() > процентМутации, то один бит инвертируется.
Не могли бы вы подробно описать свой вариант? Или кинуть линку на описание?

hom 14 фев 2012 в 13:56

Использовал алгоритм дифференциальной эволюции, только в качестве критерия остановки эволюции было задано число повторений. Идея в том что у нас есть некоторый вектор изменяя который нужно добиться оптимизации некоторой функции.
В процессе эволюции мы к имеющемуся вектору прибавляем еще 2 случайных вектора с некоторым потоянным смещением F

knok16 16 фев 2012 в 18:17

Из вики:

Дифференциа́льная эволю́ция — метод многомерной математической оптимизации, относящийся к классу стохастических алгоритмов оптимизации и использующий некоторые идеи генетических алгоритмов.

Я так понял диффернциальныя эволюция это немного другой алгоритм, хотя и очень похожий на ГА.

emp 14 фев 2012 в 08:23

Я просто оставлю это здесь:
Ген репарации комплементарных повреждений ДНК в результате рентгеновского излучения у китайских хомячков
www.genepassport.ru/base?GenID=114

retran 14 фев 2012 в 10:32

1. Количество орфографических и грамматических ошибок зашкаливает. «Ложим в массив», блин. Курите учебники русского языка.
2. Хромосома — это абсолютно не обязательно вектор из нулей и единиц.
3. Из п. 2 — операции селекции, скрещивания и мутации сильно зависят от конкретной задачи и стандартизированы быть не могут.
4. Перечисления и свитчи по ним для изменения поведения класса — «эта пять». Курите «Рефакторинг» Фаулера и SOLID.
5. index1, index2, fr1, fr2 — вообще без комментариев. Использовать именования типа target, source и так далее не судьба?
6. Терминология — откуда вы ее взяли?

Резюме — для студенческой/школьной лабораторки нормально, на пост для хабра не тянет.

HomoLuden 14 фев 2012 в 18:00

> Поэтому я решил, что было бы неплохо написать класс-каркас для любого ГА.
Начал читать и тоже сразу захотелось спросить: Если захотелось создать каркас для любого ГА, так почему рассматривается только бинарное кодирование генов. С вещественным кодом идут лесом все эти наработки.

knok16 16 фев 2012 в 18:26

Потому что бинарными генами можно представить любые данные. Генетическому алгоритму все равно, что значат эти 0 и 1. Это важно только для фитнесс функции.

Например: первые три бита — число, следущие (14*8) бит представляют собой строку из 14 символов, и в конце еще 2 бита, которые трактуются как 2 boolean'а.

В моей реализации фитнесс функции. Каждые 8 бит составляют число, таким образом в одном лонге хранится 8 чисел.

HomoLuden 17 фев 2012 в 07:57

И вот тут засада. В бинарном кодировании рекомендуют использовать такое кодирование, при котором изменение одного бита не приведет к радикальному изменению свойства гена (в терминах ГА — метрика хромосомы изменится незначительно). Поэтому рекомендуют при бинарном кодировании использовать код Грея, т.к. он более стабилен в этом отношении. И поэтому же кодирование битами вещественных параметров (float/double) вообще неприемлемо — эффект от мутаций да и от кроссовера будет слишком непредсказуемым/нестабильным. Представьте себе изменение показателя степени в два раза.

В ГА важна стабильность паттернов — близкие паттерны должны давать схожее поведение особи. А при двоичном кодировании флотов получится очень нестабильная эволюция.

knok16 17 фев 2012 в 08:59

кодирование битами вещественных параметров (float/double) вообще неприемлемо — эффект от мутаций да и от кроссовера будет слишком непредсказуемым/нестабильным.

очень ценное замечание. спасибо.

Хотя в принципе и любой float можно закодировать, использую код Грея. Или это будет очень ресурсоемко?

HomoLuden 17 фев 2012 в 09:30

В литературе написано, что кодек Бин <-> Грей действительно снижает производительность. Но как я понял, это в отношении к просто бинарному кодированию. Тут главный недостаток Грея и в то же время может и достоинство — квантование значений. Т.е. кодом Грея мы по сути снижаем количество значений, снижаем разрядность вещественного числа. Если я ничего не путаю.
С другой стороны при кодировании вещественными векторами разрядность ограничивается лишь выбранным представлением вещественного типа. Тут имеем у флотов/даблов плавающее квантование (из-за представления числа в виде целой части + дробной + мантиссы), либо меньший диапазон допустимых значений при использовании предстваления с фиксированной точкой. Таким образом пространсво поиска разрастается неимоверно. К тому же кросовер и мутация становятся арифметическими. Так что вещественное кодирование легче привязывается к задачам цифровой обработки сигналов, но более ресурсоемкая при прочих ваных условиях.
Однако бывает (как в моем случае), что вещественное кодирование позволяет резко сократить количество параметров (длину хромосом), что может дать ощутимый профит.

Мое словоблудство расценивайте как очередной довод о том, что универсальный фреймворк для ГА — слишком сложно и нецелесообразно. ИМХО.

asmyasnikov 26 июн 2015 в 16:08

Кодирование числа с плавающей точкой давно уже описано в литературе. Если коротко, то выбирается допустимый диапазон значений float, разбивается на N интервалов таким образом, чтобы два соседних интервала давали приблизительно одинаковое значение фитнес-функции. Тогда число с плавающей точкой однозначно отображается в номер интервала. И наоборот, по номеру интервала можно вернуться к значению с плавающей точкой. Теоретически N можно сделать бесконечно большим, чтобы дискретность числа с плавающей точкой была незаметна, но тогда увеличивается длина хромосомы, что увеличивает алгоритмическую сложность задачи. Поэтому N выбирается с умом.
Теперь о практике. Я реализовывал генетический алгоритм применительно к дискретной задаче о рюкзаке. Но я его вдоль и поперек исследовал и для непрерывных функций. Результаты превзошли все мои ожидания. Для сложных целевых функций генетический алгоритм всегда выдавал абсолютный экстремум. Если попытаться решать ту же задачу градиентным спуском, то хотя и не будет потерь на кодировании/декодировании хромосомы, но гарантии нахождения абсолютного экстремума нет.

retran 14 фев 2012 в 10:40

> Можно сделать останов ГА не по кол-ву поколений, а по достижении какого-то значения
> ФитнессФункции, или когда разница средних значений ФитнессФункции поколений стала невелика.

Критериев останова разных тоже много и они тоже сильно зависят от конкретных задач.

knok16 16 фев 2012 в 18:27

Привели бы парочку примеров, думаю никто б не отказался.

retran 17 фев 2012 в 10:44

1. Кол-во поколений.
2. Истечение какого-либо реального времени.
3. Квадрат разности фитнесс-функций лучших особей двух последних поколений меньше заданного значения.
4. Все особи в поколении отличаются друг от друга в рамках заданной погрешности.
5. Фитнесс-функция достигла некоего заданного значения (не всегда нужно оптимальное решение, иногда хватает «достаточного»).
и т. д.

Iskin 14 фев 2012 в 11:34

А где практика, если это решение стандартной абстрактной задачи ;).

hom 14 фев 2012 в 14:47

Копипаста вам из вики:

Генетические алгоритмы применяются для решения следующих задач:
Оптимизация функций
Оптимизация запросов в базах данных
Составление расписаний
Игровые стратегии
…

Алгоритм крайне просто применить к этим практическим задачам, надо только задать параметры алгоритма и интерпретировать результат.

Heliki 15 фев 2012 в 15:01

Вот как раз ради этого я и полез читать данную статью. Мне кажется, то, что описано тут — можно найти в других статьях/учебниках и закодить с минимальными усилиями. А вот собственно то, как генетический алгоритм помогает решить именно задачу коммивояжера (или любую другую задачу), как геном влияет на алгоритм решения — непонятно.
Ясно, что какого-то общего влгоритма не существует, и для каждой задачи параметры будут обозначать что-то свое, но мне кажется, что как раз такая привязка ГА к конкретной задаче и есть самое интересное и полезное.

hom 16 фев 2012 в 18:21

С вами согласен, тоже хотел бы прочесть про решение конкретной задачи с помощью этого метода на хабре

HomoLuden 17 фев 2012 в 08:01

Вот пример моего использования ГА. Но там ГА с вещественным кодированием — сильно отличается от того что здесь изложено.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий