Метод розгалужень і меж Евристичні алгоритми Застосування принципу оптимальності (стр. 1 из 3)

Реферат на тему:

Метод розгалужень і меж. Евристичні алгоритми. Застосування принципу оптимальності

1. Метод розгалужень і меж

Обхід усіх вузлів дерева пошуку варіантів може виявитися надто довгим. Наприклад, якщо в дереві всі вузли є допустимими, кожний проміжний вузол має m синів, а глибина дерева n, то всього в дереві 1+m+m²+ … +mⁿ=(mⁿ⁺¹-1)/(m-1) вузлів. Уже за m=10 та n=10 це більш, ніж 10¹⁰. Якщо припустити, що комп'ютер здатний обробити 10⁵ вузлів за секунду, то обхід такого дерева триватиме 10⁵ секунд, або приблизно добу.

Існує багато практичних задач, де вимагається відшукати чи побудувати не всі можливі варіанти, а лише один із них, найкращий у деякому розумінні, визначеному в задачі. Отже, тут з'являється таке поняття, як цінність варіантів. Загальним принципом розв'язання таких задач є скорочення обходу дерева варіантів. У ньому відкидаються деякі гілки, про які можна стверджувати, що вони не містять варіантів більш цінних, ніж уже знайдені. Розглянемо приклад.

Задача про три процесори. Нехай є три процесори, здатні виконувати завдання з однаковою швидкістю. Є набір завдань, про кожне з яких відомий час його виконання. Порядок виконання завдань неважливий. Якщо процесор почав виконувати завдання, то виконує його до кінця протягом зазначеного часу. Переключення процесора на виконання нового завдання відбувається миттєво. Треба так розподілити завдання між процесорами, шоб момент закінчення останнього завдання був мінімальним. Назвемо цю величину вартістюрозподілу. Отже, займемося обчисленням мінімальної вартості серед можливих розподілів. Сам розподіл, що забезпечує таку вартість, для початку нас не цікавитиме.

Приклад. Нехай є 6 завдань, час виконання яких відповідно 7, 8, 9, 10, 11, 12. Якщо в зазначеному порядку розподілити перші три завдання між процесорами, а потім давати їх у тому ж порядку процесорам, що звільняються, то перший процесор закінчить роботу в момент 7+10=17, другий – у момент 8+11=19, а третій – 9+12=21. Маємо вартість 21. Проте їх можна розподілити інакше – 7+12, 8+11, 9+10, одержавши вартість 19.-

Перше, що ми зробимо в розв'язанні задачі – упорядкуємо завдання за незростанням часу їх виконання. Отже, нехай P₁, … , P_n – завдання, часи виконання T₁, … , T_n яких задовольняють нерівності T₁³ … ³T_n. Розподіл можна подати послідовністю пар вигляду (i; k), де i – номер завдання, k – номер процесора, на якому воно виконується. Наприклад, за часів 12, 11, 10, 9, 8, 7 найкращий розподіл подається як

<(1; 1), (2; 2), (3; 3), (4; 3), (5; 2), (6; 1)>.

Подібно до розміщень ферзів, можна говорити про повний розподіл – довжини n, та неповний – меншої довжини. Так само утворимо дерево пошуку розподілів. Його коренем є порожній розподіл, синами кореня – три розподіли <(1; 1)>, <(1; 2)>, <(1; 3)> тощо, тобто синами кожного розподілу вигляду

v=<(1; k₁), … , (i; k_i)>

за i<n є три розподіли

v₁=<(1; k₁), … , (i; k_i), (i+1; 1)>,

v₂=<(1; k₁), … , (i; k_i), (i+1; 2)>,

v₃=<(1; k₁), … , (i; k_i), (i+1; 3)>.

Повні розподіли є листками вигляду <(1; k₁), … , (n; k_n)>.

Тепер займемося упорядкуванням обходу дерева таким чином, щоб варіанти з меншою вартістю оброблялися якомога раніше, а варіанти з більшою вартістю – якомога пізніше. За розподілом v=<(1; k₁), … , (i; k_i)>, де i£ n, неважко обчислити трійку часів роботи процесорів (S₁, S₂, S₃) з його виконання. Очевидно, його вартістю є найбільше з S₁, S₂, S₃. Такий розподіл за i<n та час T_i₊₁ дають три варіанти трійок, відповідних його розподілам-синам v₁, v₂, v₃:

(S₁+T_i₊₁, S₂, S₃), (S₁, S₂+T_i₊₁, S₃), (S₁, S₂, S₃+T_i₊₁).

За i+1=n неважко вибрати найменшу з цих трьох вартостей. Проте за i+1<n нас будуть цікавити не стільки вартості цих неповних розподілів, скільки нижні оцінки вартості тих повних розподілів, які з них можна одержати. Цією оцінкою є вартість, менше якої не може бути вартість повних розподілів.

Розглянемо найпростіший спосіб такого оцінювання. Очевидно, що за неповного розподілу v перших i завдань із трійкою часів (S₁, S₂, S₃) всі розподіли, що є його нащадками, мають вартість не меншу, ніж

E(v)=max{S₁, S₂, S₃, min{S₁, S₂, S₃}+T_i₊₁}.

Отже, оцінка E(v) є нижньою межею для вартості нащадків розподілу v.

Організуємо обхід дерева розподілів таким чином, що:

1. для кожного з вузлів обчислюється зазначена оцінка вартості,

2. вузли розглядаються у порядку зростання їх оцінок,

3. вузли з оцінкою, більшою від вартості вже одержаного повного розподілу, взагалі не розглядаються.

Ці міркування складають суть методу розгалужень і меж. Упорядкування вузлів робить обхід цілеспрямованим, а відкидання явно неперспективних піддерев скорочує його.

Уточнимо організацію даних для обробки вузлів у зазначеному порядку. Оскільки нас цікавлять не самі розподіли, а лише їх вартість, у вузлах дерева будемо зберігати тільки трійку часів та номер завдання, розподіленого останнім. Маючи список часів T[1], … , T[n] обробки завдань, неважко за цими даними обчислити оцінку вартості для неповних розподілів та саму вартість для повних. Для наочності цю величину також зберігатимемо у вузлі. Отже, вузол дерева подається трійкою часів S[1], S[2], S[3], номером завдання i та оцінкою вартості E, яка за i<n обчислюється як

max{ S[1], S[2], S[3], min{ S[1], S[2], S[3]}+T[i+1]}.

Очевидно, що за i=n-1 ця величина є вартістю повного розподілу, який подається "кращим із синів" цього вузла дерева.

Проміжні вузли записуються не в магазин, а в чергу, елементи якої упорядковано за зростанням оцінок вартості. Таким чином, для подання черги зручно скористатися лінійним списком (п.16.3.3). Вузли, відповідні повним розподілам, в чергу не записуються, оскільки оцінка вартості є власне їх вартістю.

Очевидно, що спочатку з трьох розподілів <(1;1)>, <(1;2)>, <(1;3)> в чергу достатньо записати лише один, для визначеності <(1; 1)>. Очевидно також, що коли обробляється вузол із однаковими часами S[1], S[2], S[3], то з трьох його синів до черги достатньо додати лише одного. Якщо ж два з трьох часів у вузлі рівні, то до черги не додається один із двох синів, що відрізняються лише порядком часів.

Опишемо обробку вузлів дерева таким алгоритмом.

Занести до черги розподіл (T[1], 0, 0; 1; T[1]);

Cmin:=¥;

while (черга не порожня) and (її перший елемент має оцінку E<Cmin)

begin

Вилучити з черги її перший елемент Node=(S[1], S[2], S[3]; i; E);

if i=n-1 then{синами вузла є листки}

Обчислити вартість синів вузла Node та за необхідності

запам'ятати нову поточну мінімальну вартість Cmin

else

Обчислити оцінку вартості синів вузла Node та

додати до черги лише тих із них, чия оцінка не більше Cmin

end

Уточнення цього алгоритму залишаємо вправою.

Розглянемо приклад обчислення мінімальної вартості розподілу за наведеним алгоритмом. Нехай задано час виконання п'яти завдань 9, 8, 7, 5, 4. Очевидно, що найкращий розподіл (9, 8+4, 7+5) має вартість 12. Значення Cmin та зміст черги, що виникають за наведеним алгоритмом, подамо таблицею:

Cmin	Черга
¥	<9,0,0; 1; 9>
¥	<9,8,0; 2; 9> <17,0,0; 2; 17>
¥	<9,8,7; 3; 12> <9,15,0; 3; 15> <16,8,0; 3; 16> <17,0,0; 2; 17>
¥	<9,8,12; 4; 12> <9,13,7; 4; 13> <9,8,11; 4; 13> <9,15,0; 3; 15><16,8,0; 3; 16> <17,0,0; 2; 17>
12	<9,13,7; 4; 13> <9,8,11; 4; 13> <9,15,0; 3; 15> <16,8,0; 3; 16><17,0,0; 2; 17>

Як бачимо, перший елемент черги має оцінку вартості, гіршу за Cmin, тому подальше дослідження дерева варіантів не відбувається. За виконання алгоритму до черги додається 9 проміжних вузлів, а вилучається 4. Між тим, неважко підрахувати, що з урахуванням симетричних варіантів дерево містить 19 проміжних вузлів. Фактично, ми одержали потрібний розподіл взагалі без перебирання варіантів.

У загальному випадку метод розгалужень і меж не позбавляє перебирання. У цьому неважко переконатися, імітувавши наведений алгоритм на прикладі часів виконання завдань (12, 8, 7, 5, 4, 2).

Задача про розподіл завдань представляє чималу групу задач, які розв'язуються методом розгалужень і меж. Подивимося на цю задачу більш узагальнено. Розподіл (повний чи частковий) v(i)=<(1; k₁), … , (i; k_i)> подамо як послідовність <a₁, a₂, … , a_i>, де a_j позначає пару (j; k_j). Очевидно, що v(i) одержується з v(i-1) додаванням компонента a_i. Вартість розподілу при цьому не зменшується, тобто

C(v(i-1))£C(v(i)). (19.1)

Існує чимало задач, в яких розв'язок-послідовність <a₁, a₂, … , a_n> будується шляхом "нарощування" часткових розв'язків <a₁, a₂, … , a_i_-1> новими компонентами a_i. Умова (19.1) дозволяє відкидати ті часткові розв'язки та всіх їх нащадків, якщо їх вартість не може бути меншою вартості Cmin уже побудованого повного розв'язку. Таким чином, Cmin виступає верхньою межею для вартості розв'язків, які є сенс будувати. Але, як правило, обчислити вартість повного розв'язку можна лише після його побудови. Для запобігання побудови всіх повних розв'язків треба мати можливість оцінюватизнизу їх вартість за вартістю побудованих часткових. Чим точнішою буде така оцінка, тим ефективнішим буде скорочення перебору.