Окремі випадки задач оптимального стохастичного керування (стр. 1 из 3)

ОКРЕМІ ВИПАДКИ ЗАДАЧ ОПТИМАЛЬНОГО СТОХАСТИЧНОГО КЕРУВАННЯ

1.Зовнішній інтеграл

Функції

можуть бути довільними, а математичні сподівання можна обчислювати, якщо

як функція від

є вимірною.

Якщо ж оптимальна стратегія, отримана в результаті оптимізації, виявиться невимірною, то і функція

може виявитися невимірною. У цьому випадку математичне сподівання невизначено.

Для розв’язання цієї проблеми застосовують два підходи. Перший полягає в накладенні на функції

таких обмежень, які забезпечували б вимірність підінтегральної функції на кожному кроці оптимізації

: функції

, повинні бути неперервними по своїх аргументах і повинна існувати щільність імовірності розподілу випадкової величини

, а множини

значень припустимих стратегій повинні бути компактними.

На жаль, на практиці ці вимоги не завжди виконуються. Тому другий підхід пов’язаний з використанням зовнішнього інтеграла.

Позначимо через

простір елементарних подій, що є довільною множиною, а

– деяка система підмножин множини

Математичним сподіванням випадкової величини

, заданої на імовірнісному просторі

, називається число

, якщо інтеграл з правої частини існує.

Нехай

– борелівські простори,

-алгеброю в

. Функція

називається

-вимірною, якщо

для будь-якої множини

. Тут

– борелівська

-алгебра простору

Для функції

, (

) зовнішній інтеграл за мірою

визначається як нижня грань інтегралів від всіх вимірних функцій

(

), що мажорують

, тобто

Тут

– функція розподілу випадкової величини

, що відповідає ймовірнісній мірі

Для довільної функції

має місце співвідношення:

де

, і вважають, що

Оскільки зовнішній інтеграл визначений для будь-якої функції, як для вимірної, так і для невимірної, то ніяких додаткових обмежень на функції

накладати не треба.

Для вимірних функцій обидва види математичних сподівань співпадають. Отже, у постановках задач можна замінити звичайне математичне сподівання на зовнішнє, і навіть якщо знайдена при цьому функція

виявиться вимірною, то отримана стратегія керування не перестане бути оптимальною.

Зовнішня міра множини

визначається співвідношенням

Для будь-якої множини

де

– це індикатор множини

, що визначається як

а) якщо

, то

;

б) якщо

, то

;

в) якщо

або

, то

;

г) якщо

задовольняє рівності

, то для будь-якої функції

має місце рівність

;

д) якщо

, то

для будь-якої функції

;

е) якщо

, то

. Якщо при цьому хоча б одна з функцій

або

-вимірна, то останнє співвідношення вірно зі знаком рівності.

Позначимо через

дійсну пряму, а через

– розширену дійсну пряму і надалі у всіх висновках замість дійсної прямої використовуватимемо поняття розширеної дійсної прямої.

Вважатимемо, що для розширеної дійсної прямої мають місце всі співвідношення порядку додавання і множення, які було введено для

, і припустимо, що

Позначимо через

множину всіх дійсних у розширеному розумінні функцій

, де

– простір станів.