Інформаційний синтез системи автоматичного розпізнавання бланків документів (стр. 4 из 11)

МФСВ окрім системних та специфічних принципів ґрунтується також на 2-х дистанційних принципах:

- максимально-дистанційному, який вимагає максимальної міжцентрової відстані між класами;

- мінімально-дистанційному, вимагає мінімальної середньої відстані реалізацій від центру свого класу:

Класом розпізнавання (образом)

називається відбиття властивостей m-го функціонального стану системи розпізнавання і відношень між елементами системи. Клас розпізнавання - топологічна категорія, яка задається в просторі ознак розпізнавання областю

ÌW_Б.

Детерміновано-статистичний підхід [21, 22] до моделювання систем вимагає завдання систем нормованих (експлуатаційних) і контрольних допусків на ОР. Нехай

- базовий клас, який характеризує максимальну функціональну ефективність, тобто є найбільш бажаним для розробника інформаційного забезпечення системи. Нормованим називається поле допусків

, в якому значення і–ї ОР знаходиться з імовірністю

або

, за умови, що функціональний стан відноситься до класу

. Контрольним називається поле допусків

, в якому значення і-ї ОР знаходиться з імовірністю

за умови, що функціональний стан відноситься до класу

В ІЕІТ система контрольних допусків вводиться з метою рандомізації процесу прийняття рішень, оскільки для повного дослідження об’єкту контролю та управління необхідно використовувати як детерміновані, так і статистичні характеристики. Зрозуміло, що

і базова (відносно класу

) СКД є сталою для всієї абетки класів розпізнавання.

Реалізацією образу

називається випадковий структурований бінарний вектор

, де

- і-та координата вектора, яка приймає одиничне значення, якщо значення і-ї ОР знаходиться в полі допусків

, і нульове значення, якщо не знаходиться;

- мінімальна кількість випробувань, яка забезпечує репрезентативність реалізацій образу.

При обґрунтуванні гіпотези компактності (чіткої, або нечіткої) реалізацій образу за геометричний центр класу

приймається вершина бінарного еталонного вектору х_m.

Еталонний вектор x_m- це математичне сподівання реалізацій класу

Він подається у вигляді детермінованого структурованого бінарного вектора

, де х_m,і- і-та координата вектора, яка приймає одиничне значення, якщо значення і-ї ОР знаходиться в нормованому полі допусків

, і нульове значення, якщо не знаходиться.

Основною задачею етапу навчання за МФСВ є розбиття простору ознак розпызнавання за поданою навчальною матрицею на області класів розпізнавання деяким оптимальним в інформаційному сенсі способом, який забезпечує на етапі екзамену прийняття рішень з достовірністю, наближеною до максимальної асимптотичної достовірності.

Параметром функціонування називається характеристика інформаційного забезпечення, яка прямо або непрямо впливає на функціональну ефективність системи. Такими параметрами можуть бути параметри навчання, перетворення образу, впливу середовища та інші, які безпосередньо впливають на асимптотичну достовірність.

Як критерій оптимізації процесу навчання системи прийняттю рішень в рамках МФСВ застосовується статистичний інформаційний КФЕ, який є природною мірою різноманітності (або схожості) класів розпізнавання і одночасно функціоналом асимптотичних точнісних характеристик СР. При цьому важливо, щоб параметри навчання були оптимальними в інформаційному розумінні, тобто забезпечували максимальну функціональну ефективність СР, яка визначається достовірністю прийняття рішень на екзамені.

Достовірність класифікатора залежить від геометричних параметрів роздільних гіперповерхонь класів розпізнавання.

У загальному випадку, коли класи розпізнавання перетинаються, розглянемо відносний коефіцієнт нечіткої компактності реалізації образу для класу

(2.1.1)

Процес навчання полягає в мінімізації цього виразу.

В МФСВ, який ґрунтується на допущенні гіпотези компактності (чіткої або нечіткої) реалізацій образу, як наближення ²точної² роздільної гіперповерхні для класу

розглядається гіперсфера, центром якої є еталонний вектор

, а радіусом

- кодова відстань, яка у просторі Хеммінга визначається як

(2.1.2)

де

- і-та координата вектора

- i-тa координата деякого вектора lm, вершина якого знаходиться на роздільні гіперповерхні класу

;

- операція складання за модулем два.

Оптимальною кодовою відстанню (радіусом) між вектором

і контейнером

називається екстремальне значення

, яке визначає максимум інформаційного КФЕ

, де {d} – послідовність збільшень радіуса контейнера

Побудова оптимальної в інформаційному сенсі РГП у вигляді гіперсфери за МФСВ зводиться до оптимізації радіуса роздільної гіперсфери dm, яка відбувається за ітераційним алгоритмом

(2.1.3)

де k- змінна числа збільшень радіуса РГП; h - крок збільшення.

Процедура закінчується при знаходженні екстремального значення критерію

, де

- множина радіусів концентрованих гіперсфер, центр яких визначається вершиною еталонного вектора

- еталонний вектор найближчого (до

) класу

2.2 Математична модель системи розпізнавання рукописних символів

Категоріальну модель процесу навчання системи розпізнавання символів [19] при нечіткому розбитті за МФСВ подамо у вигляді діаграми відображень множин:

(2.2.1)

де

множина сигналів на вході СР

множина моментів зчитування інформації з рецепторів;

множина можливих станів СР;

простір ОР;

множина сигналів після первинної обробки інформації;

покриття, що визначає абетку класів розпізнавання;

- нечітке розбиття;