Інформаційний синтез системи автоматичного розпізнавання бланків документів (стр. 2 из 11)

1.2.2 Двовимірне зворотнє дискретне косинусне перетворення

Алгоритм зворотного дискретного косинусного перетворення [4, 5, 8] реалізується наступним виразом:

де

Функція B=idct2(A)повертає результат двомірного зворотного дискретного косинусного перетворення для матриці А. Результат повертає у вигляді матриці В.

Функція B=idct2(A,m,n)повертає результат двомірного зворотного дискретного косинусного перетворення з розміром матриць А і Вmхn. Якщо розмір матриціА менший, вона доповнюється нульовими елементами до заданого розміру.

Матриця А може включати елементи класу doubleабо любого класу integer. МатрицяВ має елементі класу double.

1.2.3 Пряме перетворення Радона

Пряме перетворення Радона [4, 6, 8] використовується для полутонового зображення, представленого матрицею І. У результаті перетворення отримаємо матрицю проекцій R. Дане перетворення зводиться до обчислення проекцій зображення на осі, що задаються кутом відносно горизонталі по часовій стрілці.

Матриця І повинна мати елементи, що відносяться до класу double або любому іншому класу integer. Алгоритм прямого перетворення Радона заключається в обчисленні проекцій зображення відносно конкретних напрямків. Так, проекція функцій двох змінних f(x,y) на вісь

задається лінійним інтегралом:

де осі

та

задаються поворотом проти часової стрілки на кут

з використанням наступного виразу:

Базове полутонове зображення І розглядається як функція двох змінних з початком в координатах

в місті центрального піксела зображення в піксельній системі координат.

1.2.4 Зворотнє перетворення Радона

Функція І = irandom(P,theta) здійснює зворотне перетворення Радона [4, 8] і реконструює зображення І по його матриці проекцій Р. Якщо theta – вектор, то він повинен містити кути в градусах, що монотонно збільшуються з однаковим кроком d_theta і задають напрямок осей, проекції яких знаходяться в матриці Р. Якщо theta – скаляр, що задається як d_theta, то кути проекцій розраховуються як theta = m*d_theta, де m=0,1,2,…,size(P,2)-1.

Функція І = irandom(P, theta, interp, filter, d, n) дозволяє задати чотири додаткових параметри:

1) interp – задає тип інтерполяції(лінійна, сплайнова, по найближчому відліку):

2) filter – задає тип фільтра:

3) d – число в діапазоні [0,1], що задає нормалізовану частоту;

4) n – кількість стовпчиків і рядків у відновленому зображенні;

Всі вхідні і вихідні параметри повинні бути класу double.

Методи розпізнавання рукописних символів, що розглядатимуться далі, історично являються ранніми. Вони передбачають попередню детальну обробку зображень, що розпізнаються. На основі такої обробки виділяють найбільш характерні особливості зображень для їх класифікації. Потім ці особливості перетворюються в коди, зручні для введення в систему розпізнавання.

Так як опис зображень формується з врахуванням конкретної задачі, системи розпізнавання такого типу є непридатні, коли якісно змінюється множина зображень, які необхідно класифікувати, а також коли класифікація набуває новий зміст. В такого типу системах практично відсутнє навчання, так як всі її параметри відразу жорстко задаються конструктором.

1.2.5 Метод суміщення з еталонами

Метод суміщення з еталонами [9, 10] є одинм з перших найпростіших методів розпізнавання образів. Основна ідея методу полягає в співставленні зображення, що розпізнається, з набором ідеальних еталонів, попередньо сформованих конструктором. Належність зображення до певного образу визначається по мірі його збіжності з еталонами. Системи розпізнавання, побудовані за даним методом, можна класифікувати за способом зберігання еталонних наборів:

1) системи, що використовують фотографічні маски;

2) системи, що використовують електричні моделі еталонів;

В системах розпізнавання з фотомасками застосовують безпосередньо оптичне накладання зображення на еталонну маску. Такі системи використовуються для розпізнавання зорових образів. Зображення, що розпізнається, проектується на еталонні маски, набір котрих включає всю множину образів. Степінь збіжності цього зображення з кожним із еталонів фіксується за допомогою еталонного множника, що розміщується за еталонною маскою, за мінімумом світлового потоку, що пройшов скрізь маску. Якщо еталонні маски представленні негативним зображенням знаків, що розпізнаються, то при повній збіжності знака з еталоном вихідний сигнал фотомножника дорівнює нулю. Вхідне зображення відноситься до того образу, з еталоном котрого виявлена найбільша збіжність.

В системах розпізнавання, що використовують для зберігання еталона його електричну модель, зображення попередньо перетворюється в послідовність дискретних за рівнем і часом електричних сигналів. Кожен сигнал з певною точністю відповідає коефіцієнту відображення однієї клітини рецепторного поля. В даній ситуації накладання зображення на еталон відбувається шляхом сумування сигналів від клітин рецепторного поля на еталонних матрицях опору або феритових сердечників. Значення сумарного сигналу відображає степінь збіжності зображення і еталона.

Область застосування методу обмежена в силу необхідності створення для кожного образу точно відтвореного еталону. При цьому зображення, що розпізнаються, повинні мати строго фіксоване положення відносно еталона. Такі системи не можуть перенавчитися для розпізнавання інших образів. Для цього потрібно формувати нові еталони, які б відповідали тим образам, яуі необхідно розпізнати в нових умовах.

1.2.6 Метод зондів

Серед відомих методів розпізнавання букв і символів метод зондів [9, 10, 11] виділяється своєю простотою. Даний метод базується на аналізі певних ознак, суттєвих для даного зображення, і дає можливість класифікувати рукописні знаки, написані з певними невеликими відмінностями в розмірі і стилі написання.

Система розпізнавання потребує написання знаків, що розпізнаються, спеціальними струмопровідними чорнилами. Листок паперу повинен бути розмічений на клітинки, всередині кожної із яких ставляться дві точки. Знак, що розпізнається, повинен розміщуватися певним чином відносно цих двох точок і не виходити за межі клітинки. На знак накладається спеціально підібрана система електронів-зондів, а по чорнилам пропускається струм. Кожний зонд являється ознакою зображення, що розпізнається. Сигнали від електродів, що торкаються ліній знаку, подаються на дешифратор, котрий в залежності від того, які електроди перетнулися, видає код, відповідний певному знаку розпізнавання.

На рецепторному полі знаходяться декілька доріжок-зондів, які можна розглядати як групи або ланцюги одиничних фоторецепторів. Зонди можна розглядати в якості координат простору ознак. У цьому випадку кожне зображення може бути представлене у вигляді вектора

, складові котрого приймають значення 0 або 1. Для того, щоб система розпізнавання могла безпомилково класифікувати зображення, необхідно підібрати відповідну систему зондів. При виборі зондів необхідно врахувати можливі зсуви зображення по рецепторному полю, а також їх невелику деформацію. Вплив викривлень, які не перевищують певного значення, може бути відображено в записах кодів зондів.

При побудові системи зондів необхідно врахувати два основні факти: ліміт допустимих перетворень зображень і належність в зображеннях частин, що включають найбільшу для розпізнавання інформацію. Враховуючи ці фактори, потрібно вибирати зонди так, щоб, по-перше, при будь-яких допустимих перетвореннях зображення даного образу система зондів видавала одну і ту саму реакцію, по-друге, при представлені зображень різних образів реакція системи зондів в значній мірі змінювались.