Смекни!
smekni.com

Принципи обробки кольорових факсимільних зображень (стр. 2 из 3)

На щорічній Конференції з технологій створення кольорового зображення, організованою Суспільством по дослідженню і розробці технологій передачі зображення, Карен Браун і Ріккардо Л. де Кейрос (Ricardo L. DeQueiroz), викладач Університету Бразіліа, виклали суть свого відкриття в науковій роботі під назвою «Оборотне перетворення колірної гамми: колірне кодування текстурованих сірих зображень».

Спочатку Карен Браун і Ріккардо де Кейрос займалися вирішенням вельми поширеної проблеми. При копіюванні, роздруку або передачі факсом кольорового зображення за допомогою монохромного пристрою кольору відображаються як відтінки сірого. Різні кольори однакової світлової щільності (або візуально сприйманій яскравості) можуть відображатися як однакові відтінки сірого зображення, що робить неможливим розпізнавання колірної інформації. Наприклад, коли як оригінал використовуються такі види графіків, як лінійчаті або кругові діаграми, два кольори виглядатимуть однаково і діаграма втратить свою інформативність.

Намагаючись знайти спосіб збереження колірної інформації в діаграмах, фотографіях і інших зображеннях, дослідники почали шукати нові шляхи монохромного відображення кольорових зображень. Їх метод заснований на тому, що кожен колір перетвориться в створювані на сірих ділянках зображення, текстуру або графічний шаблон, непомітні відмінності, що містять практично. Це полегшує розпізнавання квітів рівної яскравості, завдяки чому поліпшується якість оформлення документа і підвищується практична цінність зображень. За свідченням Карен Браун, біля нового методу також опинилося несподіване застосування, яке вона описує таким чином: «За допомогою цього методу можна перетворити кольорове зображення в текстуроване, і після розшифровки елементів текстури відтворити первинну колірну гамму».

Таким чином, одержувач чорно-білого факсу може відновити кольори оригіналу. Цей винахід також дозволяє отримати кольорове зображення на основі чорно-білого документа, віддрукованого на принтері. Корпорація Xerox подала заявку на патентну реєстрацію даної технології.

Які перспективи практичного застосування цієї технології? Частину алгоритмів колірного кодування можна інтегрувати в програму, що управляє роботою монохромного принтера, що дозволяє трансформувати кольори в текстуровані відтінки сірого. Розшифровка алгоритмів може здійснюватися в сканері багатофункціонального пристрою (МФУ), що дозволить відновити кольори оригіналу і відтворити початковий документ в повнокольоровому варіанті на екрані комп'ютера або віддрукувати його на принтері.

Окрім Карен Браун, презентацію своїх наукових відкриттів в рамках конференції проводить група інших дослідників Xerox – Раджа Балу (Raja Bala), Р. Віктор Классен (R. Victor Klassen), Мартін Мальц (Martin Maltz), Джон Макелвейн (Jon McElvain) і Дж. Майкл Санчес (J. Michael Sanchez), яких в цілому припадає на частку 88 запатентованих технологій управління кольором, а також калібрування, визначення параметрів і обробки зображення.

Формат DjVu

Стискування повнокольорової інформації про документ формату А4 до розміру середньої Web-странички (46 Кбайт згодне даним на 1999 р.) теоретично цілком можливо. Формат DjVu – перший крок до «кольорового факсу» – орієнтований на передачу, перегляд в мережі і роздрук переважно текстових документів, для яких важливе значення має не тільки зміст, але і форма: колір і фактура пергаменту, відірваний куточок і сліди від складання вчетверо, пляма після підпису і кругла пляма від винної пляшки поряд з друком. Архіви всього світу накопичили величезне число історичних паперів з неповторним колоритом такого роду.

Існуючі компактні формати JPG, GIF, факс-стандарт CCITT і JBIG забезпечують достатнє стискування, проте вузько специализированны або на фотографіях, або на чорно-білій графіці і тексті. Тому змішані зображення в їх виконання виглядають нечитаними. У основу розділення «обов'язків» усередині DjVu покладені прості спостереження і факти.

· Текст і інші контрастні малюнки легкі для читання при скануванні з дозволом не менше 300 dpi.

· Навпаки, легке розмиття фонової графіки навіть покращує сприйняття тексту. Тому фон без втрат для загального враження зберігається з дозволом 100 dpi в окремий шар «background».

Таблиця 2. Параметри компонентів зображення у форматі DjVu.

Ім'я шару Пояснення Дозвіл, dpi Глибина кольору, bits/pix
Mask монохромна маска-трафарет 300 1
Background кольоровий фон 100 24
Foreground кольори маски 25 24

· Основна проблема – відокремити текст від фону, особливо якщо це кольоровий текст, і більш того, різноколірний. На щастя, колір тексту в більшості документів практично однаковий в рамках одного знаку. Це дозволяє зберігати колірну інформацію про текст з дозволом всього 25 dpi (шар «foreground») (див. табл. 2).

Розділення зображення на текст і фон (формування шару-маски) засноване на так званій мультимасштабной кластеризації. Зображення розбивається на різнорозмірні вкладені сітки, в кожному осередку яких відбувається розпізнавання текстових і фонових квітів по максимальних списах на гістограмі. Відокремивши текст від фону в найкрупнішій сітці, алгоритм переходить до уточнення на основі даних з сіток меншого розміру. Розробниками знайдено емпіричне співвідношення: колір, визначений як «текстовий» в найбільшому осередку, змішується з «текстовим» кольором в меншому, вкладеному осередку в пропорції 20% до 80%. Результат змішення береться за колір тексту для розрахунків в ще дрібнішій сітці за тим же принципом 20/80.

У DjVu для стискування фону, маски і колірної інформації про маску застосовуються різні алгоритми. Фон стискується вейвлет-алгоритмом IW44 (4х4 wavelets), шар-маска, що не містить колірної інформації, упаковується методом JB2, аналогічним вживаному у факсах. Колірна інформація про текст так само кодується IW44, але заздалегідь загрубляется до 25 dpi.

Формат IW44 дуже близький до нового стандарту JPEG2000, але менш вимогливий до системних ресурсів при декомпресії зображення під час перегляду. Шар-маска перед упаковкою JB2 зазнає оптимізацію з метою звільнення від «випадкових» штрихів і «шуму сканера» на основі так званого Soft pattern matching algorithm. В результаті кожен піксел маски кодується менш ніж одним (!) бітом, але тільки в тому випадку, якщо алгоритм здатний передбачити його колір на основі 3…8 рядом лежачих крапок з вірогідністю більше 50%.

Факсимільна передача зображень

Для передачі і відтворення на відстані нерухомих зображень призначена система факсимільного зв'язку. Передаваним зображенням може бути рукописний, машинописний або друкарський текст, фотографія, креслення, карта і ін.

Факсимільне повідомлення слід вважати за безперервне – будь-яка ділянка зображення скільки завгодно малих розмірів може мати будь-яке значення оптичної щільності в деякому діапазоні щільності. Обмежені можливості зору дозволяють дискретизувати безперервне факсимільне повідомлення і тим самим понизити його надмірність до розумної величини. Дискретизація проводиться за площею зображення і по оптичній щільності окремих ділянок з урахуванням роздільної здатності і контрастної чутливості ока.

Суть дискретизації за площею полягає в розкладанні всієї площі зображення на окремі елементарні майданчики. Кожен майданчик характеризується одним єдиним значенням оптичної щільності, що отримується шляхом усереднювання щільності в межах цього майданчика.

У факсимільних апаратах загального призначення розмір елементарного майданчика повинен складати близько 0,1 мм.

Дискретизація по оптичній щільності полягає в округленні набутого значення щільності елементарного майданчика оригіналу до найближчої фіксованої величини. В результаті на копії буде відтворена тільки певна, фіксована щільність, число якої порівняно невелике. Для якісної передачі художній фотографії необхідно передати і відтворити на копії 10–15 градацій оптичної щільності, що відрізняються один від одного. При передачі двух-градационных зображень дискретизацію проводять двома рівнями оптичної щільності – чорним і білим.

МККТТ визначив чотири групи стандартних факсимільних апаратів, що класифікуються за типом сканованого сигналу, використовуваним методом модуляції і комунікаційними характеристиками.

Апарати групи G1 кодують і передають аналогові сигнали. Визначена стандартна частота сканування ліній – 180 ліній в хвилину, виходячи з характеристик каналу зв'язку, можуть бути встановлені інші значення швидкості. Факсимільні апарати групи 1 працюють з дозволом 3,85 ліній на 1 мм і витрачають приблизно 6 мін на передачу документа формату A4. Тільки на виділених лініях апарати групи 1 можуть використовувати амплітудну модуляцію. Частота, що несе, повинна знаходитися в інтервалі 1300–1900 Гц. Під час передачі найвищий рівень сигналу відповідає чорному кольору, найнижчий – білому. Як на виділених, так і на комутованих лініях, апарати групи 1 можуть використовувати частотну модуляцію. Для комутованих ліній частота несе рівна 1700 Гц. Для виділених ліній частота несе приймається 1900 Гц, частоти 1500 Гц і 2300 Гц для білого і чорного кольорів.

Апарати групи G2 кодують і передають аналогові сигнали, як і апарати групи 1, але використовують ефективніші методи модуляції. Це дозволяє забезпечити стандартну швидкість сканування 360 ліній в хвилину. Апарати групи 2 забезпечують теж самий дозвіл, що і апарати першої групи, але витрачають від 2 до 3 хвилин на передачу того ж самого зображення. Амплітудна модуляція приводить до утворення двох бічних смуг, які є дзеркальним відображенням один одного і несуть однакову інформацію. Факсимільні апарати групи 2 призначені для роботи в мережах телефонного типу, що використовують амплітудну модуляцію з частково пригніченою бічною смугою. Модуляційна система такого типу пригнічує одну з надмірних бічних смуг, зменшуючи повну ширину смуги частот сигналу, забезпечуючи тим самим можливість розширення інформаційної смуги частот. Апарати групи 2 використовують частоту, що несе, 2100 Гц.