Смекни!
smekni.com

Общие сведения об информатике (стр. 6 из 10)

5.2. Автоматическое распознавание текстов

После обработки документа сканером получается графическое изображение документа (графический образ), который не является текстовым документом. Человеку достаточно взглянуть на лист бумаги с текстом, чтобы понять, что на нем написано. С точки зрения компьютера, документ после сканирования превращается в набор разноцветных точек, а вовсе не в текстовый документ.

Проблема распознавания текста в составе точечного графического изображения решается с помощью специальных программных средств, называемых средствами распознавания образов. Сначала распознавание текста было возможно только путем сравнения обнаруженных конфигураций точек со стандартным образцом (эталоном, хранящимся в памяти компьютера). Авторы программ задавали критерий «похожести», используемый при идентификации символов. Подобные системы назывались ОСR.(оптическое распознавание символов) и опирались на специально разработанные шрифты. Современные программы вполне могут справляться с различными (и весьма вычурными) шрифтами без перенастройки. Многие распознают даже рукописный текст.

5.3. Программы распознавания текстов

Программы распознавания текстов должны выполнять следующие операции: 1. Сканирование;

2. Сегментация;

3. Распознавание;

4. Проверка орфографии;

5. Сохранение.

Нас, прежде всего, интересуют программы, способные распознавать текст, напечатанный на русском языке. Такие программы выпускаются отечественными производителями. Наиболее широко известны и распространены программы FineReader (АВВУУ) и CuneiForm (Coginitive).

FineReader обеспечивает высокое качество распознавания и удобство применения. Она позволяет объединять сканирование и распознавание в одну операцию. Существуют различные версии FineReader. Самая простая модификация поставляется бесплатно вместе со сканером. Профессиональная версия FineReaderPro может грамотно обработать таблицы и изображения, читать штрих-коды, добавлять в базу данных новые языки. Самая мощная и дорогостоящая версия - FineReaderOffice может распознавать любые бланки и формы. FineReader поддерживает почти 200 языков распознавания, в числе которых можно найти экзотические и древние языки и даже некоторые языки программирования (Basic, C/C++, COBOL, Фортран, Паскаль). Недостаток программы FineReader – стоимость.

Программа CuneiForm содержит гораздо меньше функциональных возможностей и поддерживает всего 20 языков. Но зато CuneiForm предлагает только полезные и необходимые услуги. Цена программы является преимуществом.

Обе программы можно обучать для повышения качества распознавания неудачно напечатанных текстов или сложных шрифтов.

§6. Компьютерная графика.

Виды компьютерной графики

Различают всего три вида компьютерной графики. Это растровая графика, векторная графика и фрактальная графика. Они отличаются принципами формирования изображения при отображении на экране монитора или при печати на бумаге.

6.1. Растровая графика

Основным элементом растрового изображения является точка. Если изображение экранное, то эта точка называетсяпикселем. В зависимости от того, на какое графическое разрешение экрана настроена операционная система компьютера, на экране могут размещаться изображения, имеющие 640х480, 800х600, 1024х768 и более пикселей.

С размером изображения непосредственно связано его разрешение. Этот параметр измеряется в точках на дюйм (dpi).

НЕДОСТАТКИ:

1. Большие объемы данных

2. Невозможность увеличения изображения для рассмотрения деталей. Поскольку изображение состоит из точек, то увеличение изображения приводит только к тому, что эти точки становятся крупнее. Более того, увеличение точек растра визуально искажает иллюстрацию и делает ее грубой. Этот эффект называется пикселизацией.

6.2. Векторная графика

В векторной графике основным элементом изображения является линия (при этом не важно, прямая это линия или кривая).

В растровой графике тоже существуют линии, но там они рассматриваются как комбинации точек. Для каждой точки линии в растровой графике отводится одна или несколько ячеек памяти (чем больше цветов могут иметь точки, тем больше ячеек им выделяется). Соответственно, чем длиннее растровая линия, тем больше памяти она занимает. В векторной графике объем памяти, занимаемый линией, не зависит от размеров линии, поскольку линия представляется в виде формулы, а точнее говоря, в виде нескольких параметров. Что бы мы ни делали с этой линией, меняются только ее параметры, хранящиеся в ячейках памяти. Количество же ячеек остается неизменным для любой линии. Линия — это элементарный объект векторной графики. Все, что есть в векторной иллюстрации, состоит из линий.

Как и все объекты, линии имеют свойства. К этим свойствам относятся: форма линии, ее толщина, цвет, характер линии (сплошная, пунктирная и т. п.). Замкнутые линии имеют свойство заполнения. Внутренняя область замкнутого контура может быть заполнена цветом, текстурой, картой. Простейшая линия, если она не замкнута, имеет две вершины, которые называются узлами. Узлы тоже имеют свойства, от которых зависит, как выглядит вершина линии и, как две линии сопрягаются между собой.

6.3. Понятие о фрактальной графике

Фрактальная графика, как и векторная — вычисляемая, но отличается от нее тем, что никакие объекты в памяти компьютера не хранятся. Изображение строится по уравнению (или по системе уравнений), поэтому ничего, кроме формулы, хранить не надо. Изменив коэффициенты в уравнении, можно получить совершенно другую картину.

§7. Понятие разрешения. Типы разрешений.

Следует четко различать: разрешение экрана, разрешение печатающего устройства и разрешение изображения. Все эти понятия относятся к разным объектам. Друг с другом эти виды разрешения никак не связаны.

Разрешение экрана — это свойство компьютерной системы (зависит от монитора и видеокарты) и операционной системы (зависит от настроек Windows). Разрешение экрана измеряется в пикселях и определяет размер изображения, которое может поместиться на экране целиком.

Разрешение принтера — это свойство принтера, выражающее количество отдельных точек, которые могут быть напечатаны на участке единичной длины. Оно измеряется в единицах dpi (точки на дюйм) и определяет размер изображения при заданном качестве или, наоборот, качество изображения при заданном размере.

Разрешение изображения — это свойство самого изображения. Оно тоже измеряется в точках на дюйм и задается при создании изображения в графическом редакторе или с помощью сканера. Значение разрешения изображения хранится в файле изображения и неразрывно связано с другим свойством изображения — его физическим размером.

Физический размер изображения может измеряться как в пикселях, так и в единицах длины (миллиметрах, сантиметрах, дюймах). Он задается при создании изображения и хранится вместе с файлом. Если изображение готовят для демонстрации на экране, то его ширину и высоту задают в пикселях, чтобы знать, какую часть экрана оно занимает. Если изображение готовят для печати, то его размер задают в единицах длины, чтобы знать, какую часть листа бумаги оно займет. Нетрудно пересчитать размер изображения из пикселей в единицы длины или наоборот, если известно разрешение изображения.

Контрольные вопросы и задания

1. В чём отличие между текстовыми редакторами и текстовыми процессорами?

2. Какие преимущества может дать обработка информации с помощью электронных таблиц по сравнению с обработкой вручную?

3. В каких областях деятельности человека могут использоваться базы данных?

4. Что такое поле? Какие типы полей бывают? Каковы их свойства?

5. Перечислите объекты СУБД Access.

6. Где Вы могли встречаться с мультимедиа?

7. Опишите назначение служебных программ.

8. Объясните необходимость существования программ автоматического распознавания текста.

9. В каком виде графики: векторной или растровой, один и тот же рисунок, занимает больший объём памяти? Почему?

10. Чем отличается разрешение экрана от разрешения изображения?

ЛЕКЦИЯ №4

КОМПЬЮТЕРНЫЕ СЕТИ

План:

Введение.

1. Локальные сети.

2. Глобальные сети.

3. Система гипертекстовых страниц WWW.

4. Адреса сайтов и страниц.

5. Программа-просмотрщикMicrosoft Internet Explorer.

6. Возможности Internet.

Компьютерная сеть – объединение нескольких ЭВМ для совместного решения информационных, вычислительных, учебных и других задач.

Сети ЭВМ породили существенно новые технологии обработки информации – сетевые технологии. Сетевые технологии позволяют совместно использовать ресурсы – накопители большой ёмкости, печатающие устройства, базы и банки данных.

§1. Локальные сети

Локальные сети объединяют относительно небольшое число компьютеров (обычно от 10 до 100, хотя встречаются и гораздо больше) в пределах одного помещения, здания или учреждения. Традиционное название – локальная вычислительная сеть (ЛВС). Дань временам, когда мощность ЭВМ была недостаточна и сеть использовалась для решения вычислительных задач. Сегодня же речь идёт об обмене информацией. Локальные сети используются для автоматизации управленческой деятельности в учреждениях, на предприятиях. При существовании ЛС информация циркулирует внутри организации, не нуждаясь в выходе наружу.