Смекни!
smekni.com

«использование технологий xml и com для решения задач статистической радиофизики» (стр. 1 из 4)

БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

Выпускная работа по
«Основам информационных технологий»

Магистрант

кафедры радиофизики

факультета радиофизики и

электроники

Трус Александр Александрович

Руководители:

доцент кафедры радиофизики

Хейдоров Игорь Эдуардович,

ст. преподаватель

Кожич Павел Павлович

Минск – 2009 г.

ОГЛАВЛЕНИЕ

СПИСОК УСЛОВНЫХ ОБОЗНАЧЕНИЙ.. 4

РЕФЕРАТ НА ТЕМУ «ИСПОЛЬЗОВАНИЕ ТЕХНОЛОГИЙ XML И COM ДЛЯ РЕШЕНИЯ ЗАДАЧ СТАТИСТИЧЕСКОЙ РАДИОФИЗИКИ». 5

ВВЕДЕНИЕ. 5

ГЛАВА 1. ЯЗЫК XML. 7

Общая структура XML-документа. 7

Структура элемента XML. 8

Открывающий и закрывающий тэги. 9

1.3.1 Переменные. 9

1.3.2 Содержимое. 9

1.3.3 Вложенные элементы.. 10

1.4 Выводы.. 10

ГЛАВА 2. ТЕХНОЛОГИЯ МАЙКРОСОФТ COM.. 10

2.1 Язык описания интерфейсов. 11

2.1.1 Анатомия Майкрософт idl файла. 11

2.1.2 Компиляция idl-файла. 14

2.1.3 Регистрация COM-компонент. 15

2.2 Выводы.. 15

ГЛАВА 3. СИСТЕМА ИНДЕКСАЦИИ АУДИОПОСЛЕДОВАТЕЛЬНОСТЕЙ 15

3.1 Процессоры.. 16

3.2 Компоненты чтения. 17

3.3 Язык описания сценариев. 17

3.4 Выводы.. 19

ЗАКЛЮЧЕНИЕ. 19

БИБЛИОГРАФИЧЕСКИЙ СПИСОК.. 19

Список использованных источников. 19

Список публикаций. 20

ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ. 22

ИНТЕРНЕТ РЕСУРСЫ... 23

ЛИЧНЫЙ САЙТ.. 24

ГРАФ НАУЧНЫХ ИНТЕРЕСОВ.. 25

ТЕСТОВЫЕ ВОПРОСЫ ПО ОСНОВАМ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ.. 26

ПРЕЗЕНТАЦИЯ МАГИСТЕРСКОЙ РАБОТЫ... 28

СПИСОК ЛИТЕРАТУРЫ К ВЫПУСКНОЙ РАБОТЕ.. 29

ПРИЛОЖЕНИЕ 1. СЛАЙДЫ ПРЕЗЕНТАЦИИ.. 30

СПИСОК УСЛОВНЫХ ОБОЗНАЧЕНИЙ

XML - eXtensible Markup Language (расширяемый язык разметки)

COM - Component Object Model (объектная модель компонентов)

IDLInterface Description Language (язык описания интерфейсов)


РЕФЕРАТ НА ТЕМУ «ИСПОЛЬЗОВАНИЕ ТЕХНОЛОГИЙ XML И COM ДЛЯ РЕШЕНИЯ ЗАДАЧ СТАТИСТИЧЕСКОЙ РАДИОФИЗИКИ»

ВВЕДЕНИЕ

Значительный прогресс в области методов хранения, приема и передачи аудио данных привел к тому, что человек физически не способен анализировать информацию из всех доступных ему источников. Несоответствие уровня развития средств переработки информации человека, в сравнении с возможностями средств ее доставки и хранения, приводят к необходимости создания автоматических систем анализа информации[1, 2].

Одной из главных задач предварительной обработки аудио данных является задача индексации аудио. Эта задача охватывает широкий круг подзадач, таких как определение смены диктора, идентификация диктора, определение пола диктора, определение эмоций в речи, определение жанра музыки, сегментация аудиопоследовательности на речь/музыку/тишину и др. [3]. Полученные на этапе индексации данные могут быть использованы для улучшения работы модулей дальнейшей обработки сигнала, таких как модуль распознавание речи. Также, данные, полученные от модулей индексации, могут быть использованы в системах поиска аудиозаписей.

Несмотря на стремительное развитие автоматических систем анализа информации, до нынешнего времени не было предпринято попыток создания обобщенной системы, при помощи которой исследователи могли бы быстро и эффективно тестировать новые модули обработки сигнала, а также проводить полноценные эксперименты с использованием готовых модулей, не тратя большую часть времени на разработку программы для каждого нового эксперимента. Существование, развитие и успешное использование таким программных комплексов как Mathlab и Mathematica подтверждают эффективность данного подхода. Несмотря на множество преимуществ указанных комплексов, существует также ряд неудобств, связанных с их использованием. В первую очередь это невозможность разработки на языке С/С++, что усложняет дальнейшее использование написанного кода, а также вынуждает разработчика изучать внутренний, зачастую очень неудобный, язык программирования указанных комплексов. Этот язык обычно оказывается скриптовым и не предоставляет никаких средств отладки, что сильно усложняет разработку серьезных систем. Кроме того, очень сложным представляется процесс создания встраиваемых в среду модулей, что усложняет расширение таких программных комплексов сторонними разработчиками и соответственно усложняет доступ исследователей к последним разработкам. Преимуществом вышеуказанных программных комплексов является наличие удобных средств визуализации и анализа результатов.

Язык программирования С/С++ в свою очередь очень удобен для разработки приложений. Существует множество реализаций компиляторов и средств отладки от различных производителей, а также их аналогов с открытым исходным кодом. Кроме того, существует множество библиотек, предоставляющих как инструменты для базовых операций, таких как работа с матрицами, так и готовые реализации сложных классификаторов, таких как метод опорных векторов или скрытая марковская модель. К тому же, существует множество библиотек для создания графического интерфейса, обеспечивающих независимость от платформы, таких как Nokia Qt, GTK, WxWidgets. Использование таких библиотек, в сочетании с другими платформо-независимыми библиотеками, делает результат разработки полностью платформо-независимым, что избавляет разработчика и пользователя модулей от привязанности к конкретной платформе или программному комплексу. Использование стандартов Microsoft Com (Component Object Model — Объектная Модель Компонентов) для платформы Windows, и OMG (Object Management Group — группа управления объектами) CORBA (Common Object Request Broker Architecture — общая архитектура брокера объектных запросов) для всех платформ избавляет разработчиков от необходимости использования одного языка программирования. При наличии единого стандартного интерфейса для всех модулей, разработка каждого конкретного модуля могла бы вестись на любом из поддерживаемых стандартом языков программирования, что еще больше упростило бы разработку, тестирование и повторное использование модулей.

ГЛАВА 1. ЯЗЫК XML

Язык XML (eXtensible Markup Languageрасширяемый язык разметки) является рекомендованным Консорциумом Всемирной паутины языком разметки, фактически являющийся сводом общих синтаксических правил[4]. Стандарт предоставляет полностью расширяемый, простой для изучения и обладающий широкими возможностями формат для описания структурированных данных. Описание данных при помощи XML обладает рядом преимуществ:

XML обеспечивает возможность сохранения данных в текстовом формате.

XML является отрытым, кросс платформенным стандартом, что обеспечивает однозначную интерпретацию данных на любой существующей платформе.

Для того чтобы получить доступ к данным не нужно специальное программное обеспечение.

XML похож на HTML, но обладает некоторыми существенными отличиями:

в то время как HTML в первую очередь предназначен для описания графического представления данных, XML описывает сами данный, оставляя их графическое представление пользовательским приложениям.

стандарт XML описывает только синтаксис описания, при этом названия тэгов могут быть произвольными и не несут ни какой смысловой нагрузки, помимо той, которую придает им пользователь.

XML документ представляет собой древовидную структуру, с одним и только одним корневым элементом.

Общая структура XML-документа

XML-документ является иерархической структурой, которая визуально может быть представлена в виде дерева. Важнейшим синтаксическим требованием к любому XML-документу является наличие одного и только одного корневого элемента. Это означает, что все остальные элементы документа должны находиться между открывающим и закрывающим тэгами корневого элемента. Поведения XML-процессора в случае отсутствия в документе корневого элемента все зависит от конкретной реализации. Например, процессор «XML++» просто «обернет» содержимое документа корневой элемент «xml». Для уточнения поведения используемого процессора в подобной ситуации необходимо проконсультироваться с документацией. Далее приведен пример простейшего правильно построенного XML-документа: <hmm>Этот документ XML описывает срытую Марковскую модель</hmm>. Далее в данной работе

Первая строка XML-документа называется объявлением XML. Это не обязательная строка, указывающая версию стандарта XML, также здесь может быть указана кодировка документа и внешние зависимости. Далее представлен пример типичного объявления XML: <?xml version="1.0" encoding="UTF-8"?>. Спецификация требует от процессоров XML обязательную поддержку Юникод-кодировок UTF-8 и UTF-16. Признаются допустимыми, поддерживаются и используются и другие кодировки, основанные на ISO/IEC 8859, также допустимы и другие кодировки.

Стандарт XML позволяет добавлять к разметке документа комментарии. Отличительной особенностью XML является то, что комментарии могут предназначаться и для XML-процессоров. Существует возможность программного манипулирования комментариями или использования их в процессе обработки. Комментарии в XML-документах имеют следующий вид: <!-- Это комментарий. -->.

Структура элемента XML