Смекни!
smekni.com

Модели знаний и данных (стр. 1 из 3)

Содержание.

1.Введение.

2.Особенности знаний (Основные понятия).

3.Модели представления знаний.

4.Фреймовые и сетевые модели.

5.Представление знаний в системе распределенных баз знаний в INTERNET/INTRANET.

6.Список литературы.

Введение.

Информация с которой имеют дело ЭВМ, разделяется на процедурную и декларативную. Процедурная информация овеществлена в программах,которые выполняются в процессе решения задач, декларативная – в данных с которыми эти программы работают. Стандартной формой представления информации в ЭВМ является машинное слово, состоящее из определенного для данного типа ЭВМ числа двоичных разрядов – битов. Однако в ряде случаев машинные слова разбиваются на группы по восемь двоичных разрядов которые называются байтами.

Параллельно с развитием структуры ЭВМ происходило развитие информационных структур для представления данных. Появились способы описания данных в виде векторов и матриц, возникли списочные структуры, иерархические структуры. В настоящее время в языках программирования высокого уровня используются абстрактные типы данных, структура которых задается программистом. Появление баз данных (БД) знаменовало собой еще один шаг на пути организации работы с декларативной информацией. В базах данных могут одновременно хранится большие обьемы информации, а специальные средства образующие систему управления базами данных (СУБД), позволяют эффективно манипулировать с данными, по необходимости извлекать их из базы данных и записывать их в нужном порядке в базу.

По мере развития исследований в области ИС возникла концепция знаний, которая объединила в себе многие черты процедурной и декларативной информации.

Итак, что же такое представление информации? В рамках этого направления решаются задачи, связанные с формализацией и представлением знаний в памяти интеллектуальной системы (ИС). Для этого разрабатываются специальные модели представления знаний, выделяются различные типы знаний. Изучаются источники, из которых ИС может черпать знания, и создаются процедуры и приемы с помощью которых возможно приобретение знаний для ИС. Проблема представления знаний для ИС чрезвычайно актуальна, так как ИС - это система функционирование которой опирается на знания о предметной области, которые хранятся в её памяти.

Вывод: представление знаний – это одно из направлений в исследованиях по искусственному интеллекту. Другие направления это – манипулирование знаниями, общение, восприятие, обучение и поведение. Но на них я далее останавливаться не буду.

Особенности знаний.

Перечислим ряд особенностей присущих различным формам представления знаний в ЭВМ.

1.Внутренняя интерпретируемость. Каждая информационная единица должна иметь уникальное имя, по которому ИС находит её, а также отвечает на запросы, в которых это имя упомянуто. Когда данные, хранящиеся в памяти, были лишены имен, то отсутствовала возможность их идентификации системой. Данные могла идентифицировать лишь программа, извлекающая их из памяти по указанию программиста, написавшего программу. Что скрывается за тем или иным двоичным кодом машинного слова, системе было неизвестно.

2.Структурированность. Информационные единицы должны были обладать гибкой структурой. Для них должен выполняться “принцип матрешки”, т.е. рекурсивная вложенность одних информационных единиц в другие. Каждая информационная единица может быть включена в состав любой другой, и из каждой единицы можно выделить некоторые её составляющие. Другими словами должна существовать возможность произвольного установления между отдельными информационными единицами отношений типа “часть – целое”,” род – вид” или “элемент – класс”.

3.Связность. В информационной базе между информационными единицами должна быть предусмотрена возможность установления связей различного типа. Прежде всего эти связи могут характеризовать отношения между информационными единицами. Например: две или более информационные единицы могут быть связаны отношением «одновременно», две информационные единицы - отношением «причина – следствие» или отношением «быть рядом». Приведенные отношения характеризуют декларативные знания. Если между двумя информационными единицами установлено отношение «аргумент – функция», то он характеризует процедурное знание, связанное с вычислением определенных функций. Существуют - отношения структуризации, функциональные отношения, каузальные отношения и семантические отношения. С помощью первых задаются иерархии информационных единиц, вторые несут процедурную информацию, позволяющие вычислять (находить) одни информационные единицы через другие, третьи задают причинно следственные связи, четвертые соответствуют всем остальным отношениям.

Перечисленные три особенности знаний позволяют ввести общую модель представления знаний, которую можно назвать семантической сетью, представляющей собой иерархическую сеть в вершинах которой находятся информационные единицы.

4.Семантическая метрика. На множестве информационных единиц в некоторых случаях полезно задавать отношение, характеризующее информационную близость информационных единиц, т.е. силу ассоциативной связи между информационными единицами. Его можно было бы назвать отношением релевантности для информационных единиц. Такое отношение дает возможность выделять в информационной базе некоторые типовые ситуации (например «покупка», «регулирование движения»). Отношение релевантности при работе с информационными единицами позволяет находить знания близкие к уже найденным.

5.Активность.С момента появления ЭВМ и разделения используемых в ней информационных единиц на данные и команды создалась ситуация, при которой данные пассивны а команды активны. Все процессы протекающие в ЭВМ инициируются командами, а данные используются этими командами лишь в случае необходимости. Для ИС эта ситуация неприемлема. Как и у человека, в ИС актуализации тех или иных действий способствуют знания, имеющиеся в системе. Таким образом, выполнение программ в ИС должно инициироваться текущим состоянием информационной базы. Появление в базе фактов или описание событий, установление связей может стать источником активности системы.

Перечисленные пять особенностей информационных единиц определяют ту грань, за которой данные превращаются в знания, а базы данных перерастают в базы знаний (БЗ). Совокупность средств, обеспечивающих работу со знаниями, образуют систему управления базой знаний (СУБЗ). В настоящее время не существует баз знаний, в которых в полной мере были бы реализованы перечисленные вше особенности.

Модели представления знаний.

Во многих случаях для принятия решений в той или иной области человеческой деятельности неизвестен алгоритм решения, т.е. отсутствует четкая последовательность действий, заведомо приводящих к необходимому результату. Например:

- проектирование развития тяжелой промышленности;

- оптимальное размещение персонала внутри здания;

- лечение больного человека.

При принятии решения в таких случаях необходимо иметь некоторую сумму знаний о самой этой области. Например: при выборе наилучшего хода в конкретной шахматной позиции необходимы знания о правилах игры, силе шахматных фигур, стратегии и тактике и многое другое. Под знаниями понимается то, что стало известно после изучения. Совокупность знаний нужных для принятия решений, принято называть предметной областью или знаниями о предметной области.

В любой предметной области есть свои понятия и связи между ними, своя терминология, свои законы, связывающие между собой объекты данных предметной области, свои процессы и события. Кроме того, каждая предметная область имеет свои методы решения задач.

Решая задачи такого вида на ЭВМ используют ИС, ядром которых являются базы знаний, содержащие основные характеристики предметных областей.

При построении баз знаний традиционные языки, основанные на численном представлении данных являются неэффективными. Для этого используются специальные языки представления знаний, основанные на символьном представлении данных. Они делятся на типы по формальным моделям представления знаний. Различные авторы по-разному эти модели классифицируют. Вообще их четыре:

- продукционные модели

- логические модели

- сетевые модели

- фреймовые модели

Кто-то объединяет продукционные и логические, а кто-то сетевые и фреймовые.

Сначала вкратце рассмотрим продукционные и логические модели:

Знания в таких моделях представляются в следующей форме: «Если А, то В». Вместо А и В могут стоять некоторые утверждения, факты, приказы и т.д. Например: «Если диагонали четырехугольника пересекаются под прямым углом, то этот четырехугольник ромб», «Если сделаешь работу то получишь зарплату» и т.д.

Из примеров видно что правило состоит из двух частей: посылки (условия) и следствия (заключения). Если А (посылка) имеет место, то В(следствие) также реализуется или может быть реализовано. Посылка может состоять и из нескольких частей т.е: «Если А1,А2,..,АN то В».

Запись правила означает, что «Если все посылки от А1 до АN истинны, то следствие В также истинно». Посылки А1..АN есть простые посылки они соединяются с помощью союзов: и,или и могут содержать отрицание не. При реализации правил такого вида из одной или нескольких посылок (знаний) могут быть получены новые знания, поэтому они называются продукционными. Примером может служить следующее правило:

Если человек Х является сыном человека У, и

человек У является сыном человека Z, и

человек Z является мужчиной,

то человек Х является внуком человека Z.

Далее рассмотрим сетевые модели.

В основе сетевых моделей представления знаний лежит идея о том, что любые знания можно представить в виде совокупности объектов (понятий) и связей (отношений) между ними. В отличие от продукционных эти модели более наглядны, поскольку любой пример можно представить в виде ориентированного (направленного) графа.