регистрация / вход

Компьютерные информационные технологии

Под экспертной системой понимается система, объединяющая возможности компьютера со знаниями и опытом эксперта в такой форме, что система может предложить разумный совет или осуществить разумное решение поставленной задачи.

Компьютерные информационные технологии

Контрольная работа

Выполнила ст. гр. БУЗС-111 Пушнина И.Ю.

Белорусско-Российский университет

Режим работы ЭС

Под экспертной системой понимается система, объединяющая возможности компьютера со знаниями и опытом эксперта в такой форме, что система может предложить разумный совет или осуществить разумное решение поставленной задачи. Дополнительно желаемой характеристикой такой системы, которая многими рассматривается как основная, является способность системы пояснять по требованию ход своих рассуждений в понятной для спрашивающего форме.

Как правило, современная экспертная система содержит следующие компоненты

1) подсистему приобретения знаний;

2) базу знаний;

3) механизм вывода;

4) рабочую память;

5) интерфейс пользователя;

6) подсистему объяснения;

7) подсистему совершенствования вывода.

Среда разработки используется создателями ЭС для введения и представления экспертных знаний, а среда консультации доступна пользователям (не экспертам) для получения экспертных знаний и советов.

Приобретение знаний - это сбор, передача и преобразование опыта решения проблем из некоторых источников знаний в компьютерные программы при их создании или расширении (потенциальные источники знаний - люди-эксперты, учебники, базы данных, исследовательские отчеты, собственный опыт пользователей).

База знаний содержит два основных элемента - факты (данные) из предметной области и специальные эвристики или правила, которые управляют использованием фактов при решении проблем.

Механизм вывода - управляющая структура ЭС. Известна также как интерпретатор правил (в ЭС, основанных на правилах). Это компьютерная программа, управляющая использованием системных знаний посредством формирования и организации последовательности шагов, предпринимаемых для решения проблемы (так называемой “повестки”).

Составляющие механизма вывода:

1) интерпретатор (обычно интерпретатор правил) выполняет выбранную повестку, применяя соответствующие правила из базы знаний;

2) планировщик управляет процессом выполнения повестки, оценивая эффект применения различных правил с точки зрения приоритетов или других критериев.

Рабочая память служит для хранения данных, полученных от пользователя, и промежуточных данных, выведенных в ходе работы системы.

Интерфейс пользователя. Экспертные системы содержат лингвистический процессор для дружественного, проблемно-ориентированного общения между пользователем и компьютером (лингвистический процессор преобразует входные данные, представленные на ограниченном естественном языке - русском, английском - в представление на внутреннем языке системы и обратно - сообщения системы на внутреннем языке в сообщения на ограниченном естественном). Общение это может сопровождаться графикой и многооконным меню.

Подсистема объяснения сообщает, почему и как программа вывода обрабатывает тот или иной символ. Обычно объяснительный блок сообщает следующее: как правила используют информацию пользователя, почему использовались (не использовались) данные правила, какие были сделаны выводы.

Совершенствование вывода. Люди-эксперты могут анализировать свою собственную работу, опыт, знания и улучшать их. Аналогичная способность необходима и для ЭС, чтобы она была способна анализировать причины своего успеха или неудачи. Это приведет к улучшению представления знаний в базе знаний и совершенствованию логического вывода.

В процессе решения задачи ЭС запрашивает у пользователя факты, касающиеся конкретной ситуации (проблемы). Получив ответы, ЭС пытается вывести заключение (рекомендацию). Эта попытка выполняется механизмом вывода, решающим, какая стратегия эвристического поиска должна быть использована применительно к данной проблеме. Пользователь может запросить объяснение поведения ЭС и объяснение ее заключений. Качество вывода определяется методом, выбранным для представления знаний, объемом базы знаний и мощностью механизма вывода.

Экспертная система работает в двух режимах: приобретения знаний и решения задач (режим консультации или режим использования ЭС).

В режиме приобретения знании общение с ЭС осуществляет эксперт через посредничество инженера по знаниям. Эксперт описывает проблемную область в виде совокупности данных и правил. Данные определяют объекты, их характеристики и значения, существующие в области экспертизы. Правила определяют способы манипулирования данными, характерные для рассматриваемой проблемной области. Эксперт, используя компонент приобретения знаний, наполняет систему знаниями, которые позволяют ЭС в режиме решения самостоятельно (без эксперта) решать задачи из проблемной области.

Отметим, что режиму приобретения знаний при традиционном подходе к разработке программ соответствуют этапы алгоритмизации, программирования и отладки, выполняемые программистом. Таким образом, в отличие от традиционного подхода разработку программ осуществляет эксперт (с помощью ЭС), не владеющий программированием, а не программист.

В режиме консультации общение с ЭС осуществляет конечный пользователь, которого интересует результат и (или) способ получения решения.

После обработки данные поступают в рабочую память. На основе входных данных из рабочей памяти, общих данных о проблемной области и правил из БЗ решатель (интерпретатор) формирует решение задачи.

В отличие от традиционных программ ЭС в режиме решения задачи не только исполняет предписанную последовательность операций, но и предварительно формирует ее. Если ответ ЭС не понятен пользователю, то он может потребовать объяснения, как ответ получен. Для этого предназначена объяснительная компонента.

2.Понятие и архитектура РаБД. Стратегии распределения данных в РаБД.

5.1. Понятие и архитектура распределенной БД

Распределенная БД (РаБД) – набор логически связанных между собой разделяемых данных и их описаний, которые физически распределены по нескольким компьютерам (узлам) в некоторой компьютерной сети.

Каждая таблица в РАБД может быть разделена на некоторое количество частей, называемых фрагментами. Фрагменты могут быть горизонтальными, вертикальными и смешанными. Горизонтальные фрагменты представляют собой подмножества строк, а вертикальные – подмножества столбцов. Фрагменты распределяются на одном или нескольких узлах.

С целью улучшения доступности данных и повышения производительности системы для отдельных фрагментов может быть организована репликация – поддержка актуальной копии некоторого фрагмента на нескольких различных узлах. Репликаты – множество различных физических копий некоторого объекта БД, для которых в соответствии с определенными в БД правилами поддерживается синхронизация с некоторой «главной копией».

Существуют несколько альтернативных стратегий размещения данных в системе: раздельное (фрагментированное) размещение, размещение с полной репликацией и размещение с выборочной репликацией.

Раздельное (фрагментированное) размещение. В этом случае БД разбивается на непересекающиеся фрагменты, каждый из которых размещается на одном из узлов системы. При отсутствии репликации стоимость хранения данных будет минимальна, но при этом будет невысок также уровень надежности и доступности данных в системе. Отказ на любом из узлов вызовет утрату доступа только к той части данных, которая на нем хранилась.

Размещение с полной репликацией. Эта стратегия предусматривает размещение полной копии всей БД на каждом из узлов системы. Следовательно, надежность и доступность данных, а также уровень производительности системы будут максимальными. Однако стоимость хранения данных и уровень затрат на передачу данных в этом случае будут самыми высокими.

Размещение с выборочной репликацией. Данная стратегия представляет собой комбинацию методов фрагментации, репликации и централизации. Одни массивы данных разделяются на фрагменты, тогда как другие подвергаются репликации. Все остальные данные хранятся централизованно. Целью применения данного метода является объединение всех преимуществ, существующих в остальных моделях, с одновременным исключением свойственных им недостатков. Благодаря своей гибкости, именно эта стратегия используется чаще всего.

Существует четыре альтернативные стратегии распределения данных:

1.Централизация (единственная копия базы данных, расположенная в одном узле).

2.Расчленение (единственная копия базы данных, непересекающиеся подмножества распределены по различным узлам).

3.Дублирование (несколько копий базы данных, в каждом узле располагается полная копия всех данных).

4.Смешанная (несколько копий подмножеств базы данных, в каждом узле может содержаться произвольный фрагмент базы данных).

Система управления распределенными базами данных, допускающая лишь централизованное распределение, является простейшей, а система, допускающая смешанное распределение данных, - наиболее сложной. Стратегии расчленения и дублирования являются в различной степени более сложными, чем централизованная. Стратегия расчленения предполагает наличие лишь одной копии базы данных, но при этом необходимо знать, какая часть базы данных расположена в каждом узле. Стратегия дублирования предполагает наличие в каждом узле полной копии базы данных, причем все копии должны обслуживаться согласовано для обеспечения их полноты и целостности. Смешанная стратегия сочетает сложности двух других распределенных стратегий, приобретая при этом гибкость и достоинства обеих стратегий. Для систем управления распределенными базами данных может потребоваться следить за изменением состояний копий каждого подмножества базы данных, а также за размещением каждой копии.

Рассмотрим преимущества и недостатки всех стратегий распределения данных, а также типичные ситуации, когда каждая из этих стратегий является наиболее подходящей.

Основным преимуществом централизованной базы данных, безусловно, является простота. Все операции осуществляются под контролем единственного узла, все проблемы и действия полностью ясны, по крайней мере, по сравнению с распределенной базой данных.

Современным представителем стратегии централизации является система "клиент-сервер". Задача этой системы состоит в том, чтобы обеспечить доступ к данным, обрабатываемым сервером, со стороны приложений, поддерживаемых клиентом. Как правило, клиент и сервер территориально удалены друг от друга, и в этом случае они образуют или входят в состав распределенной системы обработки данных. Программные средства серверов баз данных обеспечивают реализацию многопользовательских приложений, централизованное хранение, целостность и безопасность данных. Производительность серверов баз данных на порядок выше по сравнению с традиционными файл-серверами, которые используются в локальных сетях.

Локальные вычислительные сети, первоначально созданные для совместного использования дорогостоящего периферийного оборудования, эволюционировали со временем до такой степени, что стал возможен доступ многих пользователей к одним и тем же файлам, и для многих персональных систем управления базами данных были предложены сетевые версии. Однако скоро стало ясно, что сетевые СУБД, основанные на модели файл-сервера, недостаточно мощны. В нагруженной сети неизбежно встает проблема производительности, а также безопасности и целостности данных.

Производительность является проблемой не потому, что современным процессорам не хватает требуемой мощности, а потому, что сегодняшние файл-серверы используют принцип "все или ничего" для исполнения запросов рабочих станций. Полные копии файлов базы данных постоянно перемещаются вперед-назад по сети. Проблемы с безопасностью и целостностью данных возникают из-за того, что файл-серверы изначально не были сконструированы с учетом целостности данных и их восстановления в случае аварии, неявного распараллеливания задач (implicitconcurrency) и централизованного контроля управления данными, типичными функциями, выполняемыми СУБД на средних и больших ЭВМ.

Архитектура "клиент-сервер" (CSA - ClientServerArchitecture) заменила модель "файл-сервера" на более мощную, состоящую из "клиентов" и "серверов", что позволило совместить достоинства однопользовательских (высокий уровень диалоговой поддержки, дружественный интерфейс и низкую цену) и более крупных компьютерных систем (поддержка целостности и защита данных, многозадачность).

В архитектуре "клиент-сервер" интерфейс пользователя, отображения и запросы хранятся отдельно от системы управления реальными данными и их фильтров. Внешние прикладные программы сориентированы более на представление информации клиенту. Сервер же обрабатывает запросы прикладных программ, выбирает необходимые данные, посылает их клиентам по сети и производит обновление информации.

Серверы баз данных расширяют диапазон программ пользователей, которым доступны данные в СУБД. Это происходит за счет централизованного хранения данных (в отличие от файл-серверов, поддерживающих отдельные файлы для каждого типа приложений). Обращаться к данным могут не только специально написанные прикладные программы базы данных, но и электронные таблицы, настольные издательства или текстовые процессоры. Сервер базы данных обеспечивает интеграцию данных независимо от использующих их приложений. Данные в СУБД всегда поддерживаются в актуальном состоянии и могут быть использованы совместно многими пользователями. Централизованное хранение и программные средства сервера баз данных обеспечивают выполнение таких важных функций СУБД, как диалоговое управление и восстановление целостности хранимой информации после сбоя.

Распределенные стратегии должны доказать свои преимущества путем преодоления некоторых недостатков, присущих централизованным системам. Так как в централизованных базах данных все данные располагаются в единственном узле, то возможный размер базы данных ограничивается объемом памяти центральной ЭВМ. Все запросы на выборку и обновление данных должны направляться в центральный узел с соответствующими временными задержками. Если в центральном узле находится однопроцессорная ЭВМ, то это приведет к ограничениям на параллельную обработку, следовательно, время реакции системы может быть слишком большим для пользователя. Центральный узел может стать узким местом всей системы, хотя вся остальная сеть может функционировать нормально. Любая из трех других стратегий распределения данных преодолевает некоторые из этих недостатков, но ценой определенных затрат.

При распределении данных на основе стратегии расчленения база данных распределяется по многим узлам сети, однако существование копий отдельных частей базы данных не допускается. База данных разделяется на непересекающиеся подмножества, называемые логическими фрагментами, и каждый логический фрагмент размещается в отдельном узле. Такой метод имеет ряд преимуществ перед стратегией централизации. Размер базы данных теперь ограничивается суммарным объемом памяти, имеющейся во всей сети, а не в единственном узле. Так как запросы на поиск и корректировку направляются в узлы, где расположены запрашиваемые файлы, то временная задержка может быть снижена за счет того, что большая часть запросов к базе данных будет осуществляться к своим локальным частям. С другой стороны запрос может потребовать доступа ко всем узлам сети, и это приведет к большему времени задержки, чем в случае централизованной базы данных. Время реакции системы может быть меньше по сравнению с централизованной базой данных, если используется возможный параллелизм. Доступность и надежность базы данных могут быть повышены по сравнению с централизованным подходом. Если выйдут из строя канал связи, один или несколько узлов, то система все же может оказаться частично работоспособной. Доступными могут оказаться части базы данных в отдельных узлах или в узлах, еще остающимися связанными в сети. Ключевым фактором, влияющим на надежность и доступность базы данных, является так называемая локализация ссылок (т.е. расположение запрашиваемых данных, исходя из удовлетворения запросов пользователей). Если база данных распределена по сети таким образом, что данные, расположенные в узле, запрашиваются почти исключительно пользователем этого узла, то говорят, что существует высокая степень локализации ссылок. Если же подобное расчленение базы данных невозможно, то говорят, что степень локализации ссылок мала. Следствием степени локализации ссылок обычно является и большая доступность базы данных. Например, если запрос пользователя может быть удовлетворен с помощью локально хранимых данных, то ошибки в других узлах или ошибки в каналах связи не окажут влияния на этот запрос. Если степень локализации мала или запрос пользователя является сложным, то могут потребоваться данные, хранимые в различных узлах. И если при этом будет недоступен хотя бы один узел, то запрос не будет удовлетворен. В этой ситуации доступность базы данных может быть хуже, чем при стратегии централизации. Вероятность того, что по крайней мере один узел будет недоступен, очевидно, выше вероятности недоступности единственного узла. Следовательно, база данных может быть доступна меньшую часть времени, чем при использовании стратегии централизации.

Стратегия расчленения наиболее подходит для случая, когда либо локальная дисковая память ограничена по сравнению с объемом базы данных, либо недостаточна надежность централизованной базы данных, либо когда должна быть повышена эффективность функционирования. Эффективность функционирования может быть обычно повышена, если запросы к базе данных будут обладать высокой степенью локализации ссылок. При отсутствии локализации ссылок эффективность может упасть довольно быстро из-за большого объема передачи данных.

При распределении данных с использованием стратегии дублирования в каждом узле сети размещается полная копия базы данных (т.е. в каждом узле, в котором имеются данные, имеется вся база данных). Сетевая система управления должна согласовывать состояние многих копий данных, однако здесь отсутствуют проблемы определения, какую конкретную часть базы данных содержит каждый узел, как это было в стратегии расчленения. Сравнивать две указанные стратегии, исходя из их сложности, нельзя, поскольку они решают различные задачи. Основное преимущество стратегии дублирования относится к областям надежности, доступности и эффективности выборки. Уровень надежности, обеспечиваемый этой стратегией, самый наивысший из возможных, но при явных затратах используемой дисковой памяти. Объем базы данных тоже ограничен объемом дисковой памяти в каждом узле. Значительная часть обработки может быть проведена локально, но с целью согласования множественных копий базы каким-то образом должна осуществляться их синхронизация. Конкретные способы проведения согласования меняются от системы к системе в широких пределах, а уровень определенных накладных расходов будет зависеть от имеющегося уровня постоянства данных. Эта стратегия не столь легко реализует параллельную обработку одного запроса, как стратегия расчленения, что связано с необходимостью согласования копий и сложностью управления, однако каждый узел может работать асинхронно. Возможно получение очень быстрых ответов на запросы пользователей, особенно в ситуациях, когда нет необходимости в межузловой связи для согласования копий баз данных, например при поиске в базе данных. Надежность базы данных является высокой не только из-за доступности данных при нарушении работоспособности узла или части сети, но также и из-за простоты замены разрушенной копии базы данных или возможности продолжения обработки, несмотря на вышедший из строя узел. Еще одним преимуществом стратегии дублирования является простота операций восстановления базы данных. Согласованная копия базы данных может быть получена из любого рабочего узла. Если часть сети недоступна по какой-либо причине, то, возможно, придется ограничить выполнение некоторых запросов (например, корректирующих) для того, чтобы поддержать согласованность базы данных. Иными словами, если разрешено выполнение запросов на корректировку в двух разных узлах и не может быть осуществлена синхронизация, то при возобновлении нормального функционирования сети возможно нарушение согласованности базы данных.

Стратегия дублирования наиболее подходит для тех ситуаций, когда фактор надежности является критическим, база данных - небольшой, а интенсивность обновления может быть невысокой (например, база данных с интенсивными запросами справочного типа). В данном случае способ синхронизации оказывает большое влияние на эффективность распределения базы данных.

Смешанная стратегия распределения данных объединяет подходы, связанные с расчленением и дублированием данных с целью приобретения преимуществ, которыми они обладают. Но, к сожалению, эта стратегия приобретает сложности каждого из объединяемых подходов. Эта стратегия подразделяет базу данных на логические фрагменты, как это сделано в стратегии расчленения, но в дополнение к этому дает возможность иметь произвольное количество физических копий каждого фрагмента, называемых хранимыми фрагментами. Эта стратегия является общей в том, что любая часть базы данных может быть дублирована произвольное количество раз и в каждом узле может содержаться желаемая часть базы данных. Недостатком является необходимость хранить информацию о том, где находятся данные в сети, и согласовать произвольное количество хранимых фрагментов, связанных с каждым логическим фрагментом. Обработка и оптимизация запросов является при использовании смешанной стратегии нетривиальными задачами.

Ключевым преимуществом смешанной стратегии является гибкость. Например, можно установить компромисс между объемом памяти, используемой в целом и в каждом отдельном узле, обеспечиваемым уровнем надежности и различными мерами эффективности. К примеру, архивные данные целесообразно запоминать только в одном месте, напротив, более критические данные могут быть дублированы, если требуется достичь определенного уровня надежности. При дублировании логического фрагмента (запоминании более одной его копии) возникает проблема согласования, однако большее количество данных становится локально доступным, что ведет к снижению количества пересылок при выполнении запросов. Происходит это из-за того, что степень локализации может возрастать за счет дублирования. Система допускает относительно простую реализацию параллельной обработки данных, что делает возможным получение малого времени отклика. Узкие места, возникающие при связи, во многих случаях могут быть устранены. В связи с тем, что в каждом узле сети может находиться произвольное подмножество базы данных, можно получить практическую любую степень надежности при возникновении ошибок в узлах и каналах связи. Функционирование может продолжаться, хотя функциональные возможности будут ограниченны. Как и для случая стратегии дублирования, выполнение корректирующих запросов может быть ограничено с тем, чтобы автоматически поддерживалась согласованность базы данных при возобновлении функционирования сети в полном объеме.

Хотя смешанная стратегия распределения данных и является предельно гибкой, остается проблема взаимозависимости различных факторов, влияющих на производительность системы, ее надежность и требования к памяти. Изолировать один фактор от другого весьма трудно. Механизмы, используемые распределенными СУБД, оказывают большое влияние на производительность и другие параметры. Предположения, касающиеся использования базы данных, играют большую роль в конечном распределении данных.

Смешанная стратегия является приемлемой тогда, когда ни одна из более простых стратегий не является удовлетворительной. Это случается достаточно часто. В качестве примера рассмотрим большую базу данных, в которой требования высокой надежности предъявляется лишь к определенным ее частям. Каждый узел может обращаться к некоторым частям базы данных часто, а к некоторым - редко (т.е. имеется разнообразие локализации ссылок). В этом случае стратегия расчленения не может обеспечить достаточной надежности, а стратегия дублирования может быть невыгодной или неприемлемой из-за требований на вторичную память.

3. Задание 1.Создать таблицу со следующими полями: Порядковый номер, Кафедра (КД, МА, ФК), Группа, Подгруппа (1, 2), Фамилия, Номер зачетной книжки, Экзамен 1, Экзамен 2, Экзамен 3, Экзамен 4, Экзамен 5, Средний балл (вычислить), Стипендия. Заполнить таблицу не менее 15 записями. Создать интерактивную страницу, содержащую первые шесть полей средствами MSExcel.

Последовательность действий:

1. Создаем новый файл MSExcel.

2. Создаем таблицу с полями согласно задания 1.

3. Заполняем таблицу.

Таблица 1.

5. Вычисляем средний балл по формулам.

6. Устанавливаем курсор на рабочую книгу.

7. Выполняем команду меню Файл> Сохранить как Web-страницу.

8. В диалоговом окне Сохранение документа указываем объект публикации: лист.

9. Указываем для листа Добавить интерактивность.

10.Нажимаем кнопку Изменить для задания заголовка Web-страницы.

11.Нажимаем кнопку Опубликовать;

12.В диалоговом окне Публикация Web-страницы настроим объект публикации —диапазон ячеек, ранее опубликованный документ;

13.Выбираем режим работы: с объектом публикации (для ячеек электронной таблицы и сводной таблицы);

14.Указываем местоположение и имя файла формата .html для указанного объекта публикации;

15.Указываем Открыть страницу в обозревателе;

16.Нажимаем кнопку Опубликовать.

3. Задание 2.Проводились исследования зависимости спроса от нескольких факторов. Получены данные представленные в таблице (к каждому значению спроса добавить число, равное трем последним цифрам номера зачетки, из денежных доходов населения вычесть последнюю цифру номера зачетки, а из количества населения вычесть две последние цифры номера зачетки умноженный на 0, 1).

Таблица 2.

Определить фактор наиболее влияющий на спрос и ниже приведенное выполнить для этого фактора и спроса. Представить результаты эксперимента графически в виде корреляционного поля и используя линию тренда определить параметры линейной модели.

1. Создаем новый файл MSExcel.

2. К каждому значению Таблицы 2 добавляем и вычитаем последние цифры номера зачетки согласно Задания 2, по формулам в Таблице 3.

Таблица 3.

3. Получаем данные согласно Таблице 4.

Таблица 4.

4. Определяем фактор наиболее влияющий на спрос по формулам.

Таблица 5.

5. Из Таблицы 5 видно, что наиболее влияющий фактор на Спрос – Денежные доходы населения. Представляем результаты эксперимента графически.

6. Строим точечную диаграмму.

7. В контекстном меню данной линии выбираем пункт «Добавить линию тренда».

8. Указываем тип линии тренда: линейная ( ).

9. Указываем параметры линии тренда:

-название

-показать уравнение на диаграмме.

График 1.

Список литературы

1. Морозевич А.Н. Основы экономической информатики: Учеб.пособие – Мн.: БГЭУ, 2000. 438с.

2. Родичев Ю.А. Информационная безопасность: нормативно-правовые аспекты: учеб.пособие для вузов/ Ю.А. Родичев. – СПб.: Питер, 2008. – 272с.

3. Семенов Ю.А. Алгоритмы телекоммуникационных сетей: учеб.пособие. Ч.1: Алгоритмы и протоколы каналов и сетей передачи данных/ Ю.А. Семенов. – М.: Интернет – Университет Информационных Технологий: БИНОМ. Лаборатория знаний, 2007. – 637с.

4. Скриба С.И. Экономико-статистическое моделирование и прогнозирование средствами VSExcel: Учеб пособие / С.И. Скриба, Н.Н. Скриба. – Мн.: БГЭУ, 2002. – 171с.

5. http://gendocs.ru/v2913/лекции_-_базы_знаний_и_экспертные_системы?page=2

ОТКРЫТЬ САМ ДОКУМЕНТ В НОВОМ ОКНЕ

ДОБАВИТЬ КОММЕНТАРИЙ [можно без регистрации]

Ваше имя:

Комментарий