Смекни!
smekni.com

по истории науки на тему: “Развитие реляционной модели представления данных ” (стр. 1 из 4)

Санкт-Петербургский политехнический университет

Факультет управления и информационных технологий

Кафедра компьютерных интеллектуальных технологий в проектировании

Реферат

по истории науки

на тему: “Развитие реляционной модели представления данных ”

научный руководитель, к.т.н., проф.: Курочкин М.А.

выполнила, асп.: Петрова М.А.

Санкт-Петербург

2006


БАЗЫ ДАННЫХ, РЕЛЯЦИОННАЯ МОДЕЛЬ, СУБД, СТАНДАРТ SQL, ЯЗЫК ОПИСАНИЯ ДАННЫХ.

Реферат, страниц: 17, литература: 10 источников.

Реферат посвящён.

Содержание

Реляционная модель данных

Базой данных (БД) называют специальным образом форматированную информацию, хранимую на машинном носителе... С базой данных непосредственно работает система управления базой данных (СУБД) [8].

В широком смысле система управления базами данных (СУБД) - это комплекс языковых и программных средств, предназначенных для создания и эксплуатации базы данных. В узком смысле СУБД - это комплекс программ, обеспечивающих интерфейс (взаимосвязь) прикладных программ и базы данных во время ее эксплуатации [8].

В состав СУБД входит язык определения данных - Data Definition Language (DDL) [8].

Данные и доступ к ним могут быть организованы разными способами, что определяется моделью данных, которую поддерживает конкретная СУБД.

Приведенное ниже определение, позволяет эффективно разделить модель данных и ее реализацию.

Модель данных — это абстрактное, самодостаточное, логическое определение объектов, операторов и прочих элементов, в совокупности составляющих абст­рактную машину, с которой взаимодействует пользователь. Упомянутые объекты
позволяют моделировать структуру данных, а операторы — поведение данных [7].

Реализация (implementation) заданной модели данных — это физическое вопло­щение на реальной машине компонентов абстрактной машины, которые в сово­купности составляют эту модель [7].

Каждая СУБД использует одну, редко несколько моделей данных. Модель данных CУБД реализуется двумя языками - языком определения данных (ЯОД) и языком манипулирования данными (ЯМД), т.е. модель данных СУБД - это упорядоченная пара: áЯОД СУБД, ЯМД СУБДñ [8].

В начале 70-80-х годов существовало множество различных моделей данных, наиболее популярными из которых являлись:

иерархическая модель данных,

сетевая модель данных

и реляционная модель данных [2].

Эволюция развития различных моделей данных хорошо прослеживается в книгах К. Дж. Дейта «Введение в теорию баз данных», которые являются классическим учебниками по курсу «Теория баз данных» на протяжении последних 30 лет. Если в первых изданиях книги все три подхода рассматривались равноценно, то в последних изданиях иерархическая и сетевая модели данных описываются как альтернативные дополнительные подходы: прежде всего, старые (дореляционные) системы можно разделить на три большие категории, а именно: системы инвертированных списков (inverted list), иерархические (hierarchic) и сетевые (network). В данной книге мы не будем подробно рассматривать эти категории, по­скольку, по крайней мере, с точки зрения технологии, их можно считать устаревшими [7].

В настоящее время большинство современных систем управления базой данных основаны на реляционной модели данных.

Реляционная модель данных была впервые описана доктором Э.Ф. Коддом в 1970 году. Изначально реляционная модель вызвала больше академический (статья доктора Э. Ф. Кодда вызвала волну исследований в области реляционных баз данных, включая большой исследовательский проект компании IBM. Цель этого проекта, названного System/R, заключалась в том, чтобы доказать работоспособность реляционной модели и приобрести опыт реализации реляционной СУБД.[4]), чем практический интерес. В процессе исследования вновь появившейся модели, ряд компаний, заметив явные ее преимущества, поспешили предложить собственные коммерческие реализации этого реляционного подхода. Однако не все разработанные СУБД реализовывали реляционную модель полностью. Чтобы избежать некорректного использования термина «реляционный» в 1985 году доктор Кодд написал статью, где сформулировал 12 правил, которые должны быть необходимо выполнены в любой реляционной СУБД. Данные 12 правил считаются определением реляционной СУБД.

Для дальнейшего рассмотрения, можно воспользоваться упрощенным определением:

Реляционной называется база данных, в которой все данные, доступные пользователю, организованы в виде таблиц, а все операции над данными сводятся к операциям над этими таблицами [4].

В основе представления и обработки данных в виде таблиц лежит абстрактная теория данных, основанная на некоторых положениях математики (в основном, теории множеств и логики предикатов) [7]. Таким образом, объекты реляционной модели имеют точное формальное математическое описание, на основе которого и был разработан стандарт языка описания данных, позволяющий описывать таблицы и связи между ними в современных СУБД. Несмотря на то что, математическая теория предоставила инструменты для точного и полного описания методов представления и обработки данных, реализация реляционного подхода в СУБД происходила эволюционно:

В начале 60-х и начале 70-х годов стали появляться специализированные компьютерные программы, предназначенные для решения этой [хранение и обработка данных] задачи и известные под названием системы управления базами данных (СУБД) [4].

Исследуя возможности упрощения структуры базы данных, научный сотрудник компании IBM доктор Э.Ф. Кодд, предложил использование новой реляционной модели представления данных. В июне 1970 года доктор Э.Ф. Кодд опубликовал в журнале Communications of the Association for Computing Machinery статью под названием «Реляционная модель для больших банков совместно используемых данных» («A Relational Model of Data for Large Shared Data Banks»), в которой в общих чертах была изложена математическая теория хранения данных в табличной форме и их обработки. От этой статьи ведут свое начало реляционные базы данных и SQL… Статья доктора Кодда вызвала волну исследований в области реляционных баз данных, включая большой исследовательский проект компании IBM. … Кроме разработки самой СУБД в рамках проекта System/R проводилась работа над созданием языков запроса к базе данных.[4] Первая статья с описанием языка запроса вышла в 1974 году. Опытная эксплуатация проекта System/R состоялась в 1978 году, а в 1979 году уже появилась первая коммерческая версия реляционной СУБД компании Oracle. В начале 80-х годов появляется еще несколько реализаций реляционных СУБД и в 1986 году ANSI принимает первый стандарт SQL1. С этого момента начинается коммерческое признание реляционных СУБД и активное развитие реляционной модели представления данных.


Реляционная модель данных

Математической абстракцией реляционной модели данных является реляционная алгебра [8].

Если A1, A2, ¼, An ¾ множества, то любое подмножество a Í A1´A2´ ¼ ´An, или любой элемент булеана (множества всех подмножеств) a Î P(A1´A2´ ¼ ´An), называют отношением между множествами A1, A2, ¼, An, т. е. отношение ¾ это множество упорядоченных «кортежей», в которых первый член является элементом множества A1, второй ¾ элементом множества A2 и т.д. [8]. Таким образом, можно сказать, что отношение состоит из ряда атрибутов, а степень отношения есть число атрибутов в отношении. В свою очередь, совокупность всех кортежей для отношения называется таблицей, а определение совокупности отношений оставляет определение базы данных [9].

Атрибут есть неразложимый элемент именованных данных [9]. Несущее множество реляционной алгебры состоит из элементов, которые конструируются из элементов двух словарных множеств. Одно из этих множеств обозначим N и будем называть множеством имен атрибутов, а другое обозначим V и будем называть множеством значений атрибутов [8]. Тогда отображение Dom : N ® P(V) определяется условием: если A Î N, то Dom(A) = imT A. Пару á A, Dom(A)ñ называют атрибутом с именем A и доменом Dom(A). [8]. Из этого определения также видно, что домен есть совокупность значений, которые можно ассоциировать с одним или более атрибутом [9]. Функция Dom : N ® P(V) разбивает множество N на классы эквивалентности имен атрибутов. Эквивалентность атрибутов A, B Î N означает, что Dom(A) = Dom(B) , т. е. этим именам атрибутов назначена одна и та же область значений. Например, именам атрибутов ВЕС и ВЫСОТА может быть назначена одна и та же область значений ¾ множество положительных вещественных чисел [8].

В реляционной модели отношения обладают определенными свойствами, причем все они очень важны и вытекают непосредственно из приведенного выше определения отношения:

- все кортежи отношения различны;

- все атрибуты отношения различны;

- кортежи отношения не имеют упорядоченности;

- каждый кортеж содержит ровно одно значение для каждого атрибута,

- отношение может не содержать ни одного кортежа (так как пустое множество также есть отношение);

- отношение должно содержать, по крайней мере, один атрибут;

- множество атрибутов различных отношений могут пересекаться;

- множества кортежей различных отношений могут пересекаться.

Так как все кортежи отношения необходимо различны, то каждое отношение будет иметь некоторую комбинацию атрибутов, которые, взятые вместе, будут однозначно идентифицировать кортеж в отношении [5]. Такая комбинация атрибутов в реляционной модели называется первичным ключом. Первичный ключ отношения может состоять как из одного атрибута, так и из всех атрибутов отношения.