Смекни!
smekni.com

Разработка систем хранения информации на RAID-массивах (стр. 1 из 3)

КУРСОВОЙ ПРОЕКТ

на тему: «Разработка систем хранения информации на RAID – массивах»


Содержание

Введение

1. Разработка систем хранения информации на RAID – массивах

1.1 Основные понятия RAID – массива

1.2 Принцип функционирования RAID – массива

2. Классификация RAID – массивов. Достоинства и недостатки

3. Тестовая разработка RAID – массива

Заключение

Список использованных источников


Введение

В конце XX века невозможно представить себе жизнь без компьютера. Компьютер прочно вошел в нашу жизнь, став главным помощником человека. С развитием информационных технологии перед человеком стала задача о надёжном хранении информации и её быстрой передачи. Для этого стали применять технологию RAID – (Redundant Array of Independent Disks) – избыточный массив независимых дисков. С помощью RAID массива можно построить эффективную и надёжную систему хранения данных.

Цель курсовой работы является разработка систем хранения информации на RAID – массивах.

Задачи курсовой работы:

– изучение основы создания RAID – массивов;

– принцип работы и функционирование RAID-массива;

– классификация;

– достоинства и недостатки каждой RAID системы.

При написании курсовой работы будет протестирована технология создание массива Intel Matrix RAID который объединил две системы RAID 0 и RAID 1. Данные тестирования будут отражены на графиках.


1. Разработка систем хранения информации на RAID – массивах

1.1 Основные понятия RAID – массива

При создании RAID – массива необходимо учитывать, то не каждая материнская плата поддерживает эту функцию. К примеру можно привести материнскую плату MA790FXT-UD5F компании Gigabyte (Рисунок 1).

Рисунок 1 – Схема расположения RAID-контроллера JMicron JM322 и встроенного RAID – контроллера в северном мосту

Материнская плата построена на чипсете AMD 790FX/SB750 и поддерживает все процессоры Socket AM3 и память DDR3. Хотя чипсет поддерживает шесть портов SATA/300, Gigabyte решила увеличить возможности установки накопителей, добавив контроллер JMicron JM322. Он даёт четыре дополнительных порта SATA/300 (белые разъёмы). В данной материнской плате поддерживают RAID – массивы 0,1и 5.

При записи данных на диск компьютер записывает контрольную сумму и при дальнейшем обращении к этим данным он проверяет начальное значение контрольной суммы и конечное, если результат проверки совпадает значит данные в целостности и их можно использовать по назначению. В RAID – массивах контрольная сумма хранится по разному. В некоторых RAID массивах выделяется специально отдельный диск и даже если какой-то из дисков откажет то информацию можно будет восстановить. Но большинство RAID – массивов хранит контрольную суммы на том же диски где хранится информация.

В основе разработки RAID лежат пять основных принципов. Это Массив (Array), Зеркалирование (Mirroring), Дуплекс (Duplexing), Чередование (Striping) и Четность (Parity).

Массивом называют несколько накопителей, которые централизованно настраиваются, форматируются и управляются. Логический массив – это уже более высокий уровень представления, на котором не учитываются физические характеристики системы. Соответственно, логические диски могут по количеству и объему не совпадать с физическими. Но лучше все-таки соблюдать соответствие: физический диск – логический диск. Для операционной системы вообще весь массив является одним большим диском.

Зеркалирование – технология (Рисунок 2), позволяющая повысить надежность системы. В RAID массиве с зеркалированием все данные одновременно пишутся не на один, а на два жестких диска. То есть создается «зеркало» данных. При выходе из строя одного из дисков вся информация остается сохраненной на втором.


Рисунок 2 – Способ зеркалирования

Дуплекс – развитие идеи зеркалирования (Рисунок 3). В этом случае так же высок уровень надежности и требуется в два раза больше жестких дисков. Но появляются дополнительные затраты: для повышения надежности в систему устанавливаются два независимых RAID контроллера. Выход из строя одного диска или контроллера не сказывается на работоспособности системы.

Рисунок 3 – Дуплексный способ

Столь дорогое решение используется только во внешних RAID-массивах, предназначенных для ответственных приложений.

Чередование – Повышение быстродействия системы (Рисунок 4). Если чтение и запись вести параллельно на нескольких жестких дисках, можно получить выигрыш в скорости.

Записываемый файл разбивается на части определенного размера и посылается одновременно на все имеющиеся накопители. В таком фрагментированном виде файл и хранится. Считывается он тоже «по кусочкам».

Рисунок 4 – Способ чередования

Размер «кусочка» может быть минимальным – 1 байт, но чаще используют более крупное дробление – по 512 байт (размер сектора).

Четность является альтернативным решением, соединяющим в себе достоинства зеркалирования (высокая надежность) и чередования (высокая скорость работы). Используется тот же принцип, что и в контроле четности оперативной памяти. Если имеется I блоков данных и на их основе вычисляется еще один дополнительный экстраблок, из получившихся (I+1) блоков всегда можно восстановить информацию даже при повреждении одного из них. Соответственно, для создания нормального RAID-массива в этом случае требуется (I+1) жесткий диск. Распределение блоков по дискам точно такое же, как при чередовании. Экстраблок может записываться на отдельный накопитель, либо раскидываться по дискам.

Обычно каждый бит экстраблока состоит из суммы бит всех I блоков, точнее из результата выполнения логической операции XOR. Многие помнят со школы, что XOR – удивительный оператор, при его повторном наложении мы можем получить первоначальный результат. То есть (A XOR B) XOR B = A. Это правило распространяется на любое количество операндов.

Плюсы четности очевидны. За счет использования чередования повышается скорость работы. При зеркалировании надежность сохраняется, но при этом «нерабочий» объем массива заметно уменьшается, он одинаков при любом количестве дисков и составляет емкость одного диска, то есть при 5 дисках в массиве пропадает всего 20% емкости.

Но у четности есть весомый минус. Для формирования экстраблоков требуются вычисления! Их надо делать на лету, причем с миллионами, миллиардами бит! Если это дело поручить центральному процессору, мы получим очень «медленную» систему. Необходимо использовать довольно дорогие платы с RAID-контроллерами, которые «берут все вычисления на себя». В случае выхода из строя одного из дисков, процесс восстановления будет не столь быстрым, как при зеркалировании.

1.2 Принцип функционирования RAID – массива

Принцип функционирования RAID-системы заключается в следующем: из набора дисковых накопителей создается массив, который управляется специальным контроллером и определяется компьютером как единый логический диск большой емкости. За счет параллельного выполнения операций ввода-вывода обеспечивается высокое быстродействие системы, а повышенная надежность хранения информации достигается дублированием данных или вычислением контрольных сумм.

Следует отметить, что применение RAID-массивов защищает от потерь данных только в случае физического отказа жестких дисков.

Различают несколько основных уровней RAID-массивов: RAID 0, 1, 2, 3, 5, 6, 7. Также существуют комбинированные уровни, такие как RAID 10, 0+1, 30, 50, 53 и т.п.


2. Классификация RAID – массивов. Достоинства и недостатки

JBOD (Just a Bunch Of Drives)

В операционной системе Windows JBOD-массив называется spanned disk (Рисунок 5). Это не уровень RAID, а дополнительная функция некоторых рейд контроллеров. Применяется в случае, если пользователь хочет использовать суммарную емкость нескольких жестких дисков, имеющих разный объем. Однако, кроме увеличения емкости, от этого способа объединения жестких дисков других существенных преимуществ нет.

Рисунок 5 – Размещение данных на дисках массива организации JBOD

Характеристики JBOD массива:

- Размер массива равен суммарному объему всех дисков;

- Вероятность отказа повышается, так как избыточность не обеспечивается, в случае выхода из строя любого из дисков, массив разрушается;

- Временные характеристики определяют самый медленный и самый быстрый диски;

- Скорость чтения и записи не выше, чем у самого быстрого диска в массиве и не ниже чем у самого медленного диска;

- Нагрузка на процессор при работе минимальная такая же как при работе с обычным диском.

Особенности JBOD массива:

- Отказ одного диска позволяет восстановить файлы на остальных дисках, если их начало / конец не принадлежат отказавшему диску;

- В ряде случаев возможно обеспечение высокой скорости работы нескольких приложений, если приложения работают данными на разных дисках;

- Рейд может состоять из дисков различной емкости и быстродействия.

RAID 0

Дисковый массив без отказоустойчивости (Striped Disk Array without Fault Tolerance) (Рисунок 6). Дисковый массив без избыточного хранения данных. Информация разбивается на блоки, которые одновременно записываются на отдельные диски, что обеспечивает повышение производительности. Такой способ хранения информации ненадежен, поскольку поломка одного диска приводит к потере всей информации, поэтому уровнем RAID как таковым не является.

Рисунок 6-массив RAID 0

RAID 0 – дешевый и производительный, но ненадежный. За счет возможности одновременного ввода / вывода с нескольких дисков массива RAID 0 обеспечивает максимальную скорость передачи данных и максимальную эффективность использования дискового пространства, так как не требуется места для хранения контрольных сумм. Реализация этого уровня очень проста. RAID 0, как правило, применяется в тех областях, где требуется быстрая передача большого объема данных. Для реализации массива требуется не меньше двух винчестеров.