Смекни!
smekni.com

Разработки автоматизированной информационной системы по начислению заработной платы по 18-разряд (стр. 2 из 8)

1.2. Методы классификации (иерархический и фасетный)

Информация характеризуется большим количеством объектов. Большое значение имеет классификация информации. Разработаны три метода классификации объектов: иерархический, фасетный, дескрипторный. Эти методы различаются разной стратегией применения классификационных признаков. Рассмотрим основные идеи этих методов для создания систем классификации.

Иерархическая система классификации. Эта система строится следующим образом:

1. Исходное множество элементов составляет нулевой уровень и делится в зависимости от выбранного классификационного признака на классы (группировки), которые образуют первый уровень.

2. Каждый класс первого уровня в соответствии со своим, характерным для него классификационным признаком делится на подклассы, которые образуют второй уровень.

3. Каждый класс второго уровня аналогично делится на группы, которые образуют третий уровень.

0-й уровень

1-й уровень

2-й уровень

3-й уровень

Рис. 1Иерархическая система классификации.

Учитывая достаточно жёсткую процедуру построения структуры классификации, необходимо перед началом работы определить её цель, то есть какими свойствами должны обладать объединяемые в классы объекты. Эти свойства принимаются в дальнейшем за признаки классификации. В иерархической системе классификации из-за жёсткой структуры особое внимание следует уделить выбору классификационных признаков.

В иерархической системе классификации каждый объект на любом уровне должен быть отнесен к одному классу, который характеризуется конкретным значением выбранного классификационного признака. Для последующей группировки в каждом классе необходимо знать свои классификационные признаки и их значение. Таким образом, выбор классификационных признаков будет зависеть от семантического содержания того класса, для которого необходима группировка на последующем уровне иерархии.

Количество уровней классификации, соответствующее числу признаков, выбранных в качестве основания деления, характеризует глубину классификации.

Достоинства иерархической системы классификации:

1. Простота построения.

2. Использование независимых классификационных признаков в различных ветвях иерархической структуры.

Недостатки иерархической системы классификации:

1. Жёсткая структура, которая приводит к сложности внесения изменений, так как приходится перераспределять все классификационные группировки.

2. Невозможно группировать объекты по заранее не предусмотренным сочетаниям признаков.

Например, поставлена задача – создать иерархическую систему классификации для информационного объекта «Факультет», которая позволит классифицировать информацию обо всех студентах по следующим классификационным признакам: факультет, на котором он учится, возрастной состав студентов, пол студента, для женщин - наличие детей.

Рис. 2 Пример иерархической системы классификации для информационного объекта Факультет.

Система классификации будет иметь следующие уровни:

0-й уровень. Информационный объект «Факультет».

1-й уровень. Выбирается классификационный признак – название факультета, что позволяет выделить несколько классов с разными названиями факультетов, в которых хранится информация обо всех студентах.

2-й уровень. Выбирается классификационный признак – возраст, который имеет три градации: до 20 лет, от 20 до 30 лет, свыше 30 лет. По каждому факультету выделяются три возрастных подкласса студентов.

3-й уровень. Выбирается классификационный признак – пол. Каждый подкласс 2-го уровня разбивается на две группы. Таким образом, информация о студентах каждого факультета в каждом возрастном подклассе разделяется на две группы – мужчин и женщин.

4-й уровень. Выбирается классификационный признак – наличие детей у женщин: есть, нет.

Создание иерархической системы классификации имеет глубину классификации равную четырем. Он удобен тем, что позволяет выделить функционально подчинённые объекты. Данную систему классификации можно наглядно увидеть на рисунке 2.

Рассмотрим фасетную систему классификации.

Фасетнаясистема классификации в отличии от иерархической позволяет выбирать признаки классификации независимо как друг от друга, так и от семантического содержания классифицируемого объекта. Признаки классификации называются фасетами(facet – рамка). Каждый фасет содержит совокупность однородных значений данного классификационного признака. Причем значения в фасете могут располагаться в произвольном порядке, хотя предпочтительнее их упорядочение.

Например, фасет цвет содержит значение красный, белый, зелёный, чёрный, жёлтый. Фасет специальность содержит названия специальностей. Фасет образование содержит значения среднее, среднее специальное, высшее. Фасетнаяклассификация предполагает использование независимых классификационных признаков. Характерно, что признаки внутри фасетов могут иметь иерархическую структуру. Фасетный метод классификации можно рассматривать как некоторую комбинацию иерархического и многоаспектного методов. Этот метод классификации удобен для сложной логической обработки информации.

Схема построения фасетной системы классификации в виде таблицы отображена на рисунке 3.Название столбцов соответствует выделенным классификационным признакам (фасетам), обозначенным Ф1, Ф2, …, Фi, …, Фn.Например, цвет, размер одежды, вес. Произведена нумерация строк таблицы. В каждой клетке таблицы хранится конкретное значение фасета. Например, фасет цвет, обозначенный Ф2, содержит значения: красный, жёлтый, зелёный, белый, чёрный.

Ф1 Ф2 Ф3 Ф4 Ф5
О О О О О
О О О О О
О О О О
О О

1

2

Значения

фасетов

к

Рис. 3. Фасетная система классификации.

Процедура классификации состоит в присвоении каждому объекту соответствующих значений из фасетов. При этом могут быть использованы не все фасеты. Для каждого объекта задаётся конкретная группировка фасетов структурной формулой, в которой отражается их порядок следования.

При построении фасетной системы классификации необходимо, чтобы значения, используемые в различных фасетах, не повторялись. Фасетную систему легко можно модифицировать, внося изменения в конкретные значения любого фасета.