Смекни!
smekni.com

Курс социально-экономической статистики (стр. 21 из 182)

Другим методом, используемым для построения классификационной структуры классификаторов, является фасетный метод, заключающийся в параллельном разделении множества объектов на независимые классификационные группировки. В этом методе классификационное множество объектов информации описывается набором независимых признаков (фасетов), которые не имеют жесткой взаимосвязи друг с другом и могут использоваться отдельно для решения различных задач.

Например, в Общероссийском классификаторе информации о населении (ОКИН) используются следующие фасеты: пол, гражданство, национальность, язык, родство и др. При этом название фасета совпадает с названием признака, по значениям которого в фасете представлен перечень соответствующих объектов классификации — элементов классифицируемого множества.

Емкость такой классификации зависит от числа фасетов и от количества значений признаков в фасете.

При построении фасетной классификации необходимо соблюдать следующие основные правила:

- значения различных фасетов не должны пересекаться (принцип исключения фасетов);

- из всевозможных фасетов, характеризующих классифицируемое множество объектов, должны отбираться и фиксироваться только . существенные для решения конкретных задач.

Основное преимущество фасетной классификации обусловлено гибкостью структуры ее построения. Изменения в любом из фасетов не оказывают существенного влияния на остальные фасеты. Большая гибкость фасетной классификации обусловливает ее приспосабливаемость к меняющемуся характеру задач, для решения которых она создается. Фасетная классификация позволяет не только образовывать новые классификационные группировки в имеющихся фасетах, но и включать новые и исключать старые фасеты. Гибкость фасетной классификации дает возможность агрегировать объекты и осуществлять информационный поиск по любому сочетанию фасетов.

Применение фасетной системы позволяет осуществлять блочное построение классификаторов с выделением идентификационного блока.

Недостатки фасетной классификации — неполное использование емкости, обусловленное отсутствием на практике многих из возможных сочетаний фасетов, и нетрадиционность в применении.

Выбор методов классификации и кодирования технико-экономической и социальной информации в каждом конкретном случае осуществляется разработчиком классификатора.

В зависимости от специфики информации и области применения классификаторов в них возможно применение различных сочетаний методов классификации.

Рассмотрим систему кодирования технико-экономической и социальной информации, состоящую из методов и правил кодирования классификационных группировок и объектов классификационного множества.

В процессе кодирования объектам классификации и их группировкам по определенным правилам присваиваются цифровые, буквенные или буквенно-цифровые коды (кодовые обозначения), обеспечивающие их однозначную идентификацию с помощью знаков (символов).

Кодирование предназначено для формализованного описания заданного множества объектов, которое позволяет производить автоматизированную обработку информации. При описании процесса кодирования информации используют определенные термины и понятия.

Код классификационной группировки — это знак или совокупность знаков, принятых для обозначения классификационной группировки и(или) объекта классификации. В качестве синонимов кода используются слова и словосочетания: кодовое обозначение, кодовая комбинация, шифр, индекс, код объекта. Код образуется в соответствии с правилами кодирования, принятыми в данной системе кодирования, и характеризуется его длиной и структурой.

Длина кода — число знаков в коде без учета пробелов.

Разряд кода — позиция знака в коде.

Структура кода — условное обозначение состава и последовательности расположения знаков в коде.

Алфавит кода — система знаков, принятых для образования кода.

Алфавит кода буквенный — алфавит кода, знаками которого являются буквы алфавитов естественных языков.

Алфавит кода буквенио-цифровой — алфавит кода, знаками которого являются буквы алфавитов естественных языков и цифры.

Алфавит кода цифровой — алфавит кода, знаками которого являются цифры.

При разработке классификаторов используются следующие методы кодирования.

Последовательный метод кодирования — образование кода классификационной группировки и(или) объекта классификации с использованием кодов последовательно расположенных подчиненных группировок, полученных при иерархическом методе классификации.

Преимуществом этого метода кодирования является простота, а недостатком — негибкая структура, присущая иерархическому методу классификации.

Параллельный метод кодирования — образование кода классификационной группировки и(или) объекта классификации с использованием кодов независимых группировок, полученных при фасетном методе классификации,

Этот метод кодирования вследствие его блочной структуры хорошо приспособлен для часто изменяющихся задач. К недостаткам следует отнести избыточность метода и необходимость кодирования самих фасетов для однозначной идентификации входящих в фасеты объектов, поскольку все фасеты входят в состав одного классификатора.

Порядковый метод кодирования — образование кода из чисел натурального ряда путем сквозной регистрации объектов. Данный метод обладает наибольшей полнотой и простотой для идентификации объектов. Но применение его в чистом виде неэффективно, так как на его основе трудно получить итоги по объектам со сходными признаками.

Серийно-порядковый метод кодирования — образование кода из чисел натурального ряда, закрепление отдельных серий или диапазонов этих чисел за объектами классификации с одинаковыми признаками.

Например, с 1-го номера по 10-й закодирована одна группа объектов, с 11-го по 30-й — другая, с 31-го по 100-й — третья группа.

Этот метод целесообразно применять для объектов, имеющих два или несколько порядковых признаков.

На практике методы кодирования в чистом виде применяются редко, в основном используются их различные комбинации. Выбор методов кодирования зависит от назначения классификатора и решаемых задач.

7.3. Система ведения общероссийских классификаторов; переходные ключи и система информационной поддержки классификаторов

Процесс постоянного накопления знаний, рост многообразия социальных явлений, развитие производства и создание новых технологий приводят к постепенному устареванию классификаторов в части адекватного отображения классифицируемой информации.

В этой связи возникает необходимость в обновлении классификаторов, внесении в них изменений, перегруппировании и перекодировании объектов информации.

Процесс поддержания классификаторов в «достоверном» состоянии, обеспечения полноты информации и ее распространения среди пользователей называется ведением классификаторов. При этом средства и соответствующая организационная структура составляют систему ведения классификаторов.

В процессе ведения классификаторов .совершенствуются их состав и содержание, но не нарушаются принципы их построения и целостная структура, последние могут претерпевать изменение только при пересмотре классификаторов.

Ведение классификатора заключается в подготовке и внесении в него изменений в части включения, аннулирования или изменения кодов и наименований классификационных группировок или иной информации, являющейся его частью. Изменения могут вноситься во введение к классификатору, в алфавитно-предметный указатель, в приложения; в пояснения, раскрывающие содержание группировок; в определения категорий, используемых в классификаторе.

Изменения основываются на законодательных и нормативных актах, разрабатываемых органами государственной власти и управления Российской Федерации; отечественных, зарубежных и международных стандартах; документах директивного характера, общероссийских унифицированных системах документации.

Разрабатываются они министерствами, ведомствами Российской Федерации, ответственными за ведение соответствующих классификаторов. Проекты изменений к общероссийским классификаторам согласовываются с организациями обязательного согласования, при необходимости — с другими заинтересованными организациями и утверждаются по поручению Госстандарта России Всероссийским НИИ классификации, терминологии и информации по стандартизации и качеству (ВНИИКИ) Госстандарта России.

Информационное обслуживание пользователей изменениями по общероссийским классификаторам осуществляется ВНИИКИ, Главным межрегиональным центром обработки и распространения статистической информации Государственного комитета РФ по статистике (ГМЦ) или организациями, на которые министерствами и ведомствами возложены эти функции.

Система автоматизированного ведения общероссийских классификаторов базируется на распределенной по регионам информационно-вычислительной сети государственной статистики, в рамках которой функционирует автоматизированный банк классификаторов (АБК), который обеспечивает пользователей актуализированными версиями общероссийских классификаторов, а также информацией о их составе, структуре, количестве и сроках внесенных в них изменений.