Методы классификации и кодирования ТЭСИ

ФЕДЕРАЛЬНОЕ АГЕНТСТВО МОРСКОГО И РЕЧНОГО ТРАНСПОРТА ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ МОРСКОЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

ФЕДЕРАЛЬНОЕ АГЕНТСТВО МОРСКОГО И РЕЧНОГО ТРАНСПОРТА

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ

МОРСКОЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

имени адмирала Г.И.Невельского

ИНСТИТУТ ВОСТОЧНОЙ АЗИИ

Факультет документоведения и регионоведения

Кафедра документоведения и регионоведения

РЕФЕРАТ

Методы кодирования и классификации ТЭСИ

Проверил преподаватель

___________А. С. Заколодная

___________2010

Выполнила студентка

группы 1855

________М. В. Смирнова

________2010

Владивосток

2010

Оглавление

Введение………………………………………………………………………..….3

Глава 1. История развития Единой системы классификации и кодирования технико-экономической и социальной информации в России…………….…..4

Глава 2.Методы кодирования и классификации технико-экономической и социальной информации……………………………………………………........8

Заключение……………………………………………………………………….17

Список источников и литературы……………………………………………....18

Введение

Данная работа посвящена изучению методов кодирования и классификации технико-экономической и социальной информации (ТЭСИ).

Классификатор ТЭСИ – это нормативный документ, предоставляющий систематизированный свод наименований и кодов, классификационных группировок и объектов классификации.

Цель: изучить методы кодирования и классификации ТЭСИ.

Задачи:

1) изучить историю развития ЕСКК ТЭСИ;

2) рассмотреть методы кодирования и классификации ТЭСИ.

Соответственно цели и задачам основная часть данной работы состоит из двух глав. Общая структура выглядит следующим образом: введение, две главы, заключение и список использованных источников и литературы.

Глава 1. История развития Единой системы классификации и кодирования технико-экономической и социальной информации в России

Проблема создания единого информационного пространства приобрела особое значение в нашей стране уже в начале 70-х годов в связи с разработкой Общегосударственной автоматизированной системы сбора и обработки информации для целей планирования и управления народным хозяйством (ОГАС). Создание этой системы потребовало решения целого ряда важных вопросов. Среди них не последнее значение имел вопрос о разработке единых методических принципов построения информационного обеспечения ОГАС. Необходимо было установить единые требования к носителям информации, разработать единый язык формализованного описания данных, закрепить общие методические принципы организации технологического процесса обработки данных.

Одним из направлений решения этой важной задачи стала разработка ЕСКК ТЭСИ. Координация всех работ по созданию ЕСКК ТЭСИ и разработка основополагающих нормативно-технических и организационно-методических документов была возложена на Госстандарт СССР и Всесоюзный научно-исследовательский институт технической информации, классификации и кодирования (ВНИИКИ). Особенно активно работа по созданию ЕСКК ТЭСИ стала проводиться после принятия в 1971 году специального постановления Совета Министров СССР.

Основной целью, которая ставилась перед ЕСКК ТЭСИ, являлась стандартизация информационного обеспечения процессов управления хозяйством страны на основе применения средств вычислительной техники и новых информационных технологий путем создания единого языка формализованного описания данных.[1]

Изменения, происходящие в стране с начала 90-х годов, не только не сняли с повестки дня потребность в едином стандартном языке формализованного описания данных, но наглядно показали, что без этого языка невозможно создание единого информационного пространства не только России, но тем более обеспечение вхождения России в мировое информационное пространство.

Руководствуясь этими соображениями, в стране была принята Государственная программа перехода РФ на принятую в международной практике систему учета и статистики[2] , в составе которой был разработан специальный раздел "Развитие и применение Единой системы классификации и кодирования информации". Реализация Государственной программы была намечена на 1993 – 1995 годы. В этот период был проведен пересмотр ряда общесоюзных классификаторов и придание им статуса общероссийских классификаторов, велась разработка новых общероссийских классификаторов и основополагающих нормативно-методических документов по ЕСКК РФ[3] .

Понимая значение классификаторов ТЭСИ как стандартного языка формализованного описания данных, Правительство РФ приняло 1 ноября 1999 года специальное постановление “О развитии единой системы классификации и кодирования технико-экономической и социальной информации”, в котором определены организации, ответственные за дальнейшее развитие ЕСКК ТЭСИ, и закреплены общие принципы функционирования единой системы классификации и кодирования технико-экономической и социальной информации:
– учет социально-экономических изменений в стране;
– открытость и общедоступность системы кодирования для пользователей в той части, которая не содержит сведений, составляющих государственную тайну;
– автоматизация процесса обработки технико-экономической и социальной информации;
– обеспечение методического и организационного единства системы кодирования;
– комплексность системы кодирования, предусматривающая наиболее полный охват технико-экономической и социальной информации, используемой при межотраслевом обмене;
– постоянная актуализация ТЭСИ;
– обязательность применения системы кодирования при формировании государственных информационных систем и ресурсов;
– совместимость системы кодирования и других государственных информационных систем и ресурсов и их взаимодействие в едином информационном пространстве Российской Федерации на основе использования системы кодирования;
– гармонизация системы кодирования с международными и региональными классификациями и стандартами.

Основными задачами ЕСКК РФ являются:
– классификация и кодирование технико-экономической и социальной информации;
– упорядочение и унификация технико-экономических и социальных показателей;
– обеспечение однозначности и сопоставимости данных, используемых при описании

– создание условий для автоматизации процессов обработки информации, включая создание автоматизированных банков данных;
– создание распределенного автоматизированного банка общероссийских классификаторов;
– создание комплекса взаимоувязанных общероссийских классификаторов и общероссийских форм документов и обеспечение их ведения;
– использование в отечественной практике международного и национального зарубежного опыта работ по классификации и кодированию информации.

ЕСКК ТЭСИ состоит из совокупности общероссийских классификаторов технико-экономической и социальной информации, средств их ведение, нормативных и методических документов по их разработке, ведению и применению.

Объектами классификации и кодирования в ЕСКК ТЭСИ РФ являются технико-экономические и социальные объекты и их свойства, используемые в различных областях хозяйственной деятельности.

Таким образом, можно сделать вывод, что ЕСКК ТЭСИ начала развиваться с 70-х годов, в связи с возникшей проблемой создания единого информационного пространства не только в России, но и обеспечение вхождения России в мировое пространство. И уже в начале 90-х годов принимается Государственная программа перехода России на систему учета и статистики, в которой был разработан специальный раздел, посвященный Единой системе классификации и кодирования информации.

Глава 2. Методы кодирования и классификации технико-экономической и социальной информации.

Классификатор ТЭСИ представляет собой систематизированный свод наименований и кодов классификационных группировок и (или) объектов классификации[4] .

Общероссийский классификатор (ОК) – классификатор, принятый Госстандартом РФ, входящий в состав ЕСКК ТЭСИ РФ и обязательный для применения на территории всей страны в определенных сферах деятельности, установленных разработчиком по согласованию с заинтересованными министерствами и ведомствами.

Общероссийские классификаторы ТЭСИ относятся к нормативным документам и по своему статусу соответствуют государственным стандартам РФ. Порядок разработки общероссийских классификаторов должен соответствовать требованиям ПР. 50.1-024 - 2005.

Общероссийские классификаторы разрабатываются в тех случаях, когда они:
– обеспечивают сопоставимость данных в различных областях и уровнях хозяйственной деятельности;
– обеспечивают гармонизацию с международными классификаторами;
– информационно связаны с действующими общероссийскими классификаторами;
– используются в общероссийских унифицированных формах документов.

Во всех других случаях разрабатываются отраслевые классификаторы ТЭСИ или классификаторы ТЭСИ предприятий.

Отраслевой классификатор ТЭСИ – классификатор, принятый министерством, ведомством РФ и обязательный для применения всеми предприятиями данного министерства, ведомства, государственными корпорациями и объединениями, на которые возложены функции осуществления научно-технической политики в отрасли.

Отраслевые классификаторы разрабатываются в тех случаях, когда они включают информацию, содержащуюся в унифицированных отраслевых формах документов и отсутствующую в общероссийских классификаторах, или представляют собой выборки из общероссийских классификаторов, в которых допускается перекодирование объектов классификации, дополнение отсутствующими в них объектами и признаками классификации. Статус этой категории классификаторов соответствует отраслевым стандартам.

Классификатор ТЭСИ предприятия – классификатор, принятый предприятием или объединением предприятий и применяемый только этими хозяйствующими субъектами. Классификаторы предприятий разрабатываются в тех случаях, когда они включают информацию, содержащуюся в унифицированных формах документов предприятия и отсутствующую в общероссийских и отраслевых классификаторах. Они могут быть и выборками из общероссийских или отраслевых классификаторов, в которых допускается перекодирование объектов классификации, дополнение отсутствующими в них объектами классификации и признаками классификации. Статус классификаторов предприятий соответствует стандартам предприятий.

Структура классификатора, как правило, должна иметь три блока: блок идентификации, включающий коды объектов классификации и классификационных группировок, блок наименований объектов и классификационных группировок на естественном языке и блок дополнительных признаков объектов, включающий наименования и коды дополнительных признаков объектов классификации.

Кроме трехблочной структуры классификаторы могут иметь и двухблочную структуру, когда выделяются только блоки идентификации и наименований. В структуре классификаторов могут выделяться и другие виды блоков, а также разделы. Выбор структуры построения классификаторов определяется характером объектов классификации, типом задач, для решения которых предназначен классификатор, и используемыми методами классификации и кодирования.

В классификаторах технико-экономической и социальной информации используются иерархический и фасетный методы классификации. Эти методы классификации должны отвечать следующим основным требованиям:
– обладать достаточной емкостью;
–иметь достаточную и экономически оправданную глубину;
– обладать определенной гибкостью и избыточностью для возможности расширения множества классифицируемых объектов, группировок и признаков и внесения необходимых изменений без нарушения структуры классификации;
– учитывать необходимость сопряжения с другими классификациями однородных объектов;
– обеспечивать наибольшую эффективность обработки информации средствами вычислительной техники при решении комплекса конкретных задач АСУ как внутри данной системы, так и при обмене информацией с взаимодействующими системами;
– предоставлять возможность ведения создаваемого классификатора, как в ручном, так и автоматизированном варианте организации процессов ведения.

Под иерархическим методом классификации понимается такой метод, при котором заданное множество объектов последовательно делится на подчиненные подмножества. При построении классификаторов иерархическим методом классификации необходимо соблюдать следующие правила:
– деление каждой классификационной группировки должно производиться только по одному основанию;
– получаемые в результате деления группировки не должны пересекаться, то есть содержать аналогичной информации, и должны относиться только к одной вышестоящей группировке;
– деление исходного множества на подмножества должно быть последовательным, без пропусков и без добавления промежуточного уровня классификации;
– классифицирование должно производиться таким образом, чтобы сумма подмножеств деления составляла делимое множество.

Иерархический метод классификации характеризуется глубиной классификации и емкостью. Количество ступеней определяет глубину классификации, которая устанавливается в зависимости от степени конкретизации группировок и числа признаков, необходимых для решения конкретных задач. От глубины и количества группировок, образуемых на каждой ступени классификации, зависит емкость системы. Как правило, наибольшее количество последующих группировок устанавливается постоянным, либо для всей классификации, либо для данной ступени. Для систем классификации технико-экономической информации это число всегда равно десяти или кратному десяти.

При иерархическом методе классификации практически не ограничивается глубина классификации информации, что дает возможность более детально анализировать предметы, явления или документы. Большая информационная емкость иерархического метода классификации позволяет использовать его для кодирования больших объемов технико-экономической информации. Несмотря на вышеперечисленные преимущества, этот метод имеет ряд существенных недостатков. Во-первых, это недостаточная гибкость структуры, обусловленная фиксированностью признаков классификации и заранее установленным порядком их следования, не допускающим включения новых объектов и классификационных группировок. Вследствие этого, изменение любого признака ведет к перераспределению классификационных группировок и необходимости переработки классификатора. Поэтому в классификаторах, построенных на основе иерархического метода, должны предусматриваться значительные резервные емкости. Во-вторых, этот метод классификации не позволяет осуществлять информационный поиск по любому произвольному сочетанию признаков.

Под фасетным методом классификации понимается такой метод, при котором классифицируемое множество делится на группировки независимо, по различным признакам классификации. Он не имеет жесткой классификационной структуры и заранее построенных конечных группировок. Классификационные группировки при фасетном методе классификации образуются путем комбинаций значений признаков, взятых из соответствующих фасетов (списков признаков, характеризующих объекты классификации). Последовательность использования фасетов при образовании классификационной группировки задается фасетной формулой. В каждом конкретном случае фасетная формула устанавливается в зависимости от характера решаемых задач и алгоритма обработки информации.

Емкость классификатора, построенного на основе фасетного метода классификации, зависит от числа фасетов и от количества признаков в фасетах.

При построении классификаторов на основе фасетного метода необходимо соблюдать следующие правила:
– значения признаков из различных фасетов не должны пересекаться;
– из всевозможных фасетов, характеризующих классифицируемое множество объектов, отбираются только существенные, то есть фасеты, обеспечивающие решение конкретных технико-экономических задач;
– фасеты должны занимать в классификаторе строго определенное место и иметь определенные идентификационные коды.

Основные преимущества фасетного метода классификации обусловлены его гибкостью. Изменения в любом из фасетов не оказывают влияния на остальные. Большая гибкость обуславливает приспосабливаемость метода классификации к меняющемуся характеру решаемых задач, для которых он создается. Фасетный метод классификации позволяет не только образовывать новые классификационные группировки из имеющихся фасетов, но и включать новые и исключать старые фасеты. Гибкость системы дает возможность осуществлять информационный поиск по любому сочетанию признаков.

В классификаторах ТЭСИ используются четыре метода кодирования информации. Порядковый метод кодирования – это такой метод, при котором кодами служат числа натурального ряда. В этом случае кодом каждого из объектов классифицируемого множества является его порядковый номер.
Данный метод кодирования обеспечивает довольно большую долговечность классификатора при незначительной избыточности кода. Этот метод обладает наибольшей простотой, использует наиболее короткие коды и лучше обеспечивает однозначность определения каждого объекта классификации. Кроме того, он обеспечивает наиболее простое присвоение кодов новым объектам, появляющимся в процессе ведения классификатора. Каждому новому объекту присваивается следующий по порядку номер.

Существенным недостатком порядкового метода кодирования является отсутствие в коде какой-либо конкретной информации о свойствах объекта, а также сложность машинной обработки информации при получении итогов по группе объектов классификации с одинаковыми признаками. Этот метод кодирования не обеспечивает возможности размещения вновь появившихся объектов классификации в необходимом месте классификатора, так как резервные коды располагаются в конце ряда. По этим причинам порядковый метод кодирования чаще всего применяется в сочетании с другими методами кодирования.

Серийно-порядковый метод кодирования – это такой метод, при котором кодами служат числа натурального ряда с закреплением отдельных серий этих чисел за объектами классификации с одинаковыми признаками. Серийно-порядковый метод кодирования целесообразно применять для объектов, имеющих два соподчиненных признака. В каждой серии, кроме кодов имеющихся объектов классификации, предусматривается определенное количество кодов для резерва. Резерв кодов располагается в середине или в конце серии. Это является большим преимуществом данного метода по сравнению с порядковым методом кодирования. Данный метод кодирования обладает всеми преимуществами и недостатками порядкового метода кодирования.

Последовательный метод кодирования – это такой метод, при котором код объекта классификации и (или) классификационной группировки образуется с использованием кодов последовательно расположенных подчиненных группировок, полученных при иерархическом методе классификации. В этом случае код нижестоящей группировки образуется путем добавления соответствующего количества разрядов к коду вышестоящей группировки. Последовательный метод кодирования чаще всего используется при иерархическом методе классификации.

Преимуществами последовательного метода кодирования являются логичность построения кода и большая емкость. Вместе с тем он обладает всеми недостатками, присущими иерархическому методу классификации, а также ограниченными возможностями идентификации объектов. Использование последовательного метода кодирования связано с определенными трудностями, обусловленными тем, что в результате зависимости значений последующих разрядов кода от предыдущих применять этот код по частям нельзя, группировать объекты по различным сочетаниям имеющихся признаков сложно, практически невозможно вносить новые признаки и производить изменения в коде без коренной перестройки классификатора. Поэтому применять последовательный метод кодирования целесообразно в тех случаях, когда набор признаков классификации и их последовательность стабильны в течение длительного времени.

Параллельный метод кодирования – это метод, при котором код объекта классификации и (или) классификационной группировки образуется с использованием кодов независимых группировок, полученных при фасетном методе классификации.

Параллельный метод кодирования имеет ряд преимуществ. К достоинствам рассматриваемого метода кодирования относится гибкость структуры кода, обусловленная блочностью его построения. Метод позволяет использовать при решении конкретных технико-экономических и социальных задач коды только тех признаков объектов, которые необходимы, что дает возможность работать в каждом отдельном случае с кодами небольшой длины. При этом методе кодирования можно осуществлять группировку объектов по любому сочетанию признаков. Параллельный метод кодирования хорошо приспособлен для машинной обработки информации. По конкретной кодовой комбинации легко указать, набором каких характеристик описывается рассматриваемый объект. Набор признаков при необходимости может легко пополняться присоединением кода нового признака. Это свойство параллельного метода кодирования особенно важно при решении технико-экономических задач, состав которых меняется со временем.

В утвержденном Госстандартом РФ в декабре 1995 года Общероссийском классификаторе информации об общероссийских классификаторах (ОКОК) все общероссийские классификаторы были распределены на восемь групп в зависимости от вида информации, на которую они разработаны:
1) социальная информация;
2) информация по описанию организации экономики;
3) информация о продукции, видах экономической деятельности и оказываемых услугах;
4) информация о природных и трудовых ресурсах;
5) информация о финансово-кредитно сфере;
6) информация об управленческой документации, показателях и единицах измерения;
7) информация о стандартах и технологических процессах;
8) прочие виды технико-экономической и социальной информации.

Общероссийские классификаторы ТЭСИ, кроме основной функции стандартного языка формализованного описания данных в информационном обеспечении управления, могут выполнять следующие функции:
– быть самостоятельными массивами справочной информации по основным объектам народного хозяйства;
– служить системой идентификаторов для обозначения объектов народного хозяйства;
– быть основой построения структур различного рода информационно-поисковых систем, баз и банков данных;
– являться средством унификации управленческой документации и технико-экономических и социальных показателей;
– служить инструментом стандартизации информационного обеспечения управления[5] .

Таким образом, методы кодирования технико-экономической и социальной информации тесно взаимосвязаны с методами классификации. Каждому методу классификации соответствует один или несколько методов кодирования. В процессе кодирования объектам классификации и их группировкам по определенным правилам присваиваются цифровые, буквенные и буквенно-цифровые коды. Код характеризуется алфавитом, то есть знаками, используемыми для его образования, основанием кода – числом знаков в алфавите кода и длиной кода.

Заключение

Рассмотрев историю развития Единой системы классификации и кодирования технико-экономической и социальной информации в нашей стране можно сделать вывод, что она тесно связана с созданием единого информационного пространства. А результат этой тесной связи создания различных Государственных программ типа "Развитие и применение Единой системы классификации и кодирования информации", так же было принято постановления Правительства РФ “О развитии единой системы классификации и кодирования технико-экономической и социальной информации”.

Таким образом, рассмотрев методы кодирования и классификации ТЭСИ можно сделать вывод, что, объектами классификации и кодирования в ЕСКК ТЭСИ РФ являются технико-экономические и социальные объекты и их свойства, используемые в различных областях хозяйственной деятельности. В свою очередь методы кодирования тесно связаны с методами классификации. Так же существуют определенные требования и правила, которым должны отвечать методы классификации. Эти методы позволяют преобразовать данные на естественном языке в язык кодов, лучше приспособленный для обработки информации с помощью средств вычислительной техники. Что очень важно для современного информационного общества.

Список источников и литературы

1. ГОСТ 6.01.1-87 Единая система классификации и кодирования технико-экономической информации. Основные положения. Доступно из URL: http://vsegost.com/Catalog/46/46344.shtml/

2. ТГЭУ. Введение в специальность: учебно-методическое пособие. Владивосток, 2009. 62 с.

3. ПР. 50.1-024 - 2005 Правила стандартизации. Основные положения и порядок проведения работ по разработке, ведению и применению общероссийских классификаторов. Доступно из URL: http://base.garant.ru/12159230/

4. Огвоздин В.Ю. Управление качеством. Основы теории и практики. Учебное пособие.- М.:Изд-во «Дело и Сервис», 1999. 158с.

5. Постановление Правительства РФ от 1 ноября 1999 г. N 1212 "О развитии единой системы классификации и кодирования технико-экономической и социальной информации". Доступно из URL: http://base.garant.ru/


[1] ГОСТ 6.01.1-87 Единая система классификации и кодирования технико-экономической информации. Основные положения. Доступно из URL: http://vsegost.com/Catalog/46/46344.shtml/

[2] ТГЭУ. Введение в специальность : учебно – методическое пособие. Владивосток, 2009. С. 23

[3] ПР. 50.1-024 - 2005 Правила стандартизации. Основные положения и порядок проведения работ по разработке, ведению и применению общероссийских классификаторов. Доступно из URL: http://base.garant.ru/12159230/

[4] ПР. 50.1-024 - 2005 Правила стандартизации. Основные положения и порядок проведения работ по разработке, ведению и применению общероссийских классификаторов. Доступно из URL: http://base.garant.ru/12159230/

[5] Огвоздин В.Ю. Управление качеством. Основы теории и практики. Учебное пособие.- М.:Изд-во «Дело и Сервис», 1999 с. 59-60