Смекни!
smekni.com

Гипертекстовая технология (стр. 2 из 5)

К 1989 году гипертекст представлял новую, многообещающую технологию, которая имела относительно большое число реализаций с одной стороны, а с другой стороны делались попытки построить формальные модели гипертекстовых систем, которые носили скорее описательный характер и были навеяны успехом реляционного подхода описания данных.

Идея Т.Бернерс-Ли заключалась в том, чтобы применить гипертекстовую модель к информационным ресурсам, распределенным в сети, и сделать это максимально простым способом. Он заложил три краеугольных камня системы из четырех существующих ныне, разработав:

· язык гипертекстовой разметки документов HTML (HyperText Markup Lan-guage);

· универсальный способ адресации ресурсов в сети URL (Universal Resource Locator);

· протокол обмена гипертекстовой информацией HTTP (HyperText Transfer Protocol).

Позже команда NCSA добавила к этим трем компонентам четвертый:

· универсальный интерфейс шлюзов CGI (Common Gateway Interface).

Идея HTML - пример чрезвычайно удачного решения проблемы построения гипертекстовой системы при помощи специального средства управления отображением. На разработку языка гипертекстовой разметки существенное влияние оказали два фактора: исследования в области интерфейсов гипертекстовых систем и желание обеспечить простой и быстрый способ создания гипертекстовой базы данных, распределенной на сети.

В 1989 году активно обсуждалась проблема интерфейса гипертекстовых систем, т.е. способов отображения гипертекстовой информации и навигации в гипертекстовой сети. Значение гипертекстовой технологии сравнивали со значением книгопечатания. Утверждалось, что лист бумаги и компьютерные средства отображения/воспроизведения серьезно отличаются друг от друга, и поэтому форма представления информации тоже должна отличаться. Наиболее эффективной формой организации гипертекста были признаны контекстные гипертекстовые ссылки, а кроме того было признано деление на ссылки, ассоциированные со всем документом в целом и отдельными его частями.

Самым простым способом создания любого документа является его набивка в текстовом редакторе. Опыт создания хорошо размеченных для последующего отображения документов в CERN-е был - трудно найти физика, который не пользовался бы системой TeX или LaTeX. Кроме того к тому времени существовал стандарт языка разметки - Standard Generalised Markup Language (SGML).

Следует также принять во внимание, что согласно своим предложениям Т.Бернерс-Ли предполагал объединить в единую систему имеющиеся информационные ресурсы CERN, и первыми демонстрационными системами должны были стать системы для NeXT и VAX/VMS.

Обычно гипертекстовые системы имеют специальные программные средства построения гипертекстовых связей. Сами гипертекстовые ссылки хранятся в специальных форматах или даже составляют специальные файлы. Такой подход хорош для локальной системы, но не для распределенной на множестве различных компьютерных платформ. В HTML гипертекстовые ссылки встроены в тело документа и хранятся как его часть. Часто в системах применяют специальные форматы хранения данных для повышения эффективности доступа. В WWW документы - это обычные ASCII- файлы, которые можно подготовить в любом текстовом редакторе. Таким образом, проблема создания гипертекстовой базы данных была решена чрезвычайно просто.

В качестве базы для разработки языка гипертекстовой разметки был выбран SGML (Standard Generalised Markup Language). Следуя академическим традициям, Бернерс-Ли описал HTML в терминах SGML (как описывают язык программирования в терминах формы Бекуса-Наура). Естественно, что в HTML были реализованы все разметки, связанные с выделением параграфов, шрифтов, стилей и т. п., т.к. реализация для NeXT подразумевала графический интерфейс. Важным компонентом языка стало описание встроенных и ассоциированных гипертекстовых ссылок, встроенной графики и обеспечение возможности поиска по ключевым словам[3].

За пять лет, с момента разработки первой версии языка (HTML 1.0), произошло довольно серьезное развитие языка. Почти вдвое увеличилось число элементов разметки, оформление документов все больше приближается к оформлению качественных печатных изданий, развиваются средства описания не текстовых информационных ресурсов и способы взаимодействия с прикладным программным обеспечением. Совершенствуется механизм разработки типовых стилей. Фактически, в настоящее время HTML развивается в сторону создания стандартного языка разработки интерфейсов как локальных, так и распределенных систем.

1.3 Простая технология построения гипертекста

Шаг 1 . Нужно разбить текст на отдельные главы/ темы

Шаг 2 . Нужно представить некоторый основной путь чтения гипертекста и расставить, соответственно, поля-ссылки, ведущие читателя от темы к теме по этому основному пути.

Шаг 3 . Нужно выделить в тексте слова-ссылки, точнее, нужно найти ситуации (моменты) в процессе чтения текста, когда пользователь может захотеть перейти от основного пути чтения текста к другим возможным путям чтения.

Шаг 4 . В результате шага 3 могут появиться слова-ссылки, для которых еще не написаны соответствующие главы/темы. Такие главы нужно дописать.

Шаг 5 . Нужно связать ссылки с существующими темами[4].

Гипертексты дают текстам два дополнительных смысловых пространства. В тексте выделяются особые поля-ссылки, которые могут "сразу" привести читателя к нужным главам/темам, рисункам, описаниям. Благодаря этому процесс чтения становится принципиальноиным - гипертекст можно читать/просматривать многими различными путями и читатель сам выбирает тот путь просмотра, который ему наиболее удобен.

Простота концепции гипертекста обуславливает и формальную простоту общепринятой, технологии создания гипертекстов. Имея простейшую систему построения гипертекстов можно быстро собрать из нескольких текстовых фрагментов гипертекст и формально получить самостоятельную гипертекстовую информационную систему, программный продукт или подсистему подсказки.

Но в силу видимой простоты гипертекстовой технологии очень легко создать гипертекстовую информационную систему с низким качеством.

Гипертексты обладают определенной семантической (смысловой) сетевой структурой. При многочисленном просмотре, если гипертекст используется как учебник, эта структура будет сильно влиять на структуру знаний пользователя по изучаемому вопросу.


2 Гипертекстовая технология

2.1 Общие понятия

Гипертекстовая технология ориентирована на обработку информации не вместо человека, а вместе с человеком, т е. становится авторской. Удобство ее использования состоит в том, что пользователь сам определяет подход к изучению или созданию материала с учетом своих индивидуальных способностей, знаний, уровня квалификации и подготовки. Гипертекст содержит не только информацию, но и аппарат ее эффективного поиска. По глубине формализации информации гипертекстовая технология занимает промежуточное положение между документальными и фактографическими информационными системами.

Структурно гипертекст состоит из информационного материала, тезауруса гипертекста, списка главных тем и алфавитного словаря.

Информационный материал подразделяется на информационные статьи, состоящие из заголовка статьи и текста. Заголовок содержит тему или наименование описываемого объекта. Информационная статья содержит традиционные определения и понятия, должна занимать одну панель и быть легко обозримой, чтобы пользователь мог понять, стоит ли ее внимательно читать или перейти к другим, близким по смыслу статьям. Текст, включаемый в информационную статью, может сопровождаться пояснениями, примерами, документами, объектами реального мира. Беглый просмотр текста статьи упрощается, если эта вспомогательная информация визуально отличается от основной, например подсвечена или выделена другим шрифтом.

Тезаурус гипертекста - это автоматизированный словарь, отображающий семантические отношения между лексическими единицами дескрипторного информационно-поискового языка и предназначенный для поиска слов по их смысловому содержанию.

Термин тезаурус был введен в XIII в. флорентийцем Б. Лотики для названия энциклопедии. С латыни это слово переводится как сокровище, запас, богатство. Тезаурус гипертекста состоит, из тезаурусных статей. Тезаурусная статья имеет заголовок и список заголовков родственных тезаурусных статей, где указаны тип родства и заголовки тезаурусных статей. Заголовок тезаурусной статьи совпадает с наименованием информационной статьи и является наименованием объекта, описание которого содержится в информационной статье[5].

В отличие от традиционных тезаурусов-дескрипторов тезаурус гипертекста содержит не только простые, но и составные наименования объектов. Формирование тезаурусной статьи гипертекста означает индексирование текста. Полнота связей, отражаемых в тезаурусной статье, и точность установления этих Связей в конечном итоге определяют полноту и точность поиска при обращении к данной статье гипертекста.

Существуют следующие типы родства или отношений:

· вид - род,

· род - вид,

· предмет - процесс,

· процесс - предмет,

· целое - часть,

· часть - целое,

· причина- следствие,

· следствие - причина и т. д.

Пользователь получает более общую информацию по родовому типу связи, а по видовому - специфическую информацию без повторения общих сведений из родовых тем. Тем самым глубина индексирования текста зависит от родовидовых отношений.

Список заголовков родственных тезаурусных статей представляет собой локальный справочный аппарат, в котором указываются ссылки только на ближайших родственников. Тезаурус гипертекста можно представить в виде сети: в узлах находятся текстовые описания объекта (информационные статьи), ребра сети указывают на существование связи между объектами и на тип родства. В гипертексте поисковый аппарат не делится на тезаурус и массив поисковых образов—документов, как в обычных информационно-поисковых системах. В гипертексте весь поисковый аппарат реализуется как тезаурус гипертекста.