Смекни!
smekni.com

по информационным технологиям в предметной области 4 введение 5 (стр. 2 из 5)

В основном круг интересов квантификаторов СНГ таков: археология, демография, новая и новейшая история. Повышенный интерес к последней объясняется наличием большого количества массовых источников, которые являются основным «материалом» для математическо-компьютерной обработки. Наиболее распространёнными темами являются создание архивов машиночитаемых данных по истории какого-либо региона; социально-экономические аспекты; социально-политические проблемы. Преобладают технологии создания баз и банков данных; использование методов многомерного статистического анализа; моделирование.

Что касается непосредственно поиска исторических данных в сети интернет, эта тема почти не представлена в литературе, за исключением некоторого числа публикаций таких ученных, как В.Н. Владимиров [8], Г.В.Можаева [12], М.И. Петров[15].

Таким образом, для исследователей данной проблематики открывается множество возможностей и перспектив.

ГЛАВА 2. МЕТОДИКА ИССЛЕДОВАНИЯ

При выборе темы, отборе и рассмотрении материала использовался комплекс логических методов, в первую очередь таких, как анализ и синтез, индукция и дедукция, аналогия и сравнение, а также обобщение.

Для непосредственного решения поставленных задач нами использовались общенаучные методы, в частности, приемы теоретического исследования. Среди них следует особо выделить исторический и логический методы.

В методологическом плане работа основана на принципах объективности и комплексного подхода. Первый из них обеспечивается единством и взаимосвязью использованных методов, второй - основан на всестороннем изучении и анализе объекта исследования.

Экспериментальная часть работы заключалась в следующем. В качестве наблюдаемых единиц были взяты некоторые средства поиска: Апорт, AltaVista, Alltheweb, Google, Rambler, Yahoo, Яndex. Критерием отбора данных поисковых средств явилось то, что они являются наиболее авторитетными и используемыми в среде историков. Поиск производился по заданным словам:

1) на белорусском языке «Баптызм» и «Баптызм у Беларусі»;

2) на руском языке «Баптизм» и «Баптизм в Беларуси»;

3) на английском языке «Baptism», «Baptizm», «Baptism in Belarus», «Baptizm in Belarus». В интернете распространены два варианта написания слова «баптизм» на английском языке, хотя правильный вариант написания – через «s». Такое явление довольно часто встречается в сети, так как огромный массив информации не позволяет отслеживать и исправлять ошибки на каждой страничке.

За единицу наблюдения принимались ссылки определенного «поисковика» при введении поисковых слов. Сайты, которые вызвали у автора интерес, рассмотрены и описаны более подробно. Забегая вперед, необходимо отметить, что 90-95% сайтов не содержали научной информации, но, тем не менее, представляют для автора определенную ценность (например, сайты белорусских и российских баптистских общин). Показательно, что обычно приходилось ограничиваться 6-7 листами ссылок, которые исчерпывали нужный информационный потенциал, фиксировали большое число повторений, обладали преимущественно рекламным характером (объявления, сообщения, чаты, предложения о рефератах и т.д.). Таким образом, было произведено наблюдение, результаты которого были проанализированы нами в рамках компаративного метода, а также качественный анализ ссылок с последующим построением модели с использованием ИТ. Была построена динамическая таблица с помощью средств Excel, на базе которой была построены диаграммы и гистограмма в обобщенном виде моделирующие ситуацию наблюдения.

ГЛАВА 3. ОСНОВНЫЕ РЕЗУЛЬТАТЫ

Сегодня Интернет все в большей степени становиться неотъемлемой частью нашей деятельности. Это утверждение имеет непосредственное отношение к научно-исследовательской и образовательной сферам. Наблюдается постоянный рост доступных ресурсов, что позволяет надеяться на полноценное использование накопленных мировых материалов, представленных в электронном формате.

Интернет представляется наиболее современным средством, направленным на широкий доступ к источникам, оперативный обмен информацией между учеными, популяризацию исторического знания и предоставление полной информации о исследованиях и разработках в исторических дисциплинах.

Поэтому перед историческими ресурсами в Интернет встают три основных цели:

1. представление научной информации;

2. образовательные функции;

3. популяризация науки [15, с. 138].

Прежде, чем рассуждать о наличии или отсутствии ресурсов, следует определиться с терминами. Под научно-образовательными ресурсами (НОР) по истории в широком смысле можно понимать все, что имеет какое-либо отношение к истории как науке, имея в ввиду все ее функции, в том числе и просветительскую. Тогда в узком смысле, по-видимому, следует под таковыми понимать только ту информацию, которая прямо и непосредственно используется (или может быть использована) в учебном процессе, связанном с обучением истории, и/или научно-исследовательской работе в области истории[8, с. 134].

Основными видами НОР могут быть следующее:

1. Информация о научных учреждениях, проектах, конференциях, персоналии деятелей исторической науки и т.п. – эти ресурсы можно назвать представительскими.

2. Электронные тексты

а) исторических источников,

б) монографий, статей, тезисов докладов, заметок и прочее.

Сюда относиться только то, что в бумажном виде является основным рабочим материалом историка-исследователя и историка-преподавателя.

3. Имиджи, звук, видео и прочие мультимедийные проекты. Здесь пока абсолютный приоритет за электронными образами источников.

4. Базы данных.

5. Каталоги исторических ресурсов.

6.Програмно обеспечение для историков, включая разного рода контролирующие и обучающие программы, которые работают в режиме on-line [8, с. 135].

К сожалению, НОР в узком понимании этого термина находиться в интернете еще пока на недостаточном уровне развития.

Тем не менее, использование сети интернет может вывести историческую науку на новый качественный уровень. В то же время историк сталкивается с определенными трудностями, например, как найти нужные сведения и произвести отбор из огромного массива информации?

В интернете для облегчения поиска существуют специальные поисковые службы или сервисы. Разделим их на справочники (каталоги) и поисковые системы (машины). Естественно, что это деление будет условным, так как каждый справочник, как правило, обладает собственной поисковой системой, а каждая поисковая система – собственным справочником. Принципы их работы базируются на абсолютно разных подходах и технологиях. Рассмотрим отличия, достоинства и недостатки этих поисковых служб.

Первая группа поисковых средств – каталоги или рубрикаторы – электронные справочники с четкой системой и логико-тематической структурой, в которых поиск ведется по темам и ключевым словам. Каталог - это поисковая система с классифицированным списком аннотаций, в котором содержатся гиперссылки на другие ресурсы интернет. База данных ссылок (индекс) заполняется вручную. Поиск в каталоге возможен путем последовательного уточнения тем (передвижения по дереву каталога). Результатом будет аннотированный список адресов.

Достоинством справочников являются: оперативность отражения новых ресурсов; логичность и последовательность иерархической схемы классификаций; система перекрестных ссылок (для выявления информации при использовании различных подходов). К «минусам» можно отнести следующее: справочники отражают лишь незначительную часть ресурсов сети (наиболее заметные сайты); нельзя провести сложный поиск, результаты будут отражать общие сведения, деталей и подробностей там не будет. К справочником всемирного масштаба можно отнести Yahoo! (www.yahoo.com), Open Directory (dmoz.org), About (www.about.com). Среди российских наиболее известными являются – Апорт (www.aport.ru), List.ru (www.list.mail.ru), Weblist (www.weblist.ru), Улитка (www.ulitka.ru).

Поисковые системы имеют совершенно иные принципы организации работы. Они автоматически формируют базы данных с информацией о Web-страницах, статьях в группах новостей и списках рассылки и т.д. Поиск информации в поисковых системах проводится по ключевому слову (фразе) или по тематическим каталогам. Результаты поиска оформляются в виде списка найденных документов с указанием их заголовков, адресов, цитат из текста документа с выделением ключевых слов, даты обновления, размера и языка документа. Преимущество поисковых систем состоит в возможности обработки результатов поиска – в переходе по ссылке к первоисточнику, конкретизации поиска требуемой информации при помощи добавления новых ключевых слов, в простоте интерфейса, наличии дополнительных сервисных функций, как, например, возможность перевода текста документа на иностранный язык. Наиболее авторитетным поисковым системам всемирного масштаба в настоящее время относятся Google (www.google.com), Alltheweb (www.alltheweb.com) и AltaVista (www.altavista.com). Российские системы -Яndex (www.yandex.ru), Rambler (www.rambler.ru) и Апорт (www.aport.ru).

Произведем наблюдение в рамках поисковых средств Апорт, AltaVista, AlltheWeb, Google, Rambler, Yahoo, Яndex по заданным параметрам (белорусский, русский, английский).

Результаты представим в виде таблицы.

Таблица. Представление найденных Интернет-ресурсов по заданным характеристикам

Поисковая система

На белорусском языке

На русском языке

На английском языке

Баптызм

Баптызм у Беларусі

Баптизм

Баптизм в Беларуси

Baptism

Baptism in Belarus

Baptizm

Baptizm in Belarus

Апорт

14

10000

6713

2776

8271

7762

8271

10052

Alltheweb

0

0

45

1

2000000

82700

15100

28

AltaVista

86

74

146000

715

0

98300

0

42

Google

337

12700

48500

82600

11800000

103000

2600

239

Rambler

30

30

211945

398

64815

56

1067

0

Yahoo

87

72

144000

748

21800000

97000

25900

42

Яndex

104

104

43502

4130

77119

35

3220

0

Итого по заданным полям:

658

22980

600705

91368

35750205

388853

56158

10403

Заметим, что результаты отражают состояние Интернет-ресурсов на конец ноября 2007 года и способны отобразить лишь самую общую ситуацию и тенденции, которые, как известно, могут измениться в любой момент.