Смекни!
smekni.com

Internet (стр. 5 из 5)

Infoseek. В этой системе индекс создает робот, но он индексирует не весь сайт, а только указанную страницу. При этом робот имеет такие приоритеты:

  • слова в заголовке <title> имеют наивысший приоритет;
  • слова в теге keywords, description и частота вхождений&bsol;повторений в самом тексте;
  • при повторении одинаковых слов рядом выбрасывает из индекса
  • Допускает до 1024 символов для тега keywords, 200 символов для тэга description;
  • Если тэги не использовались, индексирует первые 200 слов на странице и использует как описание;

Система Infoseek обладает довольно развитым информационно-поисковым языком, позволяющим не просто указывать, какие термины должны встречаться в документах, но и своеобразно взвешивать их. Достигается это при помощи специальных знаков "+" - термин обязан быть в документе, и "-" - термин должен отсутствовать в документе. Кроме этого, Infoseek позволяет проводить то, что называется контекстным поиском. Это значит, что используя специальную форму запроса, можно потребовать последовательной совместной встречаемости слов. Также можно указать, что некоторые слова должны совместно встречаться не только в одном документе, а даже в отдельном параграфе или заголовке. Имеется возможность указания ключевых фраз, представляющих собой единое целое, вплоть до порядка слов. Ранжирование при выдаче осуществляется по числу терминов запроса в документе, по числу фраз запроса за вычетом общих слов. Все эти факторы используются как вложенные процедуры. Подводя краткое резюме, можно сказать, что Infoseek относится к традиционным системам с элементом взвешивания терминов при поиске.

WAIS. WAIS является одной из наиболее изощренных поисковых систем Internet. В ней не реализованы лишь поиск по нечетким множествам и вероятностный поиск. В отличие от многих поисковых машин, система позволяет строить не только вложенные булевые запросы, считать формальную релевантность по различным мерам близости, взвешивать термины запроса и документа, но и осуществлять коррекцию запроса по релевантности. Система также позволяет использовать усечения терминов, разбиение документов на поля и ведение распределенных индексов. Не случайно именно эта система была выбрана в качестве основной поисковой машины для реализации энциклопедии "Британика" на Internet.

В России также создано большое количество поисковых систем. Ниже приведена таблица сравнительных характеристик российских поисковых систем.

Сервер Зона поиска Глубина поиска Язык запроса Вывод результатов поиска
Яndex Русская часть Интернет, включая домены "su" и "ru", а также русскоязычные ресурсы в других доменах Все слова в документе с учетом русской и английской морфологии AND, OR, NOT. Поиск по точной словоформе. Под-держка скобочных выражений. Поиск в заголовках и ссылках. Есть возможность поиска на естественном языке без использования логических опера-торов. Возможность сужения поиска на заданный URL. Поиск картинок по названию или альтернативному тексту. Поиск ссылок на указанный URL. Название документа, размер файла, URL, дата последнего обновления, степень соответствия запросу, кодировка. Подсветка искомых слов в найденных документах. Есть возможность поиска похожих документов и повторного поиска только в найденных документах
Rambler WWW
Некоммерческие конференции Relcom за последнюю неделю
Все слова в документе AND, OR, NOT. Возможность усечения терминов. Ограничение по дате. Возможность сужения поиска на заданный URL. Возможность исключения из поиска документов, содержащих указанные слова. Название документа, размер файла, URL, дата последнего обновления, степень соответствия запросу, кодировка
Новый русский поиск WWW
Некоммерческие конференции Relcom за последние две недели
Все слова в документе AND, OR, NOT. Поиск по словосочетанию Название документа, размер файла, URL, дата последнего обновления, степень соответствия запросу
Русская машина поиска WWW Все слова в документе AND и OR. Поиск по фразе, допуск максимального количества ошибок, чувствительность к строчным и прописным буквам Название документа, URL, степень соответствия запросу
Созвездие Internet Каталог WWW Название и краткая характеристика сервера Возможность усечения терминов Название сервера, краткая характеристика содержания, кодировки
Russian Internet Search WWW Все слова в документе AND и OR, чувствительность к строчным и прописным буквам, допуск возможного числа ошибок Название документа, URL
Апорт! WWW Все слова в документе AND и OR, поиск по фразе, возможность усечения, чувствитель -ность к строчным и прописным буквам, учет русской морфологии Название документа, размер файла, URL, дата последнего обновления, степень соответствия запросу, кодировка
TELA - ПОИСК WWW Все слова в документе AND или OR, возможность усечения терминов, русская морфология Название документа, размер страницы и число слов URL, дата последнего обновле-ния, степень соот-ветствия запросу (очки). Интересная возможность прос-мотреть содержание найденного документа (без картинок) прямо со страницы поисковой системы
Ау! Каталог русского WWW Поиск либо по категориям, либо по описаниям серверов Аналогично Апорт! Название сервера, краткое описание, местоположение, доступность
List.ru Каталог WWW Название и краткая характеристика сайта Полнотекстовый поиск ресурсов по их названиям, описаниям и ключевым словам с помощью поисковой системы Яndex.Site. Название сервера, краткое описание. Возможность сорти-ровки серверов в каждой категории по алфавиту, по времени добавления, по переходам
Siberian Links Каталог WWW Принцип включения в каталог не описан Название и краткая характеристика сайта. И, ИЛИ. Поиск по ключевым словам или фразам. Название сервера, краткое описание. Система рейтинго-вания серверов.

2.3. Поиск по рубрикам и тематическим разделам

Чаще всего потребителю необходима информация по определенной тематике. Большинство поисковых серверов позволяет достаточно быстро найти список сайтов соответствующих запросам пользователя. Искать информацию по тематике достаточно просто. Нужно зайти на сайт, который использует данный способ поиска (например list.ru) и выбрать высший уровень поиска. Далее выбирая следующий подуровень и щелкнув мышью на его названии пользователь опускается все ниже и ниже. И наконец получает список сайтов, который соответствует запросу пользователя. Например:

Пользователь желает найти на поисковом сервере List.ru сайты с информацией о российских рок-музыкантах. Для этого он должен подключиться к Internet и набрать в адресной стоке адрес www.list.ru На экране появится список рубрик для поиска. Пользователь выбирает рубрику «Культура/Искусство». На экране появляется список тематик соответствующих выбранной рубрике. Выбираем тему «Музыка». Далее из появившегося на экране списка подтем выбираем тематику «Современная музыка». Из следующего уровня мы выбираем рубрику «Рок музыка». И наконец на экране появляется среди прочих тематик название «Русский рок». Щелкнув мышью на гиперссылке «Русский рок» выходи на следующий уровень сужающий объем нашего поиска. Мы выбираем тему «Классический рок». И наконец получаем список групп сайты которых есть в списке поискового сервера list.ru. После этого выбираем название группы – например «Аквариум» и получаем список сайтов содержащих информацию о рок-группе «Аквариум». Далее выбираем сайт, который нас интересует, и просматриваем информацию на нем.

Можно ускорить поиск необходимой информации, если заранее известно, что необходимо найти. Например, если известно, что ищется сайт группы «Аквариум», то можно использовать комбинированный поиск по тематике «Музыка» и ключевому слову «Аквариум».

Таким образом, опытный пользователь Internet может найти практически любую информацию по интересующей его теме.

Список использованной литературы

  1. М. Пайк. Internet . СПб., 1996.
  2. Пол Гилстер. Навигатор Internet. М., 1995
  3. Энциклопедия Интернет, СПб, 2001
  4. Информатика. Базовый курс. Учебник для ВУЗов, СПб, 2001

.