Смекни!
smekni.com

Сущность поисковых машин (стр. 2 из 3)

Поисковый механизм игнорирует стоп-слова (предлоги, союзы, артикли), однако если какое-либо из таких слов существенно перед ним необходимо поставить "+", давая понять системе, что в данном случае термин даже из одной буквы является значимым (например: Александр +I).

Google имеет в своем арсенале множество опций для максимальной конкретизации запроса. Все они доступны через меню Advanced Search "Расширенный поиск". Помимо уже описанных возможностей добавляются фильтры, ограничивающие язык документа, его формат (к примеру, "только документы в PDF"), время опубликования ("последние три месяца"), месту термина в самом документе ("в заголовке страницы") или расположение страницы в определенном домене или даже сайте.

Выдаваемые в результате поиска ссылки на документы, помимо традиционных сведений о заглавии документа, контексте искомых слов и данных о размере содержат функцию Cached "Сохранено", позволяющую полностью восстановить весь документ, если по каким-либо причинам сайт на котором он расположен недоступен. Еще одна функция Similar pages "Похожие страницы" позволяет получить перечень страниц, содержание которых схоже с указанным источником. Это функция, впрочем, пока выполнена без особого успеха.

Помимо поиска текстовых материалов Google обладает лучшими на сегодня возможностями поиска иллюстраций с помощью режима "Поиск изображений" (Images, "Картинки"). В его базе данных учтено более 390 тысяч иллюстраций, разыскание которых ведется аналогично поиску текстовых документов с возможностью ограничения определенным размером, форматом или цветностью графических файлов - все через опцию "Расширенный поиск изображений".

При использовании Google следует, однако, помнить, что при работе с файлами большого объема он индексирует не весь источник, а лишь его первые 101 Кб. (для PDF-файлов лимит ограничен 120 Кб.) поэтому индексация документа пока не всегда гарантирует возможность его нахождения по любому фрагменту текста.

В качестве собственного справочника ресурсов Интернет Google использует усовершенствованный массив Open Directory Project, что порой позволяет сочетать достоинства обоих поисковых инструментов.

Дополнительным платным сервисом Google является поиск труднодоступной информации непосредственно человеком. Стоимость этого вида обслуживания - $2.50 за ответ.

2.2 Поисковая система AlltheWeb

Поисковая система, существующая с 1997 года, расположена в Европе (Норвегия) и изначально была ориентирована преимущественно на европейские сайты. В настоящее время отражает более 2.1 миллиарда документов, среди которых весомое место занимают русскоязычные материалы. Обновление базы производится раз в две недели, среднее время индексации - 5 недель. AlltheWeb способен индексировать PDF-файлы, которые обрабатываются без ограничения их размера.

Весь Web - интерфейс главной страницы

Помимо текстовых разысканий в WWW, AlltheWebподдерживает поиск в группах новостей по интересам, файлов на FTP-серверах, иллюстраций, видео фрагментов и MP3 файлов.

Система оперирует традиционным языком запросов, включающим знаки "+", "-", кавычки для поиска цитат, круглые скобки для поиска по условию ИЛИ. Более сложные ограничения задаются специфическими операторами системы. Однако для формирования многоуровневых запросов лучше обратится к Advanced Search ("Расширенному поиску"), который позволяет легко применить фильтры, в числе которых ограничения по местоположению термина в документе, определенному домену или сайту, времени опубликования, языку и даже объему исходной страницы.

Среди сервисных функций AlltheWebвозможность автоматически объединять результаты в "тематические" папки. Специальная функция позволяет каждому пользователю создать свой собственный интерфейс системы с указанием приоритетов при сортировке результатов и дополнительными услугами, как например, отправка найденных ссылок по электронной почте.

Скорость работы AlltheWeb весьма высока и полностью оправдывает название поискового механизма, именуемого Fast Search (Быстрый поиск).

2.3 Поисковая системаAltaVista

Система введена в эксплуатацию в 1996 году и в течении трех лет являлась признанным лидером сетевого поиска по объему индексного файла, эффективности ранжирования результатов и сервисным функциям. Именно в ней был впервые опробован ставший ныне традиционным язык запросов: знаки "+" и "-", усечение с помощью знака "*" и кавычки для поиска по точной фразе. С форме углубленного запроса были впервые эффективно использованы булевые операторы и оператор расстояния - NEAR.

На данный момент Alta Vista содержит сведения всего об 1 миллиарде web-страниц и статей из телеконференций. Декларируется полное обновление базы каждые три месяца. На сегодня этих показателей уже явно недостаточно, чтобы сохранить лидирующие позиции в мировом поисковом сервисе.

Перечень результатов в AltaVista

Под строкой с запросом приведены термины,ассоциируемые с искомыми ключевыми словами.

Единственным сервисом Alta Vista, сохраняющим актуальность является поиск мультимедийный файлов, в особенности аудио и видео. Поисковый механизм при этом опирается на имена мультимедийных файлов и подписи к иллюстрациям. До некоторой степени может быть полезна и функция перевода найденных страниц на ведущие европейские, а также китайский, корейский и японский языки.

Помимо перечисленный глобальных поисковых систем в некоторых случаях (более по инерции) продолжают использоваться устаревшие поисковые сервисы, среди которых наиболее заметны Lycos(www.lycos.сom), InfoSeek (www.infoseek.com) и Excite (www.excite.com). Малый объем их индексных файлов в настоящее время не позволяет полагаться на предоставляемые ими сведения. "Молодые" поисковые системы, запущенные в 2000 и 2001 годах, такие как WiseNut(www.wisenut.com) и Teoma (www.teoma.com), несмотря на внушительный объем проиндексированных документов пока не представляют особого интереса. Ни одна из них, в частности, не способна осуществлять поиск документов на русском языке.

информационный поисковый глобальный система


3. Информационно-поисковая система по законодательству – Garant

Программа Garant содержит в себе все Российское законодательство, а так же бухгалтерские законопроекты и системы налогов и документы для руководителя Менеджера. Все это тоже может пригодиться адвокату. С помощью этой программы юрист сможет быстро отыскать необходимый ему закон или документ, что значительно увеличит его работоспособность.

Эта программа имеет очень хорошо отлаженную поисковую систему, «По реквизитам» и «По ситуации». При использовании поиска «По реквизитам», Garant выдает небольшую табличку, в которой можно указать часть искомого документа, например:

- выбрать тип документа, допустим «кодекс» и программа выдаст все кодексы нашего законодательства;

- выбрать орган, допустим «орган власти города Москвы» и Garant выдаст все документы и законы выпущенные относительного этого органа;

- выбрать раздел документа, допустим «законодательство о приватизации» и программа опять же выдаст все что у нее есть по этому поводу;

- можно просто указать сроки издания закона, например с 1 января 98 года, по 1 февраля 98 года, и все документы выпущенные в этот период предстанут перед вами, а можно просто указать с какого-нибудь определенного числа и по сей день, так же можно указать дату регистрации в министерстве юстиции документа;

- если вам нужно найти какой-нибудь определенный закон или документ, шифр которого вам известен, то можно его набрать и Garant вам тут же его предоставит;

- программа Garant так же позволяет искать документ по контексту, это когда вам известно только несколько слов из закона который вам нужно отыскать или найти все законы содержащие эту фразу;

- так же можно указать статус документа, т. е. можно указать искать во всех документах или в действующих или в уже утративших силу;

- при поиске по контексту можно указать тип поиска, т. е. искать только в названии документа или икать и самом документе.

При поиске «По ситуации», вам просто необходимо набрать ключевое слово, и программа выдаст все документы которые у нее есть отсортированные по этому ключу, а вам просто нужно выбрать необходимый вам документ которые нашел для вас Garant по введенному ключу.

Из этой программы никогда ничего не удаляется, а только вносятся новые законы и они будут написаны черным цветом, а старые которые уже утратили силу просто будут написаны желтым цветом, это его способность тоже может сильно пригодиться адвокату, ведь адвокаты могут пересматривать дела заключенных которые сидят в тюрьме по закону, который уже утратил силу. Здесь вступает обратная сторона закона и чтоб выпустить невинного заключенного юрист должен ознакомиться с нынешним законодательством и с прошлым, а для этого ему необходимо поднять старые законы, а программа Garant ему предоставит и новые законодательства и старые, что тоже значительно ускорит работу юриста.

Также программа Garant содержит и много других возможностей для облегченной работы с ней, но они более специфические и редко используются.