Смекни!
smekni.com

Пошук інформації в Інтернеті (стр. 3 из 4)

При цьому слід враховувати, що релевантність - якісна міра. Відповідність відповіді ІПС запитам користувача залежить не лише від властивостей пошукової системи, а й від того, наскільки вдало сформульовано запит, тобто наскільки правильно останній відображає потреби користувача.

Для оптимальної і швидкої роботи з пошуковими системами індексних баз даних існують певні правила написання запитів. Повний перелік таких правил для конкретного пошукового сервера можна знайти на самому сервері в пунктах "Допомога", "Підказка", "Правила створення запиту" тощо. Учнів можна ознайомити з правилами, які частіше використовуються для ІПС "Апорт", "Яндекс" або будь-якої іншої індексної бази даних:

Незалежно від того, яка форма слова стоїть у запиті, пошук ураховує всі словоформи за правилами російської мови. Наприклад, якщо задано запит "идти", то в результаті пошуку будуть знайдені посилання на документи, які містять слова "идет", "шел", "шла" та ін. На запит "окно" буде видана інформація, яка містить і слово "окон", а на запит "отзывали" - документи, які містять слово "отозвали". На жаль, україномовної частини Інтернету цей процес не торкнувся, хоча на пошуковому сервері МЕТА проводяться роботи щодо коректного врахування при запиті особливостей української та російської мов та можливої омонімії мови (серед результатів за запитом російською мовою "лист каштана", крім російського омоніму, отримуються ще й україномовні документи з цим словом у значенні "письмо").

Якщо в запиті слово набрано з великої літери, то всі ІПС будуть враховувати регістр, в якому набрані літери (маленька/велика).

Якщо запит містить одне чи кілька слів, то в результаті пошуку будуть знайдені документи, в яких зустрічаються всі слова запиту, крім обмеженої кількості слів (сполучники, прийменники та ін), які в запиті ігноруються, оскільки не несуть змістовного навантаження). Наприклад, за запитом "яблука на снігу" будуть знайдені всі документи, в яких зустрічаються одночасно два слова. Де саме в межах документа розташовані слова, в якій граматичній формі вони знаходяться - не важливо. Слово "на", яке є прийменником, ігнорується. Тому вказаний запит можна було записати як: "сніг на яблуках" - результат пошуку буде тим самим.

Зірочка наприкінці слова символізує певну кількість будь-якихлітер. Наприклад, за запитом "вер*" будуть знайдені документи, якімістять будь-яке зі слів "по вере, верес, Вера, вересень", у будь-якійграматичній формі.

Лапки вказують пошуковій системі, що задані в запиті слованалежать до ключової фрази, яку слід шукати в тексті повністю. Наприклад, за запитом "експертна система" будуть знайдені всі документи, де трапляється вказане словосполучення або близькі до нього фрази.

При складанні запиту можна комбінувати ключові слова за допомогою логічних операторів (І, АБО, НЕ).

Далі слід розглянути прийоми формування запитів на прикладі конкретної системи. При цьому після введення звичайного простого запиту для пошуку одного слова необхідно ретельно проаналізувати правила роботи з результатами пошуку.

Учні повинні з'ясувати, що після введення з клавіатури запиту на екран виводиться список посилань на документи, які точно відповідають запиту. На такій сторінці користувач може побачити спеціальні позначення і посилання, які полегшують перегляд знайдених сторінок. Слід звернути увагу учнів на такі елементи сторінки з результатами пошуку (мал.5.6 - для спрощення будемо розглядати пошукову систему Яндекс):

Пошукова форма, головним її елементом є рядок запиту, до якого з клавіатури користувач уводить простий або складений запит. При цьому додатково можна уточнити мету пошуку: сторінки, новини, назви товарів чи картинки. Здійснити подальший пошук у результатах попереднього дозволяє параметр "Шукати в знайденому".

Тематичний спектр результатів пошуку. Показуються тільки ті теми каталога, в яких є знайдені документи. Список тем впорядкований за релевантністю. Вказування на посилання призводить до обмеження пошуку сторінками вибраної теми.

Теми більш глибокого рівня, які найкраще відповідають запиту. Вказування на посилання призводить до обмеження пошуку за сторінками вибраної теми.

Регіони пошуку - можна обмежити пошук сайтами вказаного регіону.

Пошук за каталогом - опис ресурсів, що містять слова запиту. Натиснення на посилання призводить до переходу у відповідний розділ каталога (виводиться на екран тільки за умов точної відповідності запиту).

Пошук за ресурсом - опис ресурсів, що містять слова запиту. Натиснення на посилання веде до переходу на ресурс (виводиться тільки за умов точної відповідності запиту).

Результати пошуку у Веб-просторі. Заголовок документа - це посилання на ресурс. За допомогою посилання Показати знайдені слова можна здійснити перехід на "підсвічений" документ, в якому відповідність запиту (слова, які входять до запиту) виділена стрілочками та кольором.

Посилання на інші служби пошукової системи або на інші пошукові системи.

Перелік сторінок, які містять список знайдених за запитом посилань.

Далі доцільно звернутися до однієї з пошукових систем, наприклад, Яндекс, та запропонувати учням увести з клавіатури до пошукової форми простий запит, який складається з одного слова, після чого слід запропонувати учням частково-пошукову роботу стосовно вивчення додаткових посилань, які знаходяться на сторінці, що є результатом пошуку. Робота полягає в тому, щоб шляхом методу випробувань з'ясувати, для чого на сторінках з результатами пошуку за запитом використовуються посилання: "результати пошуку (сторінки, сервери), впорядкування (за релевантністю, за датою), показати знайдені слова, схожі документи, ще з сервера". Для організації такої роботи вчитель може задавати учням додаткові питання, підказувати, на що в кожному конкретному випадку із перерахованих вище слід звертати увагу: порядок відображення сторінок, зміст документів, додаткові символи, які висвітлюються на екрані тощо.

Учні повинні під керівництвом учителя дійти висновків:

Якщо в результаті пошуку було знайдено занадто багато документів, і користувач має бажання скоротити такий список, для цього використовується прапорець "Шукати в знайденому".

При одержанні результатів пошуку за запитом, що складаєтьсяіз кількох слів, користувачеві необхідно звертати увагу на статистикуmрезультатів пошуку, яка відображається праворуч від рядка пошуку,де виводиться статистика слів запиту і знайдених документів.

Статистика слова видається завжди стосовно всієї бази і не залежить від області пошуку. Якщо слово запиту жодного разу не зустрілося в базі, воно виділяється червоним кольором. При цьому користувачеві рекомендується перевірити його правопис.

Статистика документів складається з двох чисел - знайдені документи (сторінки) і сайти (сервери). Якщо вибрати посилання на сторінки, то на екрані послідовно сторінка за сторінкою (по 10 документів на кожній екранній сторінці) відображаються анотації та адреси кожної з них (див. мал.5.6). Якщо вибрати посилання на сервери, то на екрані відображається список, який включає по одному знайденому документу з кожного сервера.

Усі знайдені за запитом документи впорядковуються при відображенні на сторінці з результатами пошуку. За замовчуванням результати пошуку впорядковуються за релевантністю і згруповуються за серверами. Знайдені документи можуть мати позначки "збіг фрази", "строга відповідність" або "нестрога відповідність" (за ступенем зменшення релевантности або "нестрогі" документи, відокремлені від інших горизонтальною рискою. Діючий порядок упорядкування і групування виділяється жирним шрифтом, альтернатива вказується за допомогою посилання. При групуванні за серверами в кожному знайденому документі відображається посилання "5с/ з сервера" (Ще з сервера) - запит на одержання всіх сторінок цього сервера, які відповідають запитові.

При впорядкуванні за серверами кожний знайдений документ має такий вигляд:

Заголовок документа (посилання на нього). Опис документа (Metadescription, якщо існує, або - перші 256 кілобайт тексту). URL-адреса документа - його розмір - ступінь відповідності запиту. Посилання на розмічений документ | Посилання на запит схожих документів | Посилання на інші документи з того самого сервера, які відповідають даному запиту.

Наприклад, Тенета-Ринет'2000: Стихотворения! Показать найденные Слова Тенета-Ринет'2000: Стихотворения КОНКУРСНАЯ РАБОТА: http: / /teneta. rinet.ru/2000/stihi/gb955460406453260.html - 24К - збіг фрази Похожие документы І Еще с сервера близько 16 док.

При впорядкуванні за сторінками знайдений документ має інший вигляд: в останньому рядку відсутнє посилання "Ще з сервера", наприклад, Поэтическая обсуждалка] Показать найденные Слова Участники Курилка Прозаическая обсуждалка Обсуждаемые работы Архивы http://www.lito. spb. ra/archive/poet^ukin.html - 35K - збіг фрази Похожие документы.