3.27. Пошук у повнотекстовій базі даних
Повнотекстовий пошук йде з урахуванням російської та української морфології. Це означає, що, незалежно від граматичної форми ключових слів, будуть отримані документи, що містять відповідні слова у всіх формах. Наприклад, відповідно до запиту «правові бази по законодавству», будуть знайдені документи, що містять слова «правова база» і «законодавство», відповідно до запиту «рушник вишиваний» — документи, що містять слова «вишиваному рушникові» і т. п.
Звернемо увагу на таку особливість: у багатослівних запитах система не ігнорує так звані «стоп-слова», до яких відносять прийменники, частки, союзи і т. п. Більшість пошукових систем при пошуку їх ігнорують, тобто, при запиті «крем від засмаги» прийменник «від» буде проігнорований і рєд результатів будуть документи зі словосполученням «крем для засмаги». МЕТА видасть документи, що точно збігаються з запитом.
Можна використовувати ряд службових операторів, що дозволяють уточнити запит.Логічні оператори
Визначення відстані між словами запиту
Оператор | Опис |
+ | Логічне І. Даний оператор діє першим, тобто запит "правові бази по законодавству" рівносильний запиту правові бази + законодавство |
- | Логічне НЕМАЄ дозволяє вилучити зі списку результатів документи, у яких міститься слово, що йде після оператора. Наприклад, згідно запиту "правові бази - законодавство", будуть знайдені тільки ті документи, у яких є слова "правові бази", але немає слова "законодавство". |
1 | Логічне ЧИ/ АБО дозволяє знайти документи, що містять хоча б одне слово в запиті. Наприклад, згідно запиту: козаки | казаки будуть знайдені документи, що містять або слово козаки, або слово казаки. |
Подвійні лапки дозволяють знаходити точне
словосполучення, зазначене в них. При цьому фіксується
граматична форма слів, тобто, згідно з запитом "правова
база", будуть знайдені документи, у яких міститься точно
таке ж словосполучення - правова база.
Фігурні дужки дозволяють знаходити словосполучення, близьке до зазначеного в них, тобто, на відміну відпопереднього оператора, згідно з запитом {правова база} будуть знайдені документи, що містять такі словосполучення: "правова база", "правові база", "правової база", тобто граматична форма слів у даному випадку не фіксується.
Цей оператор використовується в тому випадку, якщо необхідно обмежити відстань між словами запиту. Наприклад, згідно з запитом [5, мобільний телефон], будуть знайдені только ті документи, у яких слова мобільний і телефон розташовані у фрагменті тексту, що не перевищує 5 слів.
Оператори, що дозволяють обмежити область пошуку
Оператор Title | Опис |
Даний оператор дозволяє шукати тільки за назвою документа. Наприклад, згідно з запитом: ІШе(закон) будуть знайдені ті документи, у заголовку яких міститься закон, згідно з запитом title(" документи Кабінету міністрів") будуть знайдені документи, що містять у заголовку словосполучення "документи Кабінету міністрів" | |
Heading | Даний оператор дозволяє проводити пошук по назвах розділів документів. Наприклад, за запитом: пеа(Нп§(бізнес-план) будуть знайдені документи, що |
Інформаційно-пошукова система МЕТА надає цілий ряд сервісних можливостей, які дозволяють вести більш прицільний пошук. Однак, інформаційно-пошукова система — тільки інструмент, і головний внесок у швидке одержання точних результатів робит користувач, коли формулює свій запит.
Поради з ефективної організації пошуку з використанням серверу МЕТА
Скільки слів використовувати в запиті
Згідно статистики, користувачі закордонних пошукових систем використовують у середньому 1,5 слова в запиті. Наші користувачі більш «багатослівні» — 2,5 слова на один запит. У тому випадку, якщо потрібна загальна інформація, що має хоч якесь відношення до теми, достатньо одного слова. Напевно, серед декількох сотень документів, що видасть МЕТА буде документ, що відповідає темі пошуку. Однак, де буде цей документ — в першій десятці результатів чи десятій десятці — важко сказати.
Щоб одержати добірку результатів, що буде більш точно відповідати темі запиту, і попутно заощадити час на перегляд відповідей пошукової системи краще шукати відразу згідно декількох слів, що характеризує запит більш детально.
Які слова використовувати в запиті
Основне змістове навантаження в мові несуть іменники. Значно рідше використовуються прикметники і зовсім рідко дієслова, прислівники, прийменники, сполучники. Прикметники в запиті — просто незамінні, якщо потрібно знайти в Інтернеті саме «правову базу», з «нормативними документами «з»охорони природного середовища».
Дуже ефективний засіб для швидкого одержання точних посилань — це використання рідких слів. До таких слів можна віднести спеціальні терміни, назви місцевості, організації, імена людей і інше. Наприклад, полівінілхлорид, Пномпень, Лорак і т. п. Використання точних слів відразу «заглиблює» користувача у потрібну тематику.
Багатомовні запити
За статистикою МЕТИ, велика частина запитів надходить російською мовою. При цьому пошукова база МЕТИ містить документи російською, українською і англійською мовами. Подібна багатомовність задає свої особливості пошуку на МЕТІ. Наприклад, для того, щоб одержати повний список сторінок, що мають відношення до освіти, необхідно крім слова «освіта» задіяти також слова «образование» і «education». Якщо користувача цікавить повнота пошуку, то це найбільш короткий шлях, щоб одержати посилання на весь масив документів, які цікавлять.
Ключова фраза
Розмовляючи, ми використовуємо безліч стійких, словосполучень. Творці Веб-сторінок користуються такими ж сполученнями слів у своїх документах і тому, запит з використанням стійких фраз і словосполучень, що відносяться до теми пошуку — один з могутніх способів швидко одержати добротну добірку результатів.
Для пошуку в подібних випадках, потрібно використовувати лапки (дужки) чи оператори відстані. Іншими словами, потрібно шукати не слова, а словосполучення. Наприклад, згідно запиту «Век живи», МЕТА з великою точністю видасть сторінки, де міститься прислів'я «Век живи — век учись» і його варіації, при цьому в короткій анотації буде підсвічена саме ключова фраза. Запити по фразі «Комп'ютерна периферія», «курс валют», «прайс-лист» і т. п. значно скорочують загальне число знайдених документів і дозволяють уточнити пошук.
Концепт запиту користувача
В найзагальнішому вигляді концепт — це зміст, що вкладається в запит. Питання в тім, яким чином передати те, що користувач хоче відшукати в ключових словах запиту? Можна спробувати знайти інформацію в лоб — і просто ввести ключові слова, що відповідають запиту. Як правило, цього
Досить. Якщо ж результатів пошуку немає чи вони не зовсім
точні, то потрібно спробувати переформулювати запит (тобто використовувати інші ключові слова, синоніми, що відповідають змісту пошуку).
Можливий і інший підхід. Документи, що містять інформацію, яка є цікавою, можуть не бути присутніми в індексі МЕТИ, однак, те, що вони є десь в українському Інтернеті — більш ймовірно. Залишається тільки добратися до них, використовуючи більш загальні за змістом категорії, що включають ключові слова. Наприклад, якщо користувачу потрібний конкретний український закон, то краще шукати сервера, присвяченого українському законодавству, якщо ж поштова адреса якої-небудь організації — краще спробувати знайти «Жовті сторінки» і т. п.