Категорії

Дипломні, курсові
на замовлення

Дипломні та курсові
на замовлення

Роботи виконуємо якісно,
без зайвих запитань.

Замовити / взнати ціну Замовити

3.27. Пошук у повнотекстовій базі даних

Повнотекстовий пошук йде з урахуванням російської та української морфології. Це означає, що, незалежно від грама­тичної форми ключових слів, будуть отримані документи, що містять відповідні слова у всіх формах. Наприклад, відповідно до запиту «правові бази по законодавству», будуть знайдені документи, що містять слова «правова база» і «зако­нодавство», відповідно до запиту «рушник вишиваний» — документи, що містять слова «вишиваному рушникові» і т. п.

Звернемо увагу на таку особливість: у багатослівних за­питах система не ігнорує так звані «стоп-слова», до яких відносять прийменники, частки, союзи і т. п. Більшість по­шукових систем при пошуку їх ігнорують, тобто, при запиті «крем від засмаги» прийменник «від» буде проігнорований і рєд результатів будуть документи зі словосполученням «крем для засмаги». МЕТА видасть документи, що точно збігаються з запитом.

Можна використовувати ряд службових операторів, що дозволяють уточнити запит.

Логічні оператори


Визначення відстані між словами запиту

 

Оператор

Опис

+

Логічне І. Даний оператор діє першим, тобто запит "правові бази по законодавству" рівносильний запиту правові бази + законодавство

-

Логічне НЕМАЄ дозволяє вилучити зі списку результатів документи, у яких міститься слово, що йде після оператора. Наприклад, згідно запиту "правові бази - законодавство", будуть знайдені тільки ті документи, у яких є слова "правові бази", але немає слова "законодавство".

1

Логічне ЧИ/ АБО дозволяє знайти документи, що містять хоча б одне слово в запиті. Наприклад, згідно запиту: козаки | казаки будуть знайдені документи, що містять або слово козаки, або слово казаки.

 

Подвійні лапки дозволяють знаходити точне
словосполучення, зазначене в них. При цьому фіксується
граматична форма слів, тобто, згідно з запитом "правова
база", будуть знайдені документи, у яких міститься точно
таке ж словосполучення - правова база.  

Фігурні дужки дозволяють знаходити словосполучення, близьке до зазначеного в них, тобто, на відміну відпопереднього оператора, згідно з запитом {правова база} будуть знайдені документи, що містять такі словосполучення: "правова база", "правові база", "правової база", тобто граматична форма слів у даному випадку не фіксується.

Цей оператор використовується в тому випадку, якщо необхідно обмежити відстань між словами запиту. Наприклад, згідно з запитом [5, мобільний телефон], будуть знайдені только ті документи, у яких слова мобільний і телефон розташовані у фрагменті тексту, що не перевищує 5 слів.

Порядок дії логічних операторів можна задавати кругли­ми дужками (). Наприклад, згідно з запитом правова | фінан­сова база будуть одержані документи, що містять або слово правова, або одночасно слова фінансова база, оскільки мається на увазі оператор +, якій діє першим. Якщо ж не­обхідно знайти документи, у яких зустрічаються слова пра­вова база чи фінансова база, запит має бути таким: (правова | фінансова)база.

Оператори, що дозволяють обмежити область пошуку

 

 

Оператор Title

Опис

Даний оператор дозволяє шукати тільки за назвою документа. Наприклад, згідно з запитом: ІШе(закон) будуть знайдені ті документи, у заголовку яких міститься закон, згідно з запитом title(" документи Кабінету міністрів") будуть знайдені документи, що містять у заголовку словосполучення "документи Кабінету міністрів"

Heading

Даний оператор дозволяє проводити пошук по назвах розділів документів. Наприклад, за запитом: пеа(Нп§(бізнес-план) будуть знайдені документи, що


Інформаційно-пошукова система МЕТА надає цілий ряд сервісних можливостей, які дозволяють вести більш прицільний пошук. Однак, інформаційно-пошукова систе­ма — тільки інструмент, і головний внесок у швидке одер­жання точних результатів робит користувач, коли формулює свій запит.

 Поради з ефективної організації пошуку з використанням серверу МЕТА

Скільки слів використовувати в запиті

Згідно статистики, користувачі закордонних пошукових систем використовують у середньому 1,5 слова в запиті. Наші користувачі більш «багатослівні» — 2,5 слова на один запит. У тому випадку, якщо потрібна загальна інформація, що має хоч якесь відношення до теми, достатньо одного сло­ва. Напевно, серед декількох сотень документів, що видасть МЕТА буде документ, що відповідає темі пошуку. Однак, де буде цей документ — в першій десятці результатів чи десятій десятці — важко сказати.

Щоб одержати добірку результатів, що буде більш точно відповідати темі запиту, і попутно заощадити час на перегляд відповідей пошукової системи краще шукати відразу згідно декількох слів, що характеризує запит більш детально.

Які слова використовувати в запиті

Основне змістове навантаження в мові несуть іменники. Значно рідше використовуються прикметники і зовсім рідко дієслова, прислівники, прийменники, сполучники. Прик­метники в запиті — просто незамінні, якщо потрібно знайти в Інтернеті саме «правову базу», з «нормативними докумен­тами «з»охорони природного середовища».

Дуже ефективний засіб для швидкого одержання точних посилань — це використання рідких слів. До таких слів мож­на віднести спеціальні терміни, назви місцевості, ор­ганізації, імена людей і інше. Наприклад, полівінілхлорид, Пномпень, Лорак і т. п. Використання точних слів відразу «заглиблює» користувача у потрібну тематику.

Багатомовні запити

За статистикою МЕТИ, велика частина запитів надходить російською мовою. При цьому пошукова база МЕТИ містить документи російською, українською і англійською мовами. Подібна багатомовність задає свої особливості пошуку на МЕТІ. Наприклад, для того, щоб одержати повний список сторінок, що мають відношення до освіти, необхідно крім слова «освіта» задіяти також слова «образование» і «educa­tion». Якщо користувача цікавить повнота пошуку, то це найбільш короткий шлях, щоб одержати посилання на весь масив документів, які цікавлять.

Ключова фраза

Розмовляючи, ми використовуємо безліч стійких, слово­сполучень. Творці Веб-сторінок користуються такими ж спо­лученнями слів у своїх документах і тому, запит з викорис­танням стійких фраз і словосполучень, що відносяться до те­ми пошуку — один з могутніх способів швидко одержати до­бротну добірку результатів.

Для пошуку в подібних випадках, потрібно використовува­ти лапки (дужки) чи оператори відстані. Іншими словами, потрібно шукати не слова, а словосполучення. Наприклад, згідно запиту «Век живи», МЕТА з великою точністю видасть сторінки, де міститься прислів'я «Век живи — век учись» і йо­го варіації, при цьому в короткій анотації буде підсвічена саме ключова фраза. Запити по фразі «Комп'ютерна периферія», «курс валют», «прайс-лист» і т. п. значно скорочують загаль­не число знайдених документів і дозволяють уточнити пошук.

Концепт запиту користувача

В найзагальнішому вигляді концепт — це зміст, що вкла­дається в запит. Питання в тім, яким чином передати те, що користувач хоче відшукати в ключових словах запиту? Мож­на спробувати знайти інформацію в лоб — і просто ввести ключові слова, що відповідають запиту. Як правило, цього

Досить. Якщо ж результатів пошуку немає чи вони не зовсім  


точні, то потрібно спробувати переформулювати запит (тобто використовувати інші ключові слова, синоніми, що відповідають змісту пошуку).

Можливий і інший підхід. Документи, що містять інфор­мацію, яка є цікавою, можуть не бути присутніми в індексі МЕТИ, однак, те, що вони є десь в українському Інтернеті — більш ймовірно. Залишається тільки добратися до них, вико­ристовуючи більш загальні за змістом категорії, що включа­ють ключові слова. Наприклад, якщо користувачу потрібний конкретний український закон, то краще шукати сервера, присвяченого українському законодавству, якщо ж поштова адреса якої-небудь організації — краще спробувати знайти «Жовті сторінки» і т. п.