3.22. Пошук інформації в Інтернеті
Обсяги і темпи росту Веб-ресурсів вражають уяву. Швидкий і інтенсивний розвиток Інтернету породив ряд парадоксів, основний з яких такий: експонентний ріст обсягів інформації в Інтернеті приводить одночасно і до ускладнення пошуку дійсно необхідної інформації, і все більшої актуальності цього процесу. Іншими словами, даних усе більше, а знайти їх все складніше.
Зараз навіть за самих витончених методів побудови пошукових запросів могутні пошукові системи видають часом сотні, а іноді і тисячі посилань. У цих випадках високий рівень інформаційного «шуму» (тобто документів, формально реле-вантних, але не відповідних інформаційним потребам користувача) знижує ефективність наявних механізмів пошуку.
Цілком резонно виникає питання, як конкретному користувачу знайти і відібрати в мережі необхідні дані?
Існує кілька тактичних підходів.
Перший з них умовно називається «серфінгом».
Зачепивши одну з Веб-сторінок, адреса якої була відома, можна пройти по посиланням з цієї сторінки на будь-яку глибину, намагаючись задовольнити свої інформаційні потреби. Варіант досить розповсюджений, однак його навряд чи можна вважати оптимальним.
Другий підхід, прийнято називати «браузингом».
Це розширення серфінгу в тім сенсі, що користувач використовує Інтернет каталог, як стартову сторінку, тобто один з Веб-серверів, на якому представлена класифікація мережевих ресурсів і знаходяться відповідні гіпертекс-тові посилання.
Третій підхід складається у використанні мережевих інформаційно-пошукових систем.
Інформаційно-пошуковою системою називається програма, що дозволяє швидко знайти потрібну інформацію в базі даних.
У цьому випадку користувач може самостійно з клавіатури свого комп'ютера вводити запити в інтерактивному режимі, аналізувати результати пошуку, здійснювати переходи до необхідних ресурсів.
Саме третій підхід, тобто виявлення необхідних відомостей в Інтернеті за допомогою спеціальних пошукових засобів, найкращий для знаходження необхідних даних у мережі. У рамках цього підходу для запобігання інформаційного шуму широке поширення одержала практика звуження області пошуку до деякого прийнятного рівня шляхом підключення різних фільтрів на стадії побудови запиту. З цією метою, як правило, використовуються багаторівневі тематичні класифікатори. Деякі системи дозволяють користувачеві задавати додаткові параметри — діапазони дат документів, доменні імена посилань і т. і. За установки такого роду фільтрів, пошук здійснюється на підмножині документів, що задовольняють заданим умовам. Як і за другого підходу (але не так явно), проблема полягає в тому, що класифікатори будуються розробниками пошукових систем, відповідно до їх суб'єктивних представлень про приналежність конкретного документа до певної рубрики, що далеко не завжди збігається з представленнями користз'вача.