Детально про пошук

Назва книги «Введення в інформаційний пошук» несе якийсь елемент вступу в тему, але до цієї роботи слід поставитися з великою увагою - пропонований читачам праця містить досить глибокий аналіз проблем організації пошуку інформації Назва книги «Введення в інформаційний пошук» несе якийсь елемент вступу в тему, але до цієї роботи слід поставитися з великою увагою - пропонований читачам праця містить досить глибокий аналіз проблем організації пошуку інформації. Випущена в Cambridge University Press і перекладена видавничим домом «Вільямс» для російськомовного читача книга, як випливає з повідомлення на обкладинці, призначена для користувачів середньої і високої кваліфікації.

Проблема ефективної організації інформаційного пошуку давно займає розуми практиків і дослідників, але якщо в останні двадцять років ця проблема привертала увагу користувачів різного роду інформаційних систем, які застосовують глобальні мережі для доставки інформації, то трохи більше півстоліття тому серйозні дослідження проводилися фахівцями, зайнятими автоматизацією бібліотечної діяльності. При цьому основна відмінність у відповідних підходах укладено в розумінні принципу мовного опису того, на що спрямований пошук.

В сучасних інформаційних системах при реалізації пошуку інформації прийнятий технологічний підхід автоматизації процесу контентного пошуку, при якому користувачеві пропонується результат у вигляді джерела, в кінцевому підсумку містить слово із запиту. З огляду на добре відомої слабку ефективність такого підходу творцями сучасних пошукачів робляться різні спроби доповнення обліку контекстних залежностей, які переносяться з запиту, на пошукові масиви, використання результатів досвіду попередніх пошуків і т. П. Все це приймає часом малоефективні форми на кшталт «підсовування» відповідей на чужі « близькі »питання. І це, зрозуміло, визначається технологіями, котрі спиралися б на обробку інформації, «перекладену» з природної мови на злегка контекстно-залежний мову, які швидко працюють з великими обсягами інформації.

У підході, прийнятому в бібліотечних системах, була орієнтація на розумовий пошук, підтримуваний розвиненими мовами опису предметних областей, класифікаційними схемами каталогізації та ін. Все це передбачало трудомісткі інформаційні уявлення бібліотечних фондів на мовах опису збережених інформаційних об'єктів і мовами запитів з граматиками і контекстними зв'язками, далекими від природної мови. Крім того, була потрібна висока ступінь проникнення в уявлення сенсу опису інформації та суті запиту, що серйозно гальмувало технологію обробки інформації, так як припускала активну участь людини.

Книга «Введення в інформаційний пошук» пропонує досить глибокий виклад сучасних уявлень про інформаційний пошук і є унікальною в першу чергу по деталізації модельного і алгоритмічного розбору процесів, пов'язаних з описом і пошуком інформації. Автори книги є фахівцями в різних областях діяльності, що мають відношення до інформаційного пошуку, що також характеризує широту в описі проблеми пошуку, від моделей подання інформації та власне пошуку до алгоритмічних описів процесів пошуку, а також їх тестування і визначення ефективності.

Двадцять одна глава книги присвячена: розуміння суті інформаційного пошуку, побудови його моделі, аналізу можливості управління ним; мовним моделям, які використовуються для опису інформації при організації пошуку; основам проведення пошуку в мережевому середовищі.

Читач познайомиться з основною (булевої) моделлю пошуку на індексованому поданні інформації в масиві, що отримується за допомогою словників і списку словопозіцій. У книзі розглянуто особливості застосування словників, що підвищують ефективність пошуку, можливості використання нечіткого пошуку та інші «хитрощі», на кшталт стиснення індексу і ранжирування результатів пошуку. Також представлені матеріали по оцінці результатів пошуку і альтернативним моделям пошуку, наприклад за рахунок використання зворотного зв'язку за релевантністю і розширення запиту, XML-пошуку і ймовірнісної моделі інформаційного пошуку.

Кілька глав книги присвячені мовним моделям інформаційного пошуку, а також можливостям, що підвищує ефективність пошуку за рахунок класифікації текстів в Байєсова (частотному) підході і у векторному просторі. Розглянуто також метод опорних векторів і машинне навчання на індексується інформації, використання плоскою і ієрархічної кластеризації, що дозволяють здійснювати диференціацію в ході індексування і пошуку інформації.

Завершує книгу глава про розкладанні матриць і латентно-семантичному индексировании, в якій розглядається можливість використання в пошуку матричної зв'язку «термін-документ», що дозволяє в ряді випадків отримувати виграш за часом пошуку, його точності і по деяким іншим характеристикам.

Дві глави книги спеціально присвячені організації пошуку в Мережі і індексування інформації в ресурсних джерелах, за якими проводиться пошук.

Книгу відрізняє високий змістовний рівень і актуальність відомостей, що робить її корисною різним категоріям читачів, від студентів, що бажають добре розуміти проблематику інформаційного пошуку, до фахівців, які прагнуть розібратися в тонкощах різних аспектів інформаційного пошуку.

Маннінг, Крістофер Д., Рагхаван, Прабхакар, Шютце, Хайнріх. Введення в інформаційний пошук. М .: ВД «Вільямс», 2011. 528 с. ISBN 978-5-8459-1623-5.