Метапоисковая система FlaYper  , принцип работы .
56, Moscow, Rusija

FlaYper – это метапоисковая система, использующая другие поисковые системы для предварительного отбора текстовой информации и последующей классификации результатов поиска.

Алгоритмы работы метапоисковой системы FlaYper основаны на использовании стандартной модели работы с ключевыми словами и на кластеризации результатов поиска. Кластеризация предварительно отобранных результатов поиска проводится по трем критериям группировки:

- кластеризация по наиболее часто встречаемым в результатах поиска ключевым словам;

- группировка результатов поиска по поисковым системам, в которых были найдены результаты поиска;

- группировка результатов поиска по доменным зонам (например .org, .com и др.)

Результаты кластеризации по наиболее часто встречаемым в результатах поиска ключевым словам представляются в виде списка пунктов меню, по которым возможна пересортировка результатов выдачи. При отображении кластеры упорядочиваются по статистике найденных слов. Имеется возможность указать ограничение области поиска соответствующим разделом (например, новости, изображения, википедия, блоги, работа, магазины и государство). Можно указать ограничения на число анализируемых при метапоиске результатов (100, 200, 500) и на время реакции метапоисковой системы (5, 10, 30 секунд). Поиск с учетом словоизменения (учет морфологии) реализован только для английского языка. Поиск по энциклопедиям реализован только на основе использования метапоиска по англоязычной части энциклопедии wkipedia, даже если запрос пользователя введен на русском языке. Метапоисковая система FlaYper не использует ни синтаксического, ни семантического анализа текстов. Поиск проводится по всем словам запроса пользователя. Реализованный кластерный анализ не позволяет получать точные результаты поиска при вводе запроса пользователя на естественном языке. Например, по запросу "what country did Nabokov live in" метапоисковая система FlaYper не находит релевантной информации. Это обусловлено отсутствием синтаксического и семантического анализа, позволяющего выделить главную сущность в запросе пользователя и определить требования к смысловому содержанию текста ответа. Версии поисковых систем FlaYper основаны только на метапоиске. Не существует собственных программных продуктов компании для индексации информации и поиска по ней. Это обусловливает зависимость компании от существующих поисковых систем.


Выводы:

Метапоисковая система FlaYper принадлежит к классу метапоисковых систем, осуществляющих кластеризацию результатов поиска существующих поисковых систем.

Система FlaYper за счет использования кластерного анализа имеет характеристики поиска, отличающиеся от традиционных поисковых систем (возможность выделения слов, часто встречающихся совместно со словами поискового запроса). Однако использование только кластерного анализа не дает существенных преимуществ метапоисковым системам данного типа (clusty, nigma и др.).

Улучшение качества поиска, особенно при обработке запросов на естественном языке возможно только на основе использования синтаксического и семантического анализа текстовой информации.

Технология кластерного анализа имеет особенности, позволяющие на некоторых запросах пользователей получить немного лучшее качество поиска по сравнению с традиционными поисковыми системами. Однако, на других запросах качество поиска у систем кластерного анализа хуже, чем у традиционных поисковых систем. Это просто системы одного уровня, но несколько отличающиеся в части представления информации пользователю.

Качественное повышение эффективности поисковых систем возможно только за счет использования синтаксического и семантического анализа текста, а существующие поисковые системы (как традиционные, так и кластерные) этого не реализуют.

232 pregleda
 
Komentari

Još nema komentara.
Ostavi komentar, započni diskusiju!

Blog
Blogovi se ažuriraju svaka 5 minuta