Существует
много способов оценить насколько хорошо документы, найденные ИПС, соответствуют
запросу. К сожалению, понятие степени соответствия запроса, или другими словами
релевантности, является субъективным понятием, а степень соответствия зависит
от конкретного человека, оценивающего результаты выполнения запроса.
Определяется
как отношение числа релевантных документов, найденных ИПС, к общему числу
документов:
,
где Drel — это множество релевантных
документов в базе, а Dretr —
множество документов, найденных системой. По результатм исследований компании,
оценивающей релевантность показателей основных русских и зарубежных поисковых
систем.
Точность
рамблера~ 0,756. яндекса~0.706, гугла~0.899 апорта~0.705 yahoo~0.689
altavista~0.698 Эти показатели были получены на
основе анализа запроса на слово cat и по тому, как много релевантных ссылок
выдаёт поисковик на 100 первых ответов.
Отношение
числа найденных релевантных документов, к общему числу релевантных
документов в базе:
,
где Drel — это множество релевантных
документов в базе, а Dretr —
множество документов, найденных системой.
Выпадение
характеризует вероятность нахождения нерелевантного ресурса и определяется, как
отношение числа найденных нерелевантных документов к общему числу нерелевантных
документов в базе:
,
где Dnrel — это множество нерелевантных
документов в базе, а Dretr —
множество документов, найденных системой.
Традиционно
F-мера определяется, как гармоническое среднее точности и полноты:
![]()
Часто
ее также называют F1 мерой, потому
что точность и полнота присутствуют в этой формуле с одинаковым весом.
Более
общая формула для положительного вещественного α
имеет вид:
![]()