Эти методы представляют собой комбинацию коллаборативного и контентного подходов и позволяют избежать ограничений, свойственных каждой из систем в отдельности
[356]. Преимущества гибридной схемы
[357] видны из простого примера. Предположим, один пользователь высоко оценил веб-страницу, освещающую итоги кинофестиваля, второй в тех же целях изучил другой интернет-источник. Коллаборативная фильтрация поклиентского типа ничего ценного отсюда не вылущит, а вот анализ содержания покажет, что объекты сходны, и выявит связь между пользователями.
Комбинации могут быть разными. Можно произвести расчеты в рамках коллаборативной и контентной схем по отдельности, а затем объединить предсказания. Можно встроить некоторые из контентных принципов в коллаборативную методику, и наоборот
[358]. Наконец, в рамках гибридного подхода возможно построение единой рекомендательной модели.
[359] Сложность, которая возникает в этом случае, заключается в необходимости получения информации об объектах рекомендаций.
В таблице, составленной Адомявичусом и Тужилиным, дана классификация рекомендательных систем (см. ниже)
[360].
2.7.5. Эффективность и многомерность рекомендаций
Хотя эта проблема активно обсуждалась
[361], к однозначным выводам специалисты пока не пришли. Вопрос об эффективности часто сводится к покрытию и точности. Покрытие – это количество товаров, для которых рекомендательная система способна выдать прогноз. Точность
Классификация рекомендательных методов
[362]
измеряется по расхождению предсказанных оценок и фактических. (Ее может оценить для себя любой пользователь, сверяя рекомендации с оценками уже известных ему произведений.) Очевидно, что рекомендательные системы еще не настолько вошли в жизнь, чтобы можно было судить об их эффективности со всей определенностью. Поэтому выводы, встречающиеся в литературе, носят предварительный характер. Надо делать поправку и на то, что некорректно сравнивать рекомендательные системы, отличающиеся друг от друга по охвату материала. Одно дело подсказки в области узкоспециальной литературы, другое – музыки, третье – рекомендации в области культурного потребления вообще.
Очевидно, рекомендательные системы в ближайшей перспективе будут доработаны и приспособлены для обслуживания непростых задач из смежных сфер, таких как советы путешественникам, образовательные и медицинские услуги. Проблема в том, что нынешние системы обходят стороной контекстуальную информацию, без которой точность предсказаний резко снижается. Так, если в ходе выработки рекомендаций по фильмам учесть, когда, где и с кем смотрится кино, то эффективность прогнозов возрастет. Очевидно, что ценность целого ряда действий, в частности турпоездок, зависит от момента (сезона, времени суток, дня недели), а также от того, с кем, в какой компании и при каких обстоятельствах человек воспользовался услугой. Имело бы смысл учитывать все эти дополнительные данные
[363]. Интересные возможности открываются и при включении в расчеты информации о цели, которую преследует пользователь
[364].
Глава 2.8. Тендер на экспертизу
Традиционная экспертиза бывает либо медленная и углубленная («ручная» работа критика), либо быстрая и поверхностная (рейтинг). Ни тот, ни другой вариант не решают проблему навигации в полной мере. Если же ввести в систему коллаборативной фильтрации деньги, как предлагается в этой книге, произойдет принципиальный и качественный прорыв. Денежная коллаборативная фильтрация генерирует рекомендации оперативно и точно. Высокая производительность этого метода достигается за счет того, что тестируемые произведения делятся между большим числом экспертов-потребителей, а точность – благодаря специальной логике вычленения вкусовых сообществ.