Значение рейтингов для экономики колоссально и однозначно положительно. Благодаря им бизнес обрел почву под ногами: столь необходимая ему обратная связь предложения со спросом установилась наилучшим из всех возможных способом, поскольку ранжирование не порождает для предпринимателей никаких отрицательных внешних эффектов. Для культуры же значение рейтингов неоднозначно. Ей как воздух необходима обратная связь, но более содержательная. Создавая иллюзию потребительской рефлексии, рейтинги скорее сбивают культуру с правильного пути, нежели указывают на него. Они в минимальной степени служат культурной навигации, скорее – это буйки на пути ухудшающего отбора, обозначающие фарватер.
Глава 2.7. Обзор рекомендательных систем[317]
В самом общем виде рекомендация – это прогнозирование оценки до того момента, как человек сам опробовал объект. Прогноз составляется на основе анализа предшествующих предпочтений покупателя или любой другой информации о нем[318]. Услуга состоит в следующем: из всего разнообразия книг, CD, фильмов, ресторанов и т. п. для конкретного потребителя выбирается продукт с наивысшей ожидаемой полезностью[319].
На каждого клиента рекомендательной системы[320] составляется индивидуальный профиль, в котором учитываются его потребительские предпочтения, а также (при необходимости) возраст, пол, доход, семейное положение и т. д. Точно так же по определенным правилам описываются и товары. Например, в сервисе по фильмам каждая картина может быть представлена названием ленты, жанром, режиссером, годом выпуска, главными актерами и т. д. Первоначально в базу заносятся оценки потребителей, выставленные уже известным им товарам. Например, в системе MovieLens[321] пользователи начинают с того, что проставляют баллы определенному количеству фильмов, которые они уже посмотрели. Системы способны выдавать рекомендации либо в виде перечня товаров наиболее подходящих данному потребителю, либо в виде списка потребителей, для которых предпочтительны определенные продукты (как подчеркивалось в первой главе, это различие на практике оказывается принципиальным). Рекомендации могут генерироваться тремя способами:
1. Контентным: человеку рекомендуют товары, сходные с теми, которые он выбрал ранее.
2. Методом коллаборативной фильтрации: потребителю рекомендуют товары, которые вычисляются по оценкам людей со схожими вкусами, уже опробовавших данный продукт и поделившихся своими суждениями.
3. Гибридным методом, сочетающим в себе два предыдущих.
Кроме перечисленных существуют вспомогательные системы (кратко упоминаются ниже), а также системы социальной навигации, которые не являются рекомендательными и здесь не рассматриваются. В последнем случае предпочтения людей выявляют на основании прямых и косвенных данных: интернет-сообщений, историй пользования системой, гиперссылок и т. д. Они визуализируют взаимодействие человека с компьютером и помогают путешествующим по сети[322].
2.7.1. Контентные методы выработки рекомендаций
В рекомендательных системах контентного типа полезность товара выводится из потребительской оценки сходных продуктов. Например, для того чтобы посоветовать человеку фильмы, контентная система пытается найти сходство между различными картинами, которые прежде получили у него высокую оценку (одни и те же актеры, режиссеры, жанры и т. д.). Подобные рекомендации основаны на принципе «найдите для меня вещи, подобные тем, что мне нравились в прошлом». В основе контентой рекомендательной системы лежат методы поиска информации[323], ее сопоставления и фильтрации[324]. Этот подход чаще всего используют для текстов – документов, веб-сайтов, блогов и т. п. Профиль предпочтений клиента формируется на основе информации, которую получают от него либо напрямую, анкетированием, либо косвенно. Контент обычно описывается при помощи ключевых слов[325]. Профиль потребителя, указывающий на его предпочтения, создается путем выявления ключевых слов в контенте, которому данный человек ранее уже вынес оценку. Профиль потребителя и профиль контента могут быть представлены как векторы, а полезность данного контента для данного потребителя определяется величиной угла между ними[326]. В частности, человеку, интересующемуся определенной темой, будут рекомендованы статьи, в которых использовано много терминов (ключевых слов) из его пользовательского профиля.
2.7.1.1. Недостатки
Их в контентном методе несколько. Во-первых, машинный анализ годится не для всяких объектов. Так, сильно осложнена работа с мультимедийными приложениями, графикой, аудио- и видеоматериалами. (Хотя в последнее время в этой области наблюдается бурный прогресс.) Другая проблема данного метода в том, что два разных предмета, представленных одинаковыми профилями, неразличимы. В частности, с помощью контентных систем невозможно отличить хорошую статью от плохой, если их лексикон близок. Это касается и потребительских профилей, поэтому рекомендации, основанные на выборе якобы схожих людей, могут быть низкого качества. На деле оказывается, что профили близки, а люди, стоящие за ними, разные. Еще один очевидный недостаток – узость рекомендаций. Потребителю не могут рекомендовать товары, отличные от тех, которые ему уже знакомы. С другой стороны, ему могут настойчиво предлагать объекты, слишком похожие на те, что ему хорошо известны.
2.7.2. Вспомогательные системы
Эти системы не вычисляют рекомендации. Их смысл в другом: служить инструментом обмена рекомендациями. Первая в мире рекомендательная система Tapestry, разработанная в Xerox PARC, относилась к вспомогательному типу[327]. Популярные ныне веблоги (weblog) – пример такой системы.
Узкое место вспомогательных систем в том, что они эффективны только при наличии некоторого числа добровольцев, готовых генерировать информацию, полезную для сообщества[328]. В большинстве случаев эта работа не оплачивается, хотя вот-вот она превратится в статью дохода благодаря усилиям коммерческих поисковых сервисов[329]. Пока же рекомендателями движут немеркантильные интересы, возможно, потребность в расширении знаний или в выстраивании обратной связи с пользователями, или стремление обрести статус эксперта. Часто все, чего они ждут – это благодарность за разъяснение, советы или провокационные реакции.
2.7.3. Коллаборативные методы производства рекомендаций
Системы коллаборативной фильтрации основываются на двух принципах и, соответственно, бывают двух типов: анамнестические (memory-based) и модельные (model-based)[330].
Анамнестические алгоритмы строят прогноз, исходя из предшествующих оценок клиента [331] и совокупности оценок, данных товару другими пользователями. Это типичная поклиентская, или, иначе, субъект-субъектная схема коллаборативной фильтрации. Чтобы подсказки были точны, нужно решить две задачи: отфильтровать качественных рекомендателей и резюмировать их оценки. Вкусовая близость между клиентами устанавливается на основании того, какие оценки они дали одним и тем же товарам[332]. А вот вычисляться подобие может корреляционным методом (используется коэффициент корреляции Пирсона), методом линейного сходства, и рядом других способов. Простейший способ измерения сходства между пользователями – по среднеквадратичному отклонению.