Перейти к содержимому

Атрибуция по вектору Шепли — справедливое распределение вклада каналов

Shapley value (Вектор Шепли) — это модель атрибуции из кооперативной теории игр, за основу которой Ллойд Шепли получил Нобелевскую премию по экономике в 2012 году. Она считает, какую часть конверсии «честно заработал» каждый канал — на основе всех возможных комбинаций каналов в пути клиента, а не одного фиксированного правила. DataGo разворачивает Shapley value как Data-Driven модель в витрине Sessions.

Как Shapley value рассчитывает вклад канала: аналогия

Представьте: три друга — Аня, Боря, Вика — открыли совместный бизнес. В одиночку Аня зарабатывает 60 ₽, Боря 30 ₽, Вика 50 ₽. Вдвоём Аня + Боря получают 90 ₽, а втроём — целых 120 ₽. Как разделить 120 ₽ справедливо?

Просто поровну (по 40)? Несправедливо: у Ани личный навык сильнее. По доле «соло»? Тоже нет — не учитывает синергию пар. Ллойд Шепли в 1953 году предложил решение: для каждого участника посчитать средний marginal contribution — насколько вырастает выигрыш группы, когда участник присоединяется к ней. Усреднить по всем возможным порядкам присоединения — получится честная доля.

Shapley value — метод в кооперативной теории игр для справедливого распределения общего выигрыша между игроками, которые сотрудничают.

Перенос на маркетинг. Каналы — это «игроки». Конверсия — «выигрыш». Коалиции — комбинации каналов, которые встретились в пути клиента до покупки. Shapley value говорит: справедливая доля канала = его средний marginal contribution во всех возможных коалициях.

01

Efficiency

Сумма Shapley-значений всех каналов равна общей ценности конверсии. Ничего не теряется и не дублируется.

02

Symmetry

Каналы с идентичным вкладом во все коалиции получают одинаковую долю — никакого фаворитизма.

03

Null player

Канал, который ничего не добавляет ни в одной коалиции, получает 0. Никаких «подарков» за участие.

04

Additivity

Атрибуция двух независимых кампаний суммируется без перекосов — модель линейна.

Эти четыре аксиомы вместе характеризуют Shapley value уникально — нет другого правила распределения, которое им всем удовлетворяет. Источник: Wikipedia / Shapley value.

Расчёт Shapley value: пример на трёх каналах

Возьмём типовой сценарий: клиент дошёл до покупки через три канала — Search (поисковая реклама), Display (медийка) и Email (рассылка). Пройдите три шага — и увидите, откуда берётся «справедливая» доля каждого.

Расчёт Shapley value — пример

Три канала, восемь коалиций, шесть перестановок. Пройдите три шага — увидите, откуда берётся «справедливая» доля.

Сначала собираем таблицу: сколько конверсий приносит каждая возможная комбинация каналов в пути клиента. Порядок каналов внутри коалиции не важен — Shapley учитывает только их присутствие.

  • ни одного канала
    0конв.
  • Search
    60конв.
  • Display
    30конв.
  • Email
    50конв.
  • SearchDisplay
    90конв.
  • SearchEmail
    100конв.
  • DisplayEmail
    70конв.
  • SearchDisplayEmail
    120конв.

Каждая строка — это число конверсий при наличии именно этих каналов в пути. Без каналов конверсий нет (0). Все три канала вместе дают 120 конверсий — это и есть полная ценность, которую нужно справедливо распределить между каналами.

Расчёт Shapley value — 3 канала, 8 коалиций, 6 перестановок

Каналы: Search, Display, Email. Финальные Shapley values: Search = 55, Display = 25, Email = 40. Сумма = 120 = ценность grand coalition (efficiency axiom).

Coalition values

  • v() = 0
  • v(S) = 60
  • v(D) = 30
  • v(E) = 50
  • v(SD) = 90
  • v(SE) = 100
  • v(DE) = 70
  • v(SDE) = 120

Permutations and marginal contributions

  1. S → D → E: S +60; D +30; E +30
  2. S → E → D: S +60; E +40; D +20
  3. D → S → E: D +30; S +60; E +30
  4. D → E → S: D +30; E +40; S +50
  5. E → S → D: E +50; S +50; D +20
  6. E → D → S: E +50; D +20; S +50
Что показывает пример

Никакое простое правило (Last Click, First Click, Linear) такой картины не даст. Last Click отдал бы 100% последнему касанию. Linear — поровну по 33%. Shapley value учитывает, сколько канал реально добавляет в каждой возможной комбинации.

А что в продакшене

В реальной витрине Sessions каналов 5–10, конверсий тысячи в месяц. DataGo считает Shapley value на всём множестве путей клиента и обновляет дашборды по расписанию.

Когда Shapley value даёт максимум пользы

Подходит
  • 5–15 платных каналов с измеримым performance

    Shapley хорошо работает там, где конверсии чётко атрибутированы к каналу (deterministic identity), а каналов не больше десятка-полутора.

  • 5 000+ конверсий в месяц

    При меньшем объёме coalition-level статистика становится разреженной — Shapley values варьируются от запуска к запуску. Источник: Improvado.

  • Бюджет нужно защищать перед стейкхолдерами

    Shapley value — единственная атрибуция с математически доказанной справедливостью (4 аксиомы) и Нобелевской премией за основание.

  • Подозреваете синергию между каналами

    Shapley справедливо разделяет «бонус коалиции»: например, если медийка усиливает performance Search, обе модели получают часть лифта.

Не подходит
  • Длинный B2B-цикл с офлайн-касаниями

    Shapley игнорирует порядок и требует deterministic identity. Для long sales-cycle B2B лучше цепи Маркова.

  • Малый объём конверсий (<2 000–3 000/мес)

    Coalition-level данные становятся sparse, результат нестабилен. Начните с Linear/Time-decay и переходите на Data-Driven при росте объёма.

  • Важен порядок касаний

    Shapley order-independent: путь «Search → Email» и «Email → Search» получат одинаковую атрибуцию. Для жёсткой funnel-логики — цепи Маркова или Funnel-Based.

  • 15+ платных каналов

    2¹⁵ = 32 768 коалиций — точный расчёт неподъёмен; нужна Monte Carlo аппроксимация. Решение — сгруппировать каналы в укрупнённые группы.

Не уверены, ваш ли это случай? Обсудим — подскажем подходящую модель атрибуции под ваш кейс.

Посмотреть другие модели

Стоимость

от 25 000 ₽/мес

за data-driven модель атрибуции, без НДС

Финальная стоимость зависит от количества каналов и объёма данных. Мы рекомендуем разворачивать Shapley value параллельно с Funnel-Based атрибуцией в одной витрине Sessions — для сравнения и устойчивости решений.

Частые вопросы

Пять вопросов про Shapley value, которые задают чаще всего. Если вашего здесь нет — обсудим на звонке.

Это две Data-Driven модели атрибуции с разной логикой. Цепи Маркова считают removal effect — насколько падает вероятность конверсии при удалении канала из путей; учитывают порядок касаний через transition probabilities. Shapley value считает marginal contribution канала во всех возможных коалициях; игнорирует порядок, но строже соблюдает аксиомы справедливости.

На практике запускаем обе модели параллельно в витрине Sessions — если они согласны, решение по бюджету уверенное; если расходятся, это сигнал, что в воронке есть нелинейные или time-dependent эффекты.

Shapley value — единственная модель распределения, которая удовлетворяет одновременно четырём математическим аксиомам справедливости (Efficiency, Symmetry, Null Player, Additivity), доказано Ллойдом Шепли в 1953 году. За эту работу Шепли получил Нобелевскую премию по экономике в 2012 году. Никакое другое правило атрибуции (Last Click, Linear, Time-decay) этим аксиомам одновременно не удовлетворяет.

Для устойчивой Shapley-атрибуции рекомендуется не менее 5 000 конверсионных путей в месяц при 5–15 платных каналах. При меньшем объёме coalition-level data становится разреженной, а результаты — нестабильными от запуска к запуску. Google Analytics DDA, который использует Shapley value под капотом, требует минимум 400 конверсий за 28 дней. Если у вас меньше — начните с мульти-канальной модели (Linear или Time-decay) и переходите на Shapley по мере роста объёма.

Технически да, но не рекомендуется. Количество коалиций растёт как 2ⁿ: для 10 каналов — 1 024 коалиции, для 15 — 32 768, для 20 — больше миллиона. Точный расчёт становится непосильным, а Monte Carlo аппроксимация вносит sampling error. На практике мы группируем каналы: например, объединяем РСЯ + Я.Директ + Google Ads в «Search», все Display-сети — в «Display» — и считаем устойчивый Shapley на разумном числе укрупнённых каналов.

Shapley value по дизайну игнорирует порядок касаний — он смотрит только на присутствие/отсутствие канала в коалиции. Если у вас в воронке awareness-каналы (медийка) обязательно идут раньше performance-каналов (Search), Shapley это не отразит: путь «Display → Search → Конверсия» и «Search → Display → Конверсия» получат одинаковую атрибуцию.

Также Shapley работает на наблюдаемых данных и не устанавливает причинность — для строгого causality нужны RCT-эксперименты. Для funnel-логики добавляем Funnel-Based как ещё одну Data-Driven модель в витрине Sessions.

Развернём Shapley value в вашей витрине Sessions

Расскажите про текущий стек — какие каналы, какой объём конверсий, есть ли длинный цикл или офлайн-касания. Оценим, подойдёт ли Shapley value под ваш кейс, или начнём с более простой модели и масштабируем.

Если сообщите — успеем подготовить первичное предложение к созвону

Текущие основные задачи
Все модели атрибуции
Все модели

Все атрибуции DataGo

Data-Driven, многоканальные, одноканальные

Data-Driven

Funnel-Based

Вклад по шагам воронки — детальная страница скоро

Data-Driven

Цепи Маркова

Removal effect — детальная страница скоро