Футбол

Экс-футболист придумал, как оценивать силу любых игроков мира. И выбирать их на рынке, словно помидоры

Экс-футболист придумал, как оценивать силу любых игроков мира. И выбирать их на рынке, словно помидоры
Фото: © Si14 Analytics
Алексей Трипутень выступал за ЦСКА и «Москву», был спортивным журналистом. Сейчас он возглавляет аналитический департамент компании, предлагающей несколько любопытных цифровых инноваций.

Весной «Матч ТВ» уже писал про новый подход к футбольной статистике, благодаря которому компания, представляемая Трипутенем, удостоилась российского приза как проект года. Там начинали с внедрения роботизированных торговых систем для неэффективных рынков, а вышли на нейрофонды, искусственный интеллект и прочие неожиданные для футбола штуки.

  • Зачем нужен индекс оценки игроков? 
  • Насколько он показателен? 
  • В чем недостаток других подобных критериев? 
  • Чем искусственный интеллект отличается от калькулятора? 
  • Как получить представление о полезности игрока из одного чемпионата в другом? 
  • При чем тут страховой бизнес и искусственное зрение? 
  • Не только тренер оценивает игроков в цифрах, но и президент тренера, — такое реально? 
Алексей Трипутень / Фото: © Матч ТВ

— С тех пор у нас прибавилось новостей, — рассказывает Трипутень. — Закончили работу над одним из самых любопытных продуктов — индексом качественной оценки игрока. Попытки придумать подобное предпринимались и раньше. Всем ведь интересно понять, не копаясь в грудах цифр, хорош ли футболист вообще и в конкретных обстоятельствах в частности. В чем его слабые и сильные стороны. Насколько он совместим с той или иной тактикой, лигой, командой. Как на прогресс или регресс игроков влияют тренеры. Что происходит с футболистами после смены клуба, травм и даже свадеб.

— «Спартаку» такое точно не помешало бы: там о профессиональных возможностях игроков и тренеров узнают после подписания контракта.

— Теперь смогут до. И не просто узнать, а увидеть и чуть ли не повертеть в руках.

— В каком смысле?

— Индекс Si14 — не только число. Он позволяет получить визуальное представление о классе и состоянии футболиста. Ниже расскажу, как все работает. И покажу.

— Чем это отличается от индексов, разработанных до вас?

— Их не так много. Но все имеют погрешности, пусть и разной природы. Один из статистических сайтов предлагает оценку наподобие школьной, только выставленную по десятибалльной шкале. Чистая вкусовщина. Американская медиагруппа придумала рейтинги для клубов и сборных, помогающие прогнозировать исход турниров на основании предыдущих выступлений. Вроде все по-честному, но клубы с небольшим бюджетом, а таких большинство, каждый год значительно обновляют состав. Вновь собранная команда не имеет отношения к результатам предыдущих сезонов, ее оценка, построенная на этом, нерелевантна.

Одна известная статистическая компания вышла на суммарный показатель полезности, отражающий КПД футболиста. Эффективность игрока рассчитывается на основании линейной формулы: сделал это, плюс это, плюс еще то. Такой подход очень примитивен и близок к пальцу в небе. Наша история совсем про другое.

— Тогда давайте о ней.

Фото: © Si14 Analytics

— Для начала пара слов о команде, которую мы собрали специально под эту задачу. Понимая приоритет математического подхода, искали суперпрофессионалов, ничуть не интересуясь их скиллами в футболе. Например, за общение с искусственным интеллектом у нас отвечал человек, разработавший программу искусственного зрения. Это как в фильмах про будущее, когда вы попадаете в объектив камеры торгового центра и через несколько секунд видите рекламу, адресованную исключительно вам.

С математическими моделями работал гуру из страхового бизнеса, именно благодаря опыту Андрея в обсчете страховых рисков наша методика приобрела стройный логический вид. Конечно, не обошлось без профильных футбольных аналитиков: искусственному интеллекту пришлось доказывать свою правоту нашему мегамозгу Юре. В итоге общими усилиями довели эту историю до красивой развязки.

— В чем она состоит?

— Итак, за расчеты у нас отвечает искусственный интеллект. Фундаментом служит массив данных, которые мы покупаем у нескольких лидеров статистической отрасли. Новейшие компьютерные программы позволяют разложить перфоманс игрока на молекулы и сравнить его с конкурентами по позиции. Каждое движение футболиста регистрируется и учитывается искусственным интеллектом при создании статистических моделей. Любая новая информация делает модели более точными и одновременно позволяет увидеть отклонение игрока от эталонных значений. В цифровом выражении это и есть индекс Si14. Его можно рассчитать для любого футболиста мира.

— Ваши компьютеры попросту считают быстрее и больше, чем другие?

— Наши компьютеры считают иначе, чем другие. Они не складывают цифры — они описывают игровые качества футболистов сложными нелинейными кривыми. А уже потом для наглядности переводят это в цифровые и графические образы, которыми удобно пользоваться.

Искусственный интеллект еще до обсчетов конкретного футболиста знает, что собой представляет, к примеру, образцовый вингер чемпионата Бельгии или вратарь датской лиги. Лекала точные — они создаются на базе нескольких миллионов показателей, ежедневно поступающих к нам в обработку. Сравнение игрока с шаблоном характеризует его уровень. А поскольку индекс Si14 можно посчитать за любой период времени, хоть за тайм, хоть за год, он демонстрирует еще и динамику уровня. Мы можем четко видеть, сдает игрок или прибавляет. И после чего это происходит. И в каких элементах игры. И на что он будет способен в ближайшей перспективе.

Юрий Жирков / Фото: © ФК «Зенит»

— Уверены, что можно описать одной цифрой игроков разных амплуа?

— Во-первых, цифра не одна. Метрики футболистов разбиты на три группы: оборонительные, атакующие и действия на мяче. Каждая из групп дробится на подгруппы, ведь отбор, условно, можно совершить на разных участках поля, и это окажет разное влияние на результат. То же относится к типам передач, подключениям защитников, действиям в прессинге — ко всему.

Лекала формируются не за счет того, что все сваливается в кучу, а наоборот, за счет максимальной детализации. Это как в шахматах, где компьютеры учились играть, базируясь: а) на гигантском количестве просчитанных комбинаций; б) на предыдущем опыте всех шахматистов мира. Искусственный интеллект не думает, но он знает, как думали другие, и потому идет к цели кратчайшим путем. Наш индекс построен на схожей идее: если знать, как было, поймешь, как должно быть.

— Что во-вторых?

— Прежде всего мы определили список метрик, оказывающих наибольшее влияние на КПД игрока. То есть не мы, а компьютер, конечно. Представьте, что где-то обсчитывают передачи защитника поперек поля с коэффициентом 0,04. То есть там решили, что вклад этого действия в ТТД игрока составляет 4%. Но почему 4? Чем это продиктовано? Скорее всего, взято из головы, на глазок, по наитию.

У нас, напомню, человеческий фактор исключен из расчетов. Компьютер прогнал через себя массу данных и определил те метрики игрока, от которых реально зависит его полезность. Степень зависимости тоже вычислил. Мы просмотрели, что-то подчистили, сопоставили со здравым смыслом и логикой, с живыми примерами. И поручили искусственному интеллекту применять для обсчета только математически обоснованные параметры.

— Интересно, что вы подчистили?

— Компьютер выяснил: на качество игрока не влияет количество зарабатываемых им предупреждений, умение бить с 11-метровой отметки, попадания в штангу и перекладину. Все это есть, но вне увязки с чем-либо, выпадает из логического контекста. Тогда зачем считать?

— Вы снабдили искусственный интеллект показателями, необходимыми для вычислений. Чем он дальше отличается от обычного калькулятора?

— Деревом решений — методологией, которая используется в других сферах деятельности, например, в страховом бизнесе. Еще раз скажу: наш метод не про умножить и сложить, компьютер применяет другой подход. В грубом изложении это просев футболистов через набор референсных, то есть показательных метрик. Сколько забил в минувшем туре игрок X? Два. Уходит в одну корзину. Игрок Y? Ноль. В другую. Игрок Z? Один. В третью. Следующая развилка: сколько обостряющих передач сделал Х? Три. Проследуйте выше по дереву. Y ни одной? Ниже. И так далее.

Метрик несколько десятков, выстроены они по степени важности. В итоге для каждого игрока формируются воображаемые кривые. И любая из них хоть чуть-чуть, но подправляет медианные значения. Есть в физике такое понятие — квантование, позволяет множеством мелких уступчиков описать гладкую линию. Полностью они не совпадут никогда, но чем мельче уступы, тем незаметнее разница. Так и у нас: чем больше данных для анализа, тем достовернее шаблон оценки игроков. А значит, и наш индекс.

— Как он выглядит?

— По форме это тетраэдр. Верхний шарик — значение индекса, шарики в основании — умение действовать в обороне, в атаке и на мяче. Чем больше диаметр шариков и чем дальше они от оси, тем качество футболиста выше.

Фото: © Si14 Analytics

— Индекс — среднее арифметическое трех нижних составляющих?

— Разумеется, нет. Он от них зависит, но не линейно, поскольку есть метрики, не входящие в тройку главных.

— Попроси я вас найти нужного игрока в чемпионате Албании, разложите передо мной горку тетраэдров?

— Да. Это визуальная обертка, способ приучить пользователей к некоему стандарту восприятия. Вы приходите на рынок, видите помидоры. В сознании включается: красный и большой — хорошо, зеленый и маленький — плохо, желтый и бурый — странность или экзотика. Надеемся, и наш индекс со временем начнут воспринимать глазами, а не как сухомятку цифр. Тем более что у нас тоже предусмотрена цветовая градация. Только обратная помидорам: уход в красное — слабые показатели, в зеленое — сильные.

— Проверяли индекс в настоящем деле?

— Не раз. Занимаемся этим много месяцев, так что доводилось и методику тестировать на тех, кто отвечает понятию сильного игрока, и компьютер вручную контролировать. Копались в огромных массивах информации. Убедились: все работает как надо.

— Вы обсчитываете футболиста, например, из чемпионата Чехии. А его хотят позвать в Англию. Ясно, что индекс качества вычислен с учетом чешских партнеров и соперников. Что он сообщит о новичке английскому менеджеру?

— Прежде всего методика подсчета не зависит от страны. Мы применяли один и тот же алгоритм в чемпионатах Чехии и Испании — убеждались в его верности.

По умолчанию игрок оценивается как в собственном чемпионате, так и в мировом контексте. Мы понимаем, что каждая лига имеет свою специфику, разный уровень сопротивления, стилистические характеристики, и все это находит отражение в действиях футболистов. Поэтому компьютер подготовил профайлы всех чемпионатов планеты, это живые матрицы, меняющиеся с каждым проведенным туром. Благодаря им не составляет труда сравнить любых футболистов мира, причем не количественно, а качественно. Таким же образом можно рассчитать индекс игрока относительно чемпионатов хоть Англии, хоть Марокко. Сопоставляя профайлы лиг с модельными характеристиками футболиста, мы без труда оценим его внутри любого турнира.

Фото: © Si14 Analytics

— При наложении одного индекса на другой, чешского на английский, искусственный интеллект пересчитает тетраэдр, изменив его составляющие. Это позволит с высокой вероятностью предположить, как проявит себя выходец из одного чемпионата в другом.

Кстати, еще один индекс, над которым работаем, — тренерский. Есть множество метрик, характеризующих людей этой профессии. И много параметров, позволяющих вывести шаблоны для сравнений.

— Хватит пользователю лишь четырех цифр, описывающих футболиста?

— Их далеко не четыре. Для неискушенного потребителя будет достаточно и нашего основного тетраэдра. Он покажет, например, что шикарный форвард совсем не отходит в оборону, сильный защитник не подключается к атакам, а бомбардир не владеет техникой, забивая за счет чутья и мощи. Нижние шарики в этом смысле — расшифровка качеств, верхний — показатель общей эффективности.

Ну, а для любителей «острого» готовы приоткрыть двери в аналитические дебри. Кликая на составные части индекса, они смогут окунуться в море цифр, метрик, стилистических особенностей футболиста.

Большой плюс нашего индекса в том, что он способен учитывать изменения в футбольном мире и реагировать на новые тенденции. Представьте: завтра в очередной раз скорректируют правила офсайда. Искусственный интеллект не выкинет эту метрику из обсчета, а изменит алгоритм вычислений. Вслед за лекалами поменяются и тетраэдры, но полнота картины сохранится. Умение переобучаться — огромное преимущество искусственного интеллекта. И чем больше футболистов он обсчитывает, тем его выводы точнее. Вообще, расширение лекал — будущее всей цифровой индустрии.

— «Баланс», «вовлеченность», «стабильность» — за что отвечают эти показатели, расположенные под тетраэдром?

Фото: © Si14 Analytics

— Это то, что выбивается из сложного математического обсчета, но поддается простому. Stabillity отражает постоянство игрока в проявлении его лучших качеств. Хоть по сезону, хоть по матчу. Можно отдать пять голевых передач в игре, где у слабого соперника было два удаления. А можно — в пяти разных матчах против лидеров чемпионата. Согласитесь, не одно и то же.

Involvement, вовлеченность — число активных действий в единицу времени. И доля таких действий в футболе всей команды. Оценивается умение не выключаться из игры, не пропадать из виду, оставаясь на поле. Марио Фернандес, допустим, значительно опережает по вовлеченности всех российских коллег по амплуа, постоянно участвуя и в атакующих, и в оборонительных действиях. Другие реже принимают решения и вообще менее заметны. Как правило, этим параметром определяются лидерские качества игрока и его важность в команде, влияние футболиста на общекомандный перфоманс.

Balance характеризует разброс козырей футболиста. Иногда тренеру нужен универсальный солдат с высоким показателем стабильности, а в другой раз он готов простить человеку все, лишь бы тот забивал или выносил мячи подальше. Такого игрока сбалансированным не назовешь, но ведь и бесполезным тоже.

Все три показателя рассчитываются по тому же массиву данных и сверяются по тем же метрикам, что и индекс. Но при этом облегчают выбор для погруженных в тему людей.

— Кстати, о выборе. Каково практическое применение вашего индекса?

— Вопрос непростой. Пока не видим удобного алгоритма работы с клубами. Себестоимость наших услуг высокая — дорогие данные, сотрудники, оборудование. Далеко не все смогут себе такое позволить. Во-вторых, для эффективного применения любой аналитики необходимо быть максимально погруженным в специфику работы клуба. Какую команду строит тренер, какие у него требования к игрокам, какой тип футболистов он будет использовать, а какие модельные характеристики ему не нужны. Не все захотят открыть для посторонних внутреннюю кухню, поэтому мы не ищем клиентов. Работаем с клубами на личных контактах и просьбах, по знакомству, можно сказать.

Леонид Слуцкий / Фото: © ФК «Рубин»

— Для нас очевидно, что создан удобный инструмент для всех вовлеченных в футбольную индустрию. Тренер сможет наглядно увидеть, как меняются игроки за любой период времени. Президент клуба — как повлиял на команду приход нового тренера. Клубные аналитики, селекционеры, агенты тоже в числе интересантов. Вариантов использования индекса много, но лично мне кажется, что лучше отпустить наше дитя в свободное плавание, предложить его, например, болельщикам, пользователям нашей биржи ставок.

Ничего подобного в футболе раньше не существовало, поэтому мы пока просто не видим всех открывающихся возможностей и радуемся успешному завершению работы, в которую вложено много сил и новаторских идей. Ясно, что у многих появится шанс на более глубокое погружение в мир футбола. Об остальном еще предстоит подумать.

Читайте также: