Предсказание результатов футбольных матчей

Первый чемпионат в формате песочницы на Boosters.pro, вам предстоит предсказывать результаты футбольных матчей. В качестве датасета участникам предоставляется анонимизированная информация по более чем 20 000 футбольных матчей. Чемпионат идеально подойдёт для тех, кто только начинает заниматься машинным обучением и хочет получить практику на реальных данных. В baseline_football.ipynb предложен вариант простого решения задачи.

Для каждой пары команд вам предстоит предсказать вероятности трёх исходов (победа домашней команды, победа гостевой команды и ничья).

Стадион

Правила

  1. Запрещается регистрировать аккаунт от имени лица, которым не является участник (фальшивый аккаунт), при регистрации участник должен указывать только достоверную информацию и данные. Один человек имеет право на создание одного аккаунта на сайте, в противном случае все аккаунты считаются недействительными и блокируются.

  2. Все сторонние программы, использованные в решении задачи, должны быть выпущены под лицензией, позволяющей их свободное коммерческое использование.

  3. Запрещается использование программного обеспечения, нарушающего работу сайта и создающего возможность изменения результатов чемпионата. Участники чемпионата, предпринявшие такие попытки, лишаются прав на участие в чемпионате и получение вознаграждения.

  4. Принимая участие в чемпионате, участник автоматически дает свое согласие на обработку и хранение своих персональных данных, а также соглашается со всеми пунктами этих правил. Организатор чемпионата гарантирует, что все персональные данные, сообщенные участниками чемпионата, будут храниться и обрабатываться в соответствии с положениями действующего законодательства Российской Федерации.

  5. Организатор оставляет за собой право в одностороннем порядке вносить изменения в настоящие правила без какого-либо специального уведомления, но с обязательной публикацией на сайте Boosters.pro. В случае несогласия с настоящими правилами или их обновлениями участники обязаны отказаться от использования сайта.

  6. Запрещен приватный обмен кодом и данными между участниками. Открытый обмен кодом разрешен в чате Telegram.

Расписание

Начало чемпионата 14.06

Чемпионат будет доступен в формате песочницы бессрочное время.

Предсказание результатов футбольных матчей

Оценка алгоритма

Метрикой качества в задаче является LogLoss

LogLoss

Вам необходимо для каждой пары команд вывести - вероятности трех исходов (победа домашней команды, победа гостевой команды, ничья)

Пример решения

Ваше решение должно соответствовать примеру, отправлено в формате .csv.
Файл с решением в следующем формате:

,draw,win,lose
0,0.236,0.273,0.489
1,0.288,0.565,0.145
2,0.264,0.546,0.189
3,0.264,0.546,0.189
...
7207,0.187,0.220,0.591
7208,0.333,0.512,0.159
7209,0.254,0.525,0.220
7210,0.321,0.490,0.188

Все индексы должны быть заполнены, в обратном случае - попытка сгорает.

Предсказание результатов футбольных матчей

Данные

Для каждого матча (пары команд) из файла test.csv вам необходимо предсказать вероятность всех исход матча: победа домашней команды, победа гостевой или ничья. Необходимо обратить внимание, что некоторые из полей в тестовом датасете принимают только значения NaN (например, мы не можем знать до матча, кто из игроков получит карточки)

Файлы

Название
Скачать
input.tar.gz
baseline_football.ipynb

Описание данных

Колонка
Описание
tour
номер тура данного чемпионата в данном году
target
целевая переменная, принимает значения 0, 1 или 2 - ничья, победа или поражение домашней команды
team_home
название домашней команды
team_away
название гостевой команды
team_away_squad
состав гостевой команды
team_home_squad
состав домашней команды
team_away_substitution
замены гостевой команды
team_home_substitution
замены домашней команды
team_away_reserved
резервные игроки гостевой команды
team_home_reserved
резервные игроки домашней команды
team_away_red_cards
игроки получившие красные карточки в гостевой команде
team_home_red_cards
игроки получившие красные карточки в домашней команде
team_away_yellow_cards
игроки получившие желтые карточки в гостевой команде
team_home_yellow_cards
игроки получившие желтые карточки в домашней команде
team_away_score
количество голов забитых гостевой командой
team_home_score
количество голов забитых домашней командой
champ
название чемпионата
time
дата матча

Предсказание результатов футбольных матчей

Таблица участников

Рейтинг

Рейтинг строится на 30% тестового датасета, финальный рейтинг будет построен на 70% тестового датасета и может отличаться.

#
Участник
Решений
Результат
Лучшее
1
Екатерина Берендеева
32
0.9959
2018-07-16 10:09:31
2
Илья Соломатин
1
0.9965
2018-06-23 01:51:01
3
Kir V
7
0.9992
2018-06-17 09:48:53
4
Никита Гурьянов
8
1.0066
2018-06-17 05:11:55
5
Александр Калмыков
5
1.0159
2018-06-17 00:30:05
6
Владислав Баланда
4
1.0171
2018-06-18 01:47:37
7
Максим Керемет Керемет
6
1.0216
2018-06-19 12:30:30
8
Вячеслав Пацёра
9
1.0253
2018-06-17 00:02:03
9
Антон Андрейцев
4
1.0296
2018-06-18 12:33:04
10
Алексей Москаленко
1
1.0320
2018-06-19 20:59:30
11
Михаил Сливин
1
1.0324
2018-06-15 13:48:05
12
Антон Гарбузов
1
1.0328
2018-06-14 13:26:31
13
Остап Скрыша
1
1.0328
2018-07-13 17:44:28
14
Zapevalin
2
1.0394
2018-06-23 15:24:22

Для участие в чемпионате, Вы должны быть зарегистрированным пользователем.

Идёт загрузка Вашего файла. Подождите...