Чемпионат продлен до 10 июня.
Награждение пройдет 17 июня.

Бабушкин суп из данных: планирование рекламы

«Бабушка» занимается разработкой софта для анализа и моделирования контекстной рекламы в системе Google AdWords. На основе «Бабушкиных» прогнозов принимаются миллионы финансовых решений каждый день. Для того чтобы суп из данных, который варит Бабушка, был наваристым, ей необходимы квалифицированные помощники.

Как работает контекстная реклама?

Система контекстной рекламы применяется на страницах поисковых сервисов, таких как Google или Яндекс. Когда пользователь набирает запрос, система контекстной рекламы формирует список рекламодателей, которые отметили, что хотят быть показаны по данному словосочетанию и контексту (устройству, географии). Далее среди этих рекламодателей проводится обобщенный аукцион Викри, определяющий порядок, в котором объявления рекламодателей будут показаны. Если пользователь кликнет на объявление, рекламодатель уплачивает системе определенную аукционом цену.

Бабушкин суп из данных: планирование рекламы

Задача

После клика на объявление контекстной рекламы пользователь переходит на сайт рекламодателя. Там он имеет возможность совершить полезные для рекламодателя действия, такие как покупки, просмотр деловых предложений, заполнение заявок, и т. д. Подобные действия являются индивидуальными для каждого рекламодателя и отслеживаются с помощью специальной системы, называемой conversion tracking. Обычно отслеживают такие характеристики, как тип полезных событий, их количество и ценность.

Для того, чтобы спланировать реламную кампанию, рекламодателю необходимо знать величину Revenue per Click — сколько он заработает с каждого клика на объявление в определенном контексте (устройство, географическая локация пользователя, группа объявлений). Эту величину и предлагается предсказать. Более подробное описание задачи — на странице с данными.

Правила

  1. Запрещается регистрировать аккаунт от имени лица, которым не является участник (фальшивый аккаунт), при регистрации участник должен указывать только достоверную информацию и данные. Один человек имеет право на создание одного аккаунта на сайте, в противном случае, все аккаунты считаются недействительными и блокируются.

  2. Все сторонние программы, использованные в решении задачи, должны быть выпущены под лицензией, позволяющей их свободное коммерческое использование.

  3. В случае победы в чемпионате предоставить по электронной почте организатору всю необходимую для получения вознаграждения информацию.

  4. Запрещается использование программного обеспечения, нарушающего работу сайта и создающего возможность изменения результатов чемпионата, участники чемпионата, предпринявшие такие попытки, лишаются прав на участие в чемпионате и получение вознаграждения.

  5. Совершая действия, направленные на участие в чемпионате, участник дает свое согласие на обработку и хранение своих персональных данных и согласие со всеми пунктами правил. Организатор чемпионата гарантирует, что все персональные данные, сообщенные участниками чемпионата, будут храниться и обрабатываться в соответствии с положениями действующего законодательства Российской Федерации.

  6. Организатор оставляет за собой право в одностороннем порядке вносить изменения в настоящие правила без какого-либо специального уведомления, но с обязательной публикацией на сайте Boosters.pro. В случае несогласия с настоящими правилами или его обновлениями участники обязаны отказаться от использования сайта.

  7. К участию в конкурсе не допускаются аффилированные лица организатора и иные лица, прямо или косвенно связанные с организацией проведения данного чемпионата.

  8. Запрещен приватный обмен кодом и данными между участниками. Открытый обмен кодом разрешен в чате Telegram.

Вознаграждение

Общий призовой фонд – 300 000 рублей

Призовые места:

  1. 150 000 рублей
  2. 100 000 рублей
  3. 50 000 рублей

Расписание

  • 17.04.2018 - 10.06.2018 – Общий срок чемпионата.
  • 17.06.2018 - Награждение.

Бабушкин суп из данных: планирование рекламы

Оценка алгоритма

Задача

Оценка качества предсказаний происходит с помощь WRMSE, в качестве весов используется колонка Clicks. Так как Clicks является случайной величиной, для тестовой выборки она не предоставляется.

Пример решения

_ID_,_VAL_
0,1
1,0
...
952098,0
952099,0

Все индексы должны быть заполнены, в обратном случае - попытка сгорает.

Бабушкин суп из данных: планирование рекламы

Данные

Название
Скачать
babushka_data_frame.zip
EDA.ipynb
local_validation.ipynb

Вам доступны исторические данные о доходности рекламных кампаний Google Adwords в различных геолокациях. Задача — предсказать величину доходов с клика (Revenue per Click, RPC) для каждой группы объявлений и для каждой геолокации, представленных в тестовой выборке.

Файл
Описание
train.zip
обучающая выборка. Исторические данные с 01.02.2017 по 30.04.2017.
test.zip
тестовая выборка. Задача — предсказать величину доходов с клика (Revenue per Click, RPC) для тестовых данных за май и июнь 2017 г.
sample_submission.zip
образец корректных предсказаний в требуемом формате
google_geo_structure.csv
иерархия геолокаций Google.
extra_sq.zip
дополнительные данные, которые можно использовать для построения предсказаний. Содержат информацию о кликах и доходах по поисковым запросам для различных ключевых слов за период обучения.
extra_kw_structure.zip
дополнительные данные, которые можно использовать для построения предсказаний. Содержат информацию об иерархии кампаний (Campaign), групп объявлений (AdGroup) и ключевых слов (Keyword), а также текст ключевых слов (Criteria).
EDA.ipynb
Визуализация.
local_validation.ipynb
Пример генерации файла с предсказаниями.

Поля

Поле
Описание
CountryCriteriaId, RegionCriteriaId, MetroCriteriaId, CityCriteriaId, MostSpecificCriteriaId
идентификаторы геолокаций Google, соответствующие месту, где находился пользователь, кликнувший на объявление.

Поля

Для каждой строчки в train/test могут быть заполнены некоторые из этих колонок. Так, например, если ненулевыми значениями заполнены поля:
CountryCriteriaId = 1,
RegionCriteriaId = 2,
MostSpecificCriteriaId = 3,
то непосредственным родителем в графе геолокаций Google локации с идентификатором 3, к которой относятся клики в данной строчке, является локация с идентификатором 2, а локации с идентификатором 2 — локация с идентификатором 1.

AllConversions|*, AllConversionValue|*, Revenue|* — для каждого рекламодателя существует индивидуальный набор действий пользователя на сайте, каждое из которых имеет свою ценность и приносит определённый доход. В данных полях содержится информация о количестве подобных действий каждого типа, их ценности и полученного дохода соответственно. Название каждого поля содержит идентификатор рекламодателя и идентификатор типа действия пользователя (в соответствующем порядке).

Бабушкин суп из данных: планирование рекламы

Рейтинг участников

Рейтинг

Рейтинг строится на 30% тестового датасета, финальный рейтинг будет построен на 70% тестового датасета и может отличаться.

#
Участник
Решений
Результат
Лучшее
1
Елена Онищенко
49
66.082
2018-06-10 22:10:02
2
Никита Чуркин
18
66.103
2018-06-10 14:39:29
3
Роман Токмашев
21
66.107
2018-06-10 20:11:05
4
Павел
40
66.109
2018-06-10 14:13:25
5
Павел Мызников
5
66.110
2018-05-30 12:24:34
6
Алексей Забайкин
26
66.131
2018-06-09 21:26:38
7
Константин Белотелов
19
66.147
2018-06-10 14:31:24
8
Иван Тимошилов
15
66.154
2018-06-10 01:07:52
9
Алексей Романов
4
66.157
2018-05-20 15:45:22
10
Кирилл Гудков
23
66.238
2018-05-19 01:48:20
11
Максим Мотьев
36
66.251
2018-06-06 23:21:02
12
Виталий Куделя
32
66.260
2018-05-18 22:08:12
13
Павел Челяпин
28
66.270
2018-06-09 23:56:34
14
Андрей Кулаков
16
66.306
2018-05-09 00:05:06
15
Илья Тетерников
32
66.318
2018-06-08 21:03:58
16
Евгений Семёнов
19
66.325
2018-04-26 22:12:19
17
Алексей Смирнов
36
66.326
2018-06-10 21:25:28
18
konstantin nikolaev
8
66.333
2018-05-19 15:54:35
19
Сергей Кабанов
17
66.340
2018-06-08 18:21:47
20
Kir V
30
66.347
2018-06-08 06:12:21
21
Роман Загребаев
9
66.347
2018-06-09 23:53:35
22
Кирилл Хрулёв
6
66.347
2018-06-10 00:17:46
23
Анзор Березгов
21
66.347
2018-06-03 12:11:54
24
Михаил Белан
13
66.347
2018-05-08 11:14:40
25
Юрий Беллавин
11
66.361
2018-06-10 01:01:06
26
Глеб Михаеску
2
66.361
2018-06-10 21:09:58
27
Олег
9
66.362
2018-05-06 01:55:07
28
Анатолий
14
66.372
2018-05-31 17:48:56
29
Евгений Демидович
7
66.374
2018-06-01 21:28:32
30
Антон Кудинов
5
66.388
2018-05-27 00:40:37
31
Анатолий Ильенков
4
66.393
2018-05-21 12:24:48
32
Константин Гаврильчик
5
66.393
2018-04-23 12:13:56
33
Даниил Щесняк
3
66.396
2018-05-09 10:00:59
34
Константин Жариков
7
66.398
2018-06-05 23:50:08
35
Алексей Мамонтов
6
66.400
2018-06-10 12:39:29
36
Николай Духонченко
23
66.401
2018-04-22 23:43:51
37
Нина Подкур
12
66.409
2018-06-09 15:58:10
38
Василий Рубцов
6
66.416
2018-04-29 21:35:07
39
Георгий Коноплич
3
66.418
2018-05-07 20:27:26
40
Андрей Долганов
6
66.425
2018-06-10 21:41:24
41
Денис Воротынцев
9
66.432
2018-05-24 13:44:22
42
Евгения Кравчук
2
66.443
2018-06-10 23:07:13
43
Григорий Дымов
3
66.446
2018-05-26 00:31:58
44
Василий Столбов
7
66.474
2018-05-03 12:10:15
45
Александр Ничипоренко
5
66.478
2018-06-10 23:50:22
46
Аркадий Душацкий
2
66.517
2018-05-29 13:45:35
47
Данил Закиров
5
66.565
2018-06-08 12:34:44
48
Андрей Автомонов
12
66.577
2018-04-24 15:10:49
49
Святослав Ковалёв
3
66.646
2018-06-06 17:13:37
50
Aleksandra Veselova
3
66.667
2018-04-18 19:40:34
51
Антон Гарбузов
1
66.720
2018-05-31 17:35:12
52
Александр Шатилов
7
66.736
2018-06-06 17:14:29
53
Сергей Арефьев
8
66.736
2018-05-23 06:50:55
54
Роман Пьянков
5
66.736
2018-04-24 01:10:52
55
Антон Гуртовой
8
66.794
2018-06-05 21:53:31
56
Екатерина Аладьева
3
66.796
2018-04-21 13:58:55
57
Семен Николаев
16
66.848
2018-05-08 18:48:55
58
Константин Млынарчик
2
66.914
2018-05-31 22:43:23
59
Николай Ванаев
19
67.082
2018-06-05 23:10:03
60
Владислав Баланда
24
67.186
2018-04-27 14:42:51
61
yury koshelyuk
7
67.289
2018-06-01 12:29:32
62
Лоокуут Стручков
3
67.343
2018-06-06 14:09:53
63
Дмитрий Кулагин
2
67.348
2018-05-07 14:58:46
64
Тимур Летягин
2
67.398
2018-04-22 19:11:02
65
Iurii M
4
67.398
2018-06-09 23:59:39
66
Илья Денисов
1
67.398
2018-06-07 01:19:02

Бабушкин суп из данных: планирование рекламы

Финальный рейтинг

#
Участник
Результат
Лучшее
1
Елена Онищенко
67.444
2018-06-10 22:10:02
2
Роман Токмашев
67.464
2018-06-09 15:30:53
3
Павел Мызников
67.469
2018-05-30 12:24:34
4
Павел
67.479
2018-06-10 14:13:25
5
Иван Тимошилов
67.489
2018-06-10 01:07:52
6
Алексей Забайкин
67.498
2018-06-08 21:01:34
7
Никита Чуркин
67.515
2018-06-10 14:39:29
8
Константин Белотелов
67.520
2018-06-10 14:31:24
9
Алексей Романов
67.525
2018-05-20 15:45:22
10
Максим Мотьев
67.542
2018-06-04 23:44:21
11
Кирилл Гудков
67.625
2018-06-10 18:00:52
12
Павел Челяпин
67.633
2018-06-09 23:56:34
13
Виталий Куделя
67.652
2018-05-18 00:28:58
14
Алексей Смирнов
67.668
2018-04-26 13:37:57
15
Андрей Кулаков
67.668
2018-05-09 00:05:06
16
Илья Тетерников
67.670
2018-06-08 21:03:58
17
Олег
67.673
2018-05-06 01:57:17
18
Kir V
67.676
2018-06-07 22:07:55
19
Роман Загребаев
67.679
2018-06-09 23:53:35
20
Глеб Михаеску
67.682
2018-06-10 21:09:58
21
Евгений Семёнов
67.686
2018-04-28 19:05:48
22
Юрий Беллавин
67.686
2018-06-05 11:42:37
23
Сергей Кабанов
67.687
2018-06-09 01:26:17
24
Анзор Березгов
67.694
2018-06-04 00:15:44
25
Евгений Демидович
67.700
2018-06-01 21:28:32
26
Кирилл Хрулёв
67.701
2018-06-10 00:17:46
27
Анатолий
67.704
2018-05-31 17:48:56
28
Василий Рубцов
67.720
2018-04-29 21:35:07
29
Константин Гаврильчик
67.722
2018-04-23 13:49:07
30
Антон Кудинов
67.732
2018-05-25 23:56:59
31
Евгения Кравчук
67.735
2018-06-10 23:07:13
32
Даниил Щесняк
67.736
2018-05-09 10:00:59
33
Анатолий Ильенков
67.744
2018-05-21 12:24:48
34
Константин Жариков
67.746
2018-06-05 23:50:08
35
Михаил Белан
67.747
2018-06-06 02:16:44
36
Александр Ничипоренко
67.765
2018-06-10 23:50:22
37
Николай Духонченко
67.766
2018-04-23 00:06:21
38
Денис Воротынцев
67.766
2018-05-24 13:44:22
39
Алексей Мамонтов
67.775
2018-06-10 12:39:29
40
Андрей Долганов
67.784
2018-06-10 21:41:24
41
Нина Подкур
67.795
2018-06-09 15:58:10
42
Григорий Дымов
67.796
2018-05-26 00:31:58
43
Георгий Коноплич
67.802
2018-05-07 20:27:26
44
Аркадий Душацкий
67.837
2018-05-29 14:46:21
45
Андрей Автомонов
67.866
2018-04-24 15:10:49
46
konstantin nikolaev
67.866
2018-04-19 16:56:31
47
Василий Столбов
67.869
2018-05-03 12:10:15
48
Данил Закиров
67.933
2018-06-08 12:34:44
49
Святослав Ковалёв
67.979
2018-06-06 17:13:37
50
Семен Николаев
68.023
2018-05-08 18:48:55
51
Aleksandra Veselova
68.032
2018-04-18 19:40:34
52
Антон Гарбузов
68.168
2018-05-31 17:35:12
53
Александр Шатилов
68.184
2018-06-06 17:14:29
54
Сергей Арефьев
68.184
2018-05-23 06:50:55
55
Роман Пьянков
68.184
2018-04-24 01:10:52
56
Антон Гуртовой
68.193
2018-06-03 14:51:41
57
Екатерина Аладьева
68.235
2018-04-21 13:58:55
58
Константин Млынарчик
68.336
2018-05-31 22:43:23
59
Владислав Баланда
68.580
2018-04-27 14:42:51
60
Лоокуут Стручков
68.723
2018-06-06 14:09:53
61
Дмитрий Кулагин
68.741
2018-05-07 14:58:46
62
Николай Ванаев
68.777
2018-06-10 23:17:02
63
Тимур Летягин
68.778
2018-04-22 19:11:02
64
Илья Денисов
68.778
2018-06-07 01:19:02
65
Iurii M
68.778
2018-06-09 23:59:39
66
yury koshelyuk
70.102
2018-06-01 14:36:32

Для участие в чемпионате, Вы должны быть зарегистрированным пользователем.

Идёт загрузка Вашего файла. Подождите...