Важность обработки и анализа больших данных сегодня ни у кого не вызывает сомнения. Но обычному студенту получить доступ к большим данным далеко не так просто. Конечно, есть различные модельные данные, которые находятся в открытом доступе и доступны для проведения различных тестов. Например, данные из набора KDDCUP 99 содержат около 40 миллионов запросов, характеризующих сетевую активность. Но часто это «неживые» данные, работать с которыми со временем становится скучно. Для решения этой проблемы и в преддверии конференции «Большие данные (Big Data), машинное обучение (Machine Learning)» управление информатизации продемонстрирует работу с «живыми» большими данными. Участникам конференции будут выданы фитнес-браслеты, данные с которых в режиме реального времени будут собираться в университетскую систему хранения данных и тут же обрабатываться в собственном вычислительном кластере.
На этих данных будут рассмотрены основные примеры. Старший преподаватель кафедры информатики факультета математики и информационных технологий Андрей Мураенко познакомит со своим исследованием и продемонстрирует, как, используя эти данные, мы можем диагностировать различные состояния человека.
Финальной точкой в сборе собственного набора больших данных станет игра «Иголка в стоге сена». Цель игры – в результате обработки больших данных и их кластеризации обнаружить такой кластер, который бы находился на максимальном расстоянии от других. Если перейти от математического языка к повседневному, то участникам конференции необходимо будет выявить «постороннего человека» на основании анализа данных, поступающих с фитнес-браслетов участников конференции. Победителей, сумевших совершенно точно определить нужного человека, ждут призы – современные фитнес-браслеты.
Приобретение призов и проведение самого мероприятия осуществляются в рамках Программы развития деятельности студенческих объединений.