Новости

Института математики и информационных технологий

Студенты ИМИТ и ИЦТЭФ стали лауреатами Московского студенческого DATA-хакатона


Команда Алтайского государственного университета «ASU_TEAM» стала обладателем диплома лауреата (4 место из 16 команд) и отмечена жюри за интересное решение и нахождение новых признаков для решения предложенной задачи.

    Первое место заняла команда Высшей школы экономики «MegaQuant», второе — команда Финансового университета при Правительстве РФ «Data Wizards» и третье — команда Московского городского университета «Парсики».

    «Мы решили, что надо участвовать в DATA-хакатоне, поскольку он организовывался в партнерстве с Университетским консорциумом исследователей больших данных, членом которого наш университет является уже несколько лет. Сначала был предварительный отбор: из более чем 30 заявок эксперты отобрали к участию в основном этапе 16 команд университетов РФ. А затем с 16 по 19 февраля команда Алтайского государственного университета «ASU_TEAM» приняла участие в основной части Московского студенческого DATA-хакатона, проходившего на базе Московского городского педагогического университета».

    Заведующий кафедрой информатики Алтайского государственного университета Денис Козлов рассказывает

    В состав команды классического вуза вошли:

    • Александр Болгов, студент магистратуры института математики и информационных технологий и руководитель команды
    • Валентин Карев, студент бакалавриата института цифровых технологий, электроники и физики
    • Шахзод Нуридинов, студент бакалавриата института математики и информационных технологий
    • Александр Пикуль, студент бакалавриата института цифровых технологий, электроники и физики

    В жюри конкурса вошли:

    • Дмитрий Звонарев, заместитель директора многофункционального студенческого центра МГПУ;
    • Роман Куприянов, начальник управления информационных технологий и сервисов МГПУ;
    • Борис Ярмахов, доцент департамента информатизации образования Института цифрового образования МГПУ;
    • Павел Винар, руководитель отдела научных исследований и развития систем распределенного хранения данных компании MAXIMUM EDUCATION;
    • Ольга Проневич, старший ученый отдела научных исследований и развития распределенных систем БД компании MAXIMUM EDUCATION;
    • Александр Хвостов, директор по связям с образовательным сообществом компании MAXIMUM EDUCATION;
    • Александра Данилова, руководитель спецпроектов компании ГлобалЛаб;
    • Андрей Чертихин, преподаватель учебного центра ARENADATA.

    В ходе соревнований командам на выбор предлагались 3 задачи от компании MAXIMUM EDUCATION:

    • 1) анализ визуальных особенностей преподавателей на онлайн-уроках и их связь с образовательными метриками.
    • 2) оценка влияния активности пользователя на образовательные метрики.
    • 3) прогноз вероятности расторжения договора клиентом – задача оттока пользователей образовательного портала.

    «Команда нашего университета остановилась на третьей задаче. Были получены данные от организаторов, выполнены их фильтрация, очистка и заполнение пропусков. Самое сложное в этой задаче, на наш взгляд, заключалось в объединении нескольких баз данных с совершенно разной информацией. Так, например, ученик анализируемой онлайн-школы мог заключать договор на обучение в разных учебных группах, но при этом расторгать договор на обучение только с одной-двумя группами и продолжать учиться в других, некоторые выгруженные базы данных имели сведения только о пользователях, а информацию о группе было возможно получить, только анализируя другие две таблицы. И большую часть времени соревнования мы занимались подготовкой данных для дальнейшей работы модели машинного обучения. Затем была построена и обучена модель машинного обучения для прогнозирования вероятности оттока учащихся онлайн-школы».

    Валентин Карев рассказывает

    После обучения модели, которая имела достаточно высокую точность предсказания риска расторжения договора, студенты АлтГУ добавили новый признак – «среднее время неактивности» пользователя, которое возможно было рассчитать, имея в базе данных время записи результата прохождения теста или посещения занятия. И добавление этого признака увеличило точность модели на несколько процентов.

    18 февраля результаты участников презентовались жюри. Во время защит и презентаций решений было очень интересно смотреть решения других команд, делится Валентин Карев, некоторые были совершенно не похожи на наше, но по-своему тоже хорошие, что помогло нам увидеть другие стороны и подходы к решению подобных задач.

    Новость от 28 февраля 2023г.