Название спецкурса на русском языке
Анализ данных в индустрии
Перевод названия курса на английский язык
Industry data analysis
Авторы курса
Заплетин Максим Петрович, Касаткин Сергей Евгеньевич, Попов Олег Владимирович
Целевая аудитория
3 курс
4 курс
5 курс
6 курс
Магистранты
Подразделение
[Кафедра МКМА]
Семестр
Полгода (весна)
Тип курса
Спецкурс по выбору студента
Учебный год
2020/21
Аудитория
[Неприменимо]
Аннотация
Тема 1 Знакомство с SQL.
• Основные термины
• Базовые элементы языка.
• Синтаксис оператора SELECT.
• Внесение изменений в БД.
• 5 Запросы на объединение.
Тема 2 Структура баз данных.
• Ключи, историчность
• Откуда берутся данные (источники)
Тема 3 Python
• Знакомство с Python на примере jyputernotebook
• Основные библиотеки работы с данными(PandasNumPy)
Тема 4 Python
Тема 5 • Библиотеки для визуализация данных в Python
Тема 6 Визуализация данных
• Способы представления информации.
• Разновидности графиков, диаграмм
• Применение
Тема 7 Визуализация данных
• Визуализация в excel
• Визуализация в питон
• Практика
Тема 8 Как проводить тесты А-Б, что еще бывает
• Что такое тесты и зачем они нужны
• Простые примеры
• Математика, статистические критерии, статистическая значимость
Тема 9 Как проводить тесты А-Б, что еще бывает
• Что происходит на практике
• Как сделать правильный тест
• Множество примеров (хороших и плохих)
Тема 10
Что измерять – какие бывают метрики.
• Как в зависимости от цели выбрать, на что смотреть.
• Как делать выводы.
• На какие конверсии можно смотреть
• Примеры (с демонстрацией, что показательно, а что нет)
Тема 11 Как следить за изменениями
• Мониторинг характеристик, отчеты
• Примеры, когда что-то меняется ("что, почему и как засечь")
Тема 12 Модели
• Какие используют аналитики и зачем (с примерами)
• Простейшие прогнозирующие
• Выбор параметров модели
Тема 13 Модели
• Финансовые модели
• Модели роста
Тема 14 Линейная и логистическая регрессии
• Теория
• Примеры
Тема 15 Построение логистической регрессии
• Подготовка данных
• Выбор признаков
• AUC ROC, WoE