МИНОБРНАУКИ РОССИИ
федеральное государственное бюджетное образовательное учреждение высшего образования
«Алтайский государственный университет»

Методы анализа и обработки данных

рабочая программа дисциплины
Закреплена за кафедройКафедра теоретической кибернетики и прикладной математики
Направление подготовки01.03.02. Прикладная математика и информатика
ПрофильМатематическое моделирование и информационные технологии
Форма обученияОчная
Общая трудоемкость4 ЗЕТ
Учебный план01_03_02_ПМиИ-3-2019
Часов по учебному плану 144
в том числе:
аудиторные занятия 54
самостоятельная работа 63
контроль 27
Виды контроля по семестрам
экзамены: 6

Распределение часов по семестрам

Курс (семестр) 3 (6) Итого
Недель 19
Вид занятий УПРПДУПРПД
Лекции 18 18 18 18
Лабораторные 36 36 36 36
Сам. работа 63 63 63 63
Часы на контроль 27 27 27 27
Итого 144 144 144 144

Программу составил(и):

Рецензент(ы):

Рабочая программа дисциплины
Методы анализа и обработки данных

разработана в соответствии с ФГОС:
Федеральный государственный образовательный стандарт высшего образования по направлению подготовки 01.03.02 ПРИКЛАДНАЯ МАТЕМАТИКА И ИНФОРМАТИКА (уровень бакалавриата) (приказ Минобрнауки России от 12.03.2015г. №228)

составлена на основании учебного плана:
01.03. 02 Прикладная математика и информатика
утвержденного учёным советом вуза от 25.06.2019 протокол № 9.

Рабочая программа одобрена на заседании кафедры
Кафедра теоретической кибернетики и прикладной математики

Протокол от г. №
Срок действия программы: уч. г.

Заведующий кафедрой
Хворова Любовь Анатольевна


Визирование РПД для исполнения в очередном учебном году

Рабочая программа пересмотрена, обсуждена и одобрена для
исполнения в 2019-2020 учебном году на заседании кафедры

Кафедра теоретической кибернетики и прикладной математики

Протокол от г. №
Заведующий кафедрой Хворова Любовь Анатольевна


1. Цели освоения дисциплины

1.1.

2. Место дисциплины в структуре ООП

Цикл (раздел) ООП: Б1.В.ДВ.11

3. Компетенции обучающегося, формируемые в результате освоения дисциплины

В результате освоения дисциплины обучающийся должен
3.1.Знать:
3.1.1.
3.2.Уметь:
3.2.1.
3.3.Иметь навыки и (или) опыт деятельности (владеть):
3.3.1.

4. Структура и содержание дисциплины

Код занятия Наименование разделов и тем Вид занятия Семестр Часов Компетенции Литература
Раздел 1. Введение в анализ данных
1.1. Введение в интеллектуальный анализ данных: основные понятия, области применения современных технологий обработки и интеллектуального анализа больших данных. Лекции 6 2 Л1.2, Л1.1, Л2.2
1.2. Этапы анализа данных. Структурированные и неструктурированные данные. Сбор и подготовка данных. Лекции 6 2 Л1.2, Л1.1, Л2.2
1.3. Большие данные. Организация сбора и хранения больших наборов данных. Hadoop. Лабораторные 6 4 Л1.2, Л1.1, Л2.2
1.4. Восстановление пропущенных значений в массивах данных. Лабораторные 6 2 Л1.1
1.5. Этапы анализа данных. Структурированные и неструктурированные данные. Сбор и подготовка данных. Сам. работа 6 6 Л1.2, Л1.1, Л2.2
1.6. Большие данные. Организация сбора и хранения больших наборов данных.Hadoop. Сам. работа 6 6 Л1.2, Л1.1, Л2.2
Раздел 2. Очистка, интеграция и преобразование данных
2.1. Библиотека pandas. Структуры данных в pandas, работа со структурами данных. Операции над данными. Комбинирование данных из разных источников. Обработка пропущенных значений. Лекции 6 2 Л1.2, Л1.1, Л2.2
2.2. Работа с данными в pandas. Лабораторные 6 4 Л1.2, Л1.1, Л2.2
2.3. Работа с данными в pandas. Сам. работа 6 6 Л1.2, Л1.1, Л2.2
2.4. Восстановление пропущенных значений в массивах данных. Сам. работа 6 5 Л1.2, Л1.1, Л2.2
Раздел 3. Программные модули и пакеты для работы с многомерными массивами данных. Визуализация данных
3.1. Библиотеки NumPy, SciPy: основные функции. Визуализация данных с matplotlib и pandas. Лекции 6 2 Л1.1, Л2.3
3.2. Работа с библиотеками NumPy и SciPy. Лабораторные 6 2 Л1.1, Л2.3
3.3. Работа с библиотеками NumPy и SciPy. Сам. работа 6 4 Л1.1, Л2.3
3.4. Визуализация данных. Лабораторные 6 4 Л1.1, Л2.3
3.5. Визуализация данных. Сам. работа 6 4 Л1.1, Л2.3
Раздел 4. Теория вероятностей и математическая статистика
4.1. Теория вероятностей: условная вероятность, случайные величины, теорема Байеса, распределение вероятностей. Лекции 6 2 Л2.1, Л1.1
4.2. Статистика: описание одиночного набора данных, показатели центра распределения, показатели вариации, корреляция и причинная зависимость. Проверка статистических гипотез. Лекции 6 2 Л2.1, Л1.1
4.3. Теория вероятностей и статистика. Лабораторные 6 6 Л2.1, Л1.1
4.4. Теория вероятностей и статистика. Сам. работа 6 10 Л2.1, Л1.1
Раздел 5. Методы машинного обучения
5.1. Задачи машинного обучения. Применение машинного обучения в Data Science. Алгоритмы машинного обучения. Библиотека Scikit-Learn. Лекции 6 4 Л1.3, Л2.4, Л2.3
5.2. Алгоритмы машинного обучения.Способы и типы машинного обучения.Библиотека Scikit-Learn. Лабораторные 6 6 Л2.2, Л1.3, Л2.4
5.3. Алгоритмы машинного обучения. Способы и типы машинного обучения. Сам. работа 6 12 Л2.2, Л1.3, Л2.4
5.4. Оценка и улучшение качества моделей машинного обучения: перекрестная проверка, поиск по сетке, метрики качества моделей и их вычисление. Лекции 6 2 Л2.2, Л1.3, Л2.4
5.5. Оценка и улучшение качества моделей машинного обучения: перекрестная проверка, поиск по сетке, метрики качества моделей и их вычисление. Лабораторные 6 6 Л2.2, Л1.3, Л2.4
5.6. Оценка и улучшение качества моделей машинного обучения: перекрестная проверка, поиск по сетке, метрики качества моделей и их вычисление. Сам. работа 6 10 Л2.2, Л1.3, Л2.4
5.7. Защита индивидуальных проектов. Лабораторные 6 2 Л2.2, Л1.3, Л2.4

5. Фонд оценочных средств

5.1. Контрольные вопросы и задания для проведения текущего контроля и промежуточной аттестации по итогам освоения дисциплины
5.2. Темы письменных работ для проведения текущего контроля (эссе, рефераты, курсовые работы и др.)
5.3. Фонд оценочных средств для проведения промежуточной аттестации

6. Учебно-методическое и информационное обеспечение дисциплины

6.1. Рекомендуемая литература
6.1.1. Основная литература
Авторы Заглавие Издательство, год Эл. адрес
Л1.1 Маккинни У. Python и анализ данных: Москва: ДМК Пресс, 2020 https://e.lanbook.com/book/131721
Л1.2 А. А. Барсегян, М. С. Куприянов, И. И. Холод, М. Д. Тесс, С. И. Елизаров. Анализ данных и процессов: учеб. пособие: Учебная литература для вузов СПб.: БХВ-Петербург, 2009 kist.ntu.edu.ua
Л1.3 Рашка С. Python и машинное обучение: крайне необходимое пособие по новейшей предсказательной аналитике, обязательное для более глубокого понимания методологии машинного обучения: Самоучители и руководства Издательство "ДМК Пресс", 2017 e.lanbook.com
6.1.2. Дополнительная литература
Авторы Заглавие Издательство, год Эл. адрес
Л2.1 Энатская Н.Ю. Математическая статистика и случайные процессы: учебное пособие для прикладного бакалавриата М. : Издательство Юрайт // ЭБС «Юрайт», 2018 www.biblio-online.ru/book/E7144E93-751A-44FD-A63F-B50F18195681
Л2.2 Лучано Рамальо Python. К вершинам мастерства: Самоучители и руководства Издательство "ДМК Пресс", 2016 e.lanbook.com
Л2.3 Бонцанини М. Анализ социальных медиа на Python. Извлекайте и анализируйте данные из всех уголков социальной паутины на Python: Другое Издательство "ДМК Пресс", 2018 e.lanbook.com
Л2.4 Шарден Б., Массарон Л., Боскетти А. Крупномасштабное машинное обучение вместе с Python: Учебные пособия Издательство "ДМК Пресс", 2018 //ЭБС издательства «Лань» e.lanbook.com
6.2. Перечень ресурсов информационно-телекоммуникационной сети "Интернет"
6.3. Перечень программного обеспечения
6.4. Перечень информационных справочных систем

7. Материально-техническое обеспечение дисциплины

8. Методические указания для обучающихся по освоению дисциплины