МИНОБРНАУКИ РОССИИ
федеральное государственное бюджетное образовательное учреждение высшего образования
«Алтайский государственный университет»

Машинное обучение

рабочая программа дисциплины
Закреплена за кафедройКафедра дифференциальных уравнений
Направление подготовки01.03.02. Прикладная математика и информатика
ПрофильМатематическое и компьютерное моделирование в природных и индустриальных системах
Форма обученияОчная
Общая трудоемкость4 ЗЕТ
Учебный план01_03_02_Прикладная математика и информатика_МКМПиИС-2022
Часов по учебному плану 144
в том числе:
аудиторные занятия 56
самостоятельная работа 88
Виды контроля по семестрам
зачеты: 6

Распределение часов по семестрам

Курс (семестр) 3 (6) Итого
Недель 22,5
Вид занятий УПРПДУПРПД
Лекции 20 20 20 20
Практические 36 36 36 36
Сам. работа 88 88 88 88
Итого 144 144 144 144

Программу составил(и):

Рецензент(ы):

Рабочая программа дисциплины
Машинное обучение

разработана в соответствии с ФГОС:
Федеральный государственный образовательный стандарт высшего образования - бакалавриат по направлению подготовки 01.03.02 Прикладная математика и информатика (приказ Минобрнауки России от 10.01.2018 г. № 9)

составлена на основании учебного плана:
01.03.02 Прикладная математика и информатика
утвержденного учёным советом вуза от 29.10.2021 протокол № 1/1.

Рабочая программа одобрена на заседании кафедры
Кафедра дифференциальных уравнений

Протокол от 29.06.2022 г. № 11
Срок действия программы: 2022-2023 уч. г.

Заведующий кафедрой
Папин Александр Алексеевич


Визирование РПД для исполнения в очередном учебном году

Рабочая программа пересмотрена, обсуждена и одобрена для
исполнения в 2023-2024 учебном году на заседании кафедры

Кафедра дифференциальных уравнений

Протокол от 29.06.2022 г. № 11
Заведующий кафедрой Папин Александр Алексеевич


1. Цели освоения дисциплины

1.1.Сформировать теоретические знания по основам машинного обучения для построения формальных математических моделей и интерпретации результатов моделирования;
Выработать умения по практическому применению методов машинного обучения для построения формальных математических моделей и интерпретации результатов моделирования при решении прикладных задач в различных прикладных областях;
Выработать умения и навыки использования различных программных инструментов анализа баз данных и систем машинного обучения.

2. Место дисциплины в структуре ООП

Цикл (раздел) ООП: Б1.О.05

3. Компетенции обучающегося, формируемые в результате освоения дисциплины

ПК-2 Способен применять математические методы и математическое моделирование, информационные и имитационные модели по тематике выполняемых научно-исследовательских прикладных задач или опытно-конструкторских работ в сфере профессиональной деятельности
В результате освоения дисциплины обучающийся должен
3.1.Знать:
3.1.1.Возможности, методологию и концептуальные ограничения использования технологий машинного обучения для изучения различных природных объектов и явлений путем построения формальных математических моделей;
О прикладных областях и постановках прикладных задач, в которых применяются методы машинного обучения;
Основные современные математические и алгоритмические инструменты машинного обучения;
3.2.Уметь:
3.2.1.Планировать исследование, основывающееся на анализе прецедентов и направленное на предсказательное моделирование;
Самостоятельно получать и углублять знания и формировать представление о состоянии методов машинного обучения и их роли в современной науке и экономике, пользуясь учебно-методической, справочной литературой, электронными ресурсами, научными журналами другими источниками информации;
Воспринимать и осмысливать информацию; уточнять границы использования знаний; применять полученные знания для решения комплексных задач творческого характера, задач повышенной сложности, изучая литературу и электронные ресурсы, в том числе, на иностранных языках; подводить итоги работы; выполнять самоконтроль; закреплять и расширять знания;
3.3.Иметь навыки и (или) опыт деятельности (владеть):
3.3.1.Методологическими приемами «черного» математического моделирования;
Навыками самостоятельного решения задач;
Навыками выбора подходящих методов решения стандартных задач;

4. Структура и содержание дисциплины

Код занятия Наименование разделов и тем Вид занятия Семестр Часов Компетенции Литература
Раздел 1. Введение в машинное обучене
1.1. Введение в предметную область. Примеры использования методов машинного обучения для решения прикладных задач. Повторение основ программирования на языке Python.Знакомство со специализированными библиотеками языка программирования Python для научных расчетов и анализа данных. NumPy, SciPy, pandas. Лекции 6 4 ПК-2 Л1.1, Л1.3
1.2. Введение в предметную область.Примеры использования методов машинного обучения для решения прикладных задач. Повторение основ программирования на языке Python. Практические 6 4 ПК-2 Л1.3
1.3. Знакомство со специализированными библиотеками языка программирования Python для научных расчетов и анализа данных. NumPy, SciPy, pandas. Практические 6 4 ПК-2 Л2.3, Л1.3
1.4. Знакомство с различными методами предобработки данных, описательными статистиками и основными способами визуализации данных, методами снижения размерности. Метод главных компонент. Важность нормировки данных. Предобработка данных. Работа с пропущенными значениями. Лекции 6 4 ПК-2 Л1.1, Л1.3
1.5. Знакомство с различными методами предобработки данных, описательными статистиками и основными способами визуализации данных, методами снижения размерности. Метод главных компонент. Важность нормировки данных. Предобработка данных. Работа с пропущенными значениями. Практические 6 4 ПК-2 Л2.1, Л1.2
Раздел 2. Основные методы машинного обучения
2.1. Основы машинного обучения и основные типы задач. Классификация задач машинного обучения. Обучение на неразмеченных данных. Кластеризация. Иерархическая кластеризация. Метод K-средних, DBSCAN и др. Обзор методов кластеризации, реализованных в библиотеке sklearn. Лекции 6 4 ПК-2 Л1.1, Л1.2
2.2. Основы машинного обучения и основные типы задач. Классификация задач машинного обучения. Практические 6 4 ПК-2 Л2.3, Л1.3
2.3. Обучение на неразмеченных данных. Нормировка данных. Кластеризация. Иерархическая кластеризация. Метод K-средних, DBSCAN и др. Обзор методов кластеризации, реализованных в библиотеке sklearn. Практические 6 4 ПК-2 Л2.1, Л1.2
2.4. Задачи обучения с учителем. Разделение данных на обучающие и тестовые. Нормировка данных. Определение переобученности модели. Критерии оценки качества полученных моделей. Лекции 6 2 ПК-2 Л1.1, Л1.2
2.5. Задачи обучения с учителем. Разделение данных на обучающие и тестовые. Определение переобученности модели. Критерии оценки качества полученных моделей. Практические 6 4 ПК-2 Л1.3, Л2.1
2.6. Постановка задачи регрессии. Линейный регрессионный анализ. Отбор признаков, коллинеарность, влиятельные наблюдения, анализ остатков. Непараметрическая регрессия (ядерное сглаживание). L1 и L2 регуляризация. Метрики качества. Лекции 6 2 ПК-2 Л1.3, Л1.2
2.7. Постановка задачи регрессии. Линейный регрессионный анализ. Отбор признаков, коллинеарность, влиятельные наблюдения, анализ остатков. Непараметрическая регрессия (ядерное сглаживание). L1 и L2 регуляризация. Метрики качества. Практические 6 4 ПК-2 Л2.3
2.8. Постановка задачи классификации, обзор основных методов ее решения. Бинарная и многоклассовая классификация. Логистическая регрессия. Решающие деревья. Метрики качества классификации (точность/специфичность, ROC-кривая, площадь под кривой).Ансамбли алгоритмов машинного обучения. Агрегирование моделей. Ансамбли решающих деревьев. Метод случайного леса. Градиентный бустинг. Лекции 6 4 ПК-2 Л1.1, Л1.3, Л2.1
2.9. Постановка задачи классификации, обзор основных методов ее решения. Бинарная и многоклассовая классификация. Логистическая регрессия. Решающие деревья. Метрики качества классификации (точность/специфичность, ROC-кривая, площадь под кривой). Практические 6 4 ПК-2 Л1.3, Л2.2
2.10. Ансамбли алгоритмов машинного обучения. Агрегирование моделей. Ансамбли решающих деревьев. Метод случайного леса. Градиентный бустинг. Практические 6 4 ПК-2 Л1.1, Л2.2, Л1.2
2.11. Закрепление, обобщение и повторение пройденного учебного материала Сам. работа 6 20 ПК-2 Л2.2, Л2.1
2.12. Уточнение и дополнение сведений и знаний, полученных на занятиях Сам. работа 6 20 ПК-2 Л1.1
2.13. Выполнение домашнего задания Сам. работа 6 28 ПК-2 Л1.2
2.14. Подготовка к экзамену Сам. работа 6 20 ПК-2 Л1.3

5. Фонд оценочных средств

5.1. Контрольные вопросы и задания для проведения текущего контроля и промежуточной аттестации по итогам освоения дисциплины
Распознавание рукописных цифр с помощью наивного байесовского классификатора.
Распознавание спамовых писем с помощью деревьев решений.
Понижение признакового пространства методом главных компонент при диагностировании клеток опухоли по изображениям мазка крови.
Предсказание октанового числа бензина по инфракрасному спектру с помощью регрессии на главные компоненты и проекции на латентные структуры.
Сегментация базы данных клиентов методами кластеризации и предсказание реакции клиента.
Распознавание лиц методом собственных лиц.
5.2. Темы письменных работ для проведения текущего контроля (эссе, рефераты, курсовые работы и др.)
Примерные темы финальных работ для зачета:
Распознавание жестов сурдоязыка австралийских аборигенов
Распознавание автора по произведениям живописи
Предсказание исхода шахматной партии
Сортировка ядер грецких орехов на видеоизображении
5.3. Фонд оценочных средств для проведения промежуточной аттестации
См. приложения
Приложения
Приложение 1.   ФОС МО.doc

6. Учебно-методическое и информационное обеспечение дисциплины

6.1. Рекомендуемая литература
6.1.1. Основная литература
Авторы Заглавие Издательство, год Эл. адрес
Л1.1 Уэс Маккинли Python и анализ данных: Издательство "ДМК Пресс", 2015 e.lanbook.com
Л1.2 ВандерПлас Дж. Python для сложных задач. Наука о данных и машинное обучение. : “Питер”, 2017
Л1.3 Мюллер А., Гвидо С. Введение в машинное обучение с помощью Python.: Руководство для специалистов по работе с данными , 2017
6.1.2. Дополнительная литература
Авторы Заглавие Издательство, год Эл. адрес
Л2.1 Leskovec J., Rajaraman A., Ullman J.D. Mining of massive datasets: Cambridge University, 2014
Л2.2 Steele J., Iliinsky N. Beautiful Visualization: Looking at Data through the Eyes of Experts: O'Reilly Media, Inc, 2010
Л2.3 Рашка С. Python и машинное обучение: крайне необходимое пособие по новейшей предсказательной аналитике, обязательное для более глубокого понимания методологии машинного обучения: Самоучители и руководства Издательство "ДМК Пресс", 2017 e.lanbook.com
6.2. Перечень ресурсов информационно-телекоммуникационной сети "Интернет"
Название Эл. адрес
Э1 Электронная библиотечная система Алтайского государственного университета : www.elibrary.ru www.elibrary.ru
Э2 Электронно-библиотечная система издательства "Лань": www.e.lanbook.com www.e.lanbook.com
Э3 Электронно-библиотечная система "Университетская библиотека Online": www.biblioclub.ru www.biblioclub.ru
Э4 Открытый курс машинного обучения habr.com
6.3. Перечень программного обеспечения
Среда разработки Visual Studio 2010 и выше (приобретенные по программе «MSDN Academic Alliance»);
TensorFlow - открытая программная библиотека для машинного обучения ;
Theano - библиотека численного вычисления в Python;
Keras - библиотека по глубинному обучению на Python;
MS Office - офисный пакет приложений;
OS MS Windows; Microsoft Office 2010 (Office 2010 Professional, № 4065231 от 08.12.2010), (бессрочно);
Microsoft Windows 7 (Windows 7 Professional, № 61834699 от 22.04.2013), (бессрочно);
Chrome (http://www.chromium.org/chromium-os/licenses), (бессрочно); 7-Zip (http://www.7-zip.org/license.txt), (бессрочно);
AcrobatReader (http://wwwimages.adobe.com/content/dam/Adobe/en/legal/servicetou/Acrobat_com_Additional_TOU-en_US-20140618_1200.pdf), (бессрочно);
ASTRA LINUX SPECIAL EDITION (https://astralinux.ru/products/astra-linux-special-edition/), (бессрочно);
LibreOffice (https://ru.libreoffice.org/), (бессрочно);
Веб-браузер Chromium (https://www.chromium.org/Home/), (бессрочно);
Антивирус Касперский (https://www.kaspersky.ru/), (до 23 июня 2024);
Архиватор Ark (https://apps.kde.org/ark/), (бессрочно);
Okular (https://okular.kde.org/ru/download/), (бессрочно);
Редактор изображений Gimp (https://www.gimp.org/), (бессрочно)
6.4. Перечень информационных справочных систем
ИСправочная правовая система "КонсультантПлюс";
Информационно-правовая система "Законодательство России";
Федеральная государственная информационная система "Национальная электронная бибилиотека".

7. Материально-техническое обеспечение дисциплины

Аудитория Назначение Оборудование
Учебная аудитория для проведения занятий лекционного типа, занятий семинарского типа (лабораторных и(или) практических), групповых и индивидуальных консультаций, текущего контроля и промежуточной аттестации, курсового проектирования (выполнения курсовых работ), проведения практик Стандартное оборудование (учебная мебель для обучающихся, рабочее место преподавателя, доска, мультимедийное оборудование стационарное или переносное)
320Л медиатека, читальный зал – помещение для самостоятельной работы Учебная мебель на 15 посадочных мест; персональные компьютеры с выходом в информационно-телекоммуникационную сеть Интернет и электронную информационно-образовательную среду;
205Л лаборатория информационных технологий - компьютерный класс - учебная аудитория для проведения занятий семинарского типа (лабораторных и(или) практических); проведения групповых и индивидуальных консультаций, текущего контроля и промежуточной аттестации Учебная мебель на 9 посадочных мест; компьютеры: марка КламаС Офис, мониторы: марка ACER модель V223HQL - 8 единиц; доска интерактивная Triumph MULTI TOUCH 78 + проектор NEC UM280X в комплекте
204Л лаборатория информационных технологий - компьютерный класс - учебная аудитория для проведения занятий семинарского типа (лабораторных и(или) практических); проведения групповых и индивидуальных консультаций, текущего контроля и промежуточной аттестации Учебная мебель на 14 посадочных мест; компьютеры: марка DEPO модель Neos 260 - 14 единиц; Интерактивная доска Smart board 680 IV со встроенным проектором v25

8. Методические указания для обучающихся по освоению дисциплины

1. Для успешного освоения содержания дисциплины необходимо посещать лекции, принимать активное участие в работе на практическом занятии, а также выполнять задания, предлагаемые преподавателем для самостоятельного изучения.
2. Лекция.
-На лекцию приходите не опаздывая, так как это неэтично.
- На лекционных занятиях необходимо конспектировать изучаемый материал.
- Для систематизации лекционного материала, который будет полезен при подготовке к итоговому контролю знаний, записывайте на каждой лекции тему, вопросы для изучения, рекомендуемую литературу.
- В каждом вопросе выделяйте главное, обязательно запишите ключевые моменты (определение, факты, законы, правила и т.д.), подчеркните их.
- Если по содержанию материала возникают вопросы, не нужно выкрикивать, запишите их и задайте по окончании лекции или на практическом занятии.
- Перед следующей лекцией обязательно прочитайте предыдущую, чтобы актуализировать знания и осознанно приступить к освоению нового содержания.
3.Практическое занятие – это форма работы, где студенты максимально активно участвуют в обсуждении темы.
- Для подготовки к занятию необходимо взять план занятия (у преподавателя).
- Самостоятельную подготовку к занятию необходимо начинать с изучения понятийного аппарата темы. Рекомендуем использовать справочную литературу, учебники.
- Важно запомнить, что любой источник должен нести достоверную информацию, особенно это относится к Internet-ресурсам. При использовании Internet - ресурсов в процессе подготовки не нужно их автоматически «скачивать», они должны быть проанализированы. Не нужно «скачивать» готовые рефераты, так как их однообразие преподаватель сразу выявляет, кроме того, они могут быть сомнительного качества.
- В процессе изучения темы анализируйте несколько источников. Используйте научные специальные журналы.
- Полезным будет работа с электронными учебниками и учебными пособиями в Internet-библиотеках. Зарегистрируйтесь в них: университетская библиотека Онлайн (http://www.biblioclub.ru/) и электронно-библиотечная система «Лань» (http://e.lanbook.com/).
- При возникновении трудностей в процессе подготовки взаимодействуйте с преподавателем, консультируйтесь по самостоятельному изучению темы.
4. Самостоятельная работа.
- При изучении дисциплины не все вопросы рассматриваются на лекциях и практических занятиях, часть вопросов рекомендуется преподавателем для самостоятельного изучения.
- Поиск ответов на вопросы и выполнение заданий для самостоятельной работы позволит вам расширить и углубить свои знания по курсу, применить теоретические знания в решении задач практического содержания, закрепить изученное ранее.
- Эти задания следует выполнять не «наскоком», а постепенно, планомерно, следуя порядку изучения тем курса.
- При возникновении вопросов обратитесь к преподавателю в день консультаций на кафедру.
- Выполнив их, проанализируйте качество их выполнения. Это поможет вам развивать умения самоконтроля и оценочные компетенции.
5. Итоговый контроль.
- Для подготовки к зачету/экзамену возьмите перечень примерных вопросов у преподавателя.
- В списке вопросов выделите те, которые были рассмотрены на лекции, семинарских занятиях. Обратитесь к своим записям, выделите существенное. Для более детального изучения изучите рекомендуемую литературу.
- Если в списке вопросов есть те, которые не рассматривались на лекции, на практическом занятии, изучите их самостоятельно. Если есть сомнения, задайте вопросы на консультации перед экзаменом.
Продумайте свой ответ на экзамене, его логику. Помните, что ваш ответ украсит ссылка на источник литературы, иллюстрация практики применения теоретического знания, а также уверенность и наличие авторской аргументированной позиции как будущего субъекта профессиональной деятельности.
ИТ