МИНОБРНАУКИ РОССИИ
федеральное государственное бюджетное образовательное учреждение высшего образования
«Алтайский государственный университет»

Основы машинного обучения

рабочая программа дисциплины
Закреплена за кафедройКафедра информационной безопасности
Направление подготовки10.03.01. Информационная безопасность
ПрофильБезопасность автоматизированных систем (в сфере профессиональной деятельности)
Форма обученияОчная
Общая трудоемкость4 ЗЕТ
Учебный план10_03_01_ИБ-1-2019
Часов по учебному плану 144
в том числе:
аудиторные занятия 54
самостоятельная работа 63
контроль 27
Виды контроля по семестрам
экзамены: 6

Распределение часов по семестрам

Курс (семестр) 3 (6) Итого
Недель 15
Вид занятий УПРПДУПРПД
Лекции 18 18 18 18
Лабораторные 36 36 36 36
Сам. работа 63 63 63 63
Часы на контроль 27 27 27 27
Итого 144 144 144 144

Программу составил(и):
к.ф.-м.н., доцент, Лепендин Андрей Александрович

Рецензент(ы):
к.ф.-м.н., доцент, Рудер Давыд Давыдович

Рабочая программа дисциплины
Основы машинного обучения

разработана в соответствии с ФГОС:
Федеральный государственный образовательный стандарт высшего образования по направлению подготовки 10.03.01 ИНФОРМАЦИОННАЯ БЕЗОПАСНОСТЬ (уровень бакалавриата) (приказ Минобрнауки России от 01.12.2016г. №1515)

составлена на основании учебного плана:
10.03.01 Информационная безопасность
утвержденного учёным советом вуза от 25.06.2019 протокол № 9.

Рабочая программа одобрена на заседании кафедры
Кафедра информационной безопасности

Протокол от 05.06.2019 г. № 10-2018/19
Срок действия программы: 2019-2020 уч. г.

Заведующий кафедрой
д.ф.-м.н., профессор Поляков В.В.


Визирование РПД для исполнения в очередном учебном году

Рабочая программа пересмотрена, обсуждена и одобрена для
исполнения в 2019-2020 учебном году на заседании кафедры

Кафедра информационной безопасности

Протокол от 05.06.2019 г. № 10-2018/19
Заведующий кафедрой д.ф.-м.н., профессор Поляков В.В.


1. Цели освоения дисциплины

1.1.Цель изучения дисциплины – изучение современных математических методов машинного обучения, предназначенных для анализа данных и построения предсказательных моделей.
Задачи дисциплины:
- изучение математических основ методов машинного обучения и соответствующих алгоритмов;
- изучение современных программных сред и библиотек, позволяющих проводить анализ, визуализацию данных, применять современные математические методы машинного обучения;
- развитие практических навыков использования методов машинного обучения в прикладных задачах, в том числе связанных с обеспечением информационной безопасности.

2. Место дисциплины в структуре ООП

Цикл (раздел) ООП: Б1.В.01

3. Компетенции обучающегося, формируемые в результате освоения дисциплины

ПК-2 способностью применять программные средства системного, прикладного и специального назначения, инструментальные средства, языки и системы программирования для решения профессиональных задач
ПК-9 способностью осуществлять подбор, изучение и обобщение научно-технической литературы, нормативных и методических материалов, составлять обзор по вопросам обеспечения информационной безопасности по профилю своей профессиональной деятельности
В результате освоения дисциплины обучающийся должен
3.1.Знать:
3.1.1.алгоритмы машинного обучения, которые могут применяться в задачах обеспечения информационной безопасности
принципы работы составных структур данных, способы векторизации вычислений для ускорения расчетов
подходы к ускорению работы и улучшению сходимости методов машинного обучения
информационные ресурсы, посвященные применению методов машинного обучения
виды научных и научно-технических источников в сети Интернет, касающихся методов машинного обучения
3.2.Уметь:
3.2.1.пользоваться средой Jupyter Notebook для быстрого применения алгоритмов машинного обучения
работать с разнотипными данными, визуализировать их
оценивать простые метрики качества работы алгоритмов классификации и восстановления регрессии
осуществлять поиск по документации специализированных библиотек машинного обучения
пользоваться открытыми базами статей по тематике машинного обучения
3.3.Иметь навыки и (или) опыт деятельности (владеть):
3.3.1.базовым инструментарием для коллективной разработки алгоритмов машинного обучения
навыками создания интерактивных отчетов для задач машинного обучения
навыками интеграции различных библиотек для решения комплексных задач обработки данных
навыками работы с современными площадками для обмена знаниями в области машинного обучения
навыками участия в коллаборативной работе над прикладными проектами в области машинного обучения

4. Структура и содержание дисциплины

Код занятия Наименование разделов и тем Вид занятия Семестр Часов Компетенции Литература
Раздел 1. Введение в методы машинного обучения
1.1. Общая постановка задачи машинного обучения. Обучение с учителем и без учителя, обучение с подкреплением. Задачи классификации, восстановления регрессии, предсказания. Модели алгоритмов. Признаки. Типы признаков. Понятие функционала качества. Вероятностная постановка задачи. Оценка обощающей способности. Проблема переобучения. Критерии оценки качества работы алгоритмов машинного обучения. ROC-кривые. Примеры практических задач машинного обучения Лекции 6 4 ПК-2 Л1.3
1.2. Первичный анализ данных с библиотекой Pandas Лабораторные 6 4 ПК-2 Л2.1, Л1.5, Л1.3, Л1.1
1.3. Визуальный анализ данных с библиотеками Seaborn и Matplotlib Лабораторные 6 4 ПК-2 Л2.1, Л1.5, Л1.3, Л1.1, Л1.2, Л1.4
1.4. Общая постановка задачи машинного обучения. Обучение с учителем и без учителя, обучение с подкреплением. Задачи классификации, восстановления регрессии, предсказания. Модели алгоритмов. Признаки. Типы признаков. Понятие функционала качества. Вероятностная постановка задачи. Оценка обощающей способности. Проблема переобучения. Критерии оценки качества работы алгоритмов машинного обучения. ROC-кривые. Примеры практических задач машинного обучения Сам. работа 6 4 ПК-2, ПК-9 Л2.1, Л1.3, Л1.4
Раздел 2. Метрические методы
2.1. Обобщенный метрический классификатор. Виды метрик. Метод ближайшего соседа. Алгоритм k-ближайших соседей. Взвешенная версия алгоритма k-ближайших соседей. Метод окна Парзена. Метод потенциальных функций. Понятие эталона. Отступы и классификация объектов. Лекции 6 4 ПК-2 Л2.2, Л1.3
2.2. Классификация, деревья решений и метод ближайших соседей Лабораторные 6 4 ПК-2 Л1.5, Л1.3, Л1.1, Л1.2
2.3. Обобщенный метрический классификатор. Виды метрик. Метод ближайшего соседа. Алгоритм k-ближайших соседей. Взвешенная версия алгоритма k-ближайших соседей. Метод окна Парзена. Метод потенциальных функций. Понятие эталона. Отступы и классификация объектов. Сам. работа 6 20 ПК-2, ПК-9 Л2.1, Л1.3, Л1.4
Раздел 3. Линейные методы
3.1. Постановка задач линейной регрессии и линейной классификации. Метод наименьших квадратов в матричной форме. Аналитическое решение. Регуляризация в задач регрессии. Мультиколлинеарность и плохая обусловленность ковариационной матрицы. Гребневая регрессия. Метод лассо. Линейные классификаторы. Метод стохастического градиента. Улучшение сходимости метода SGD. Логистическая регрессия. Метод опорных векторов. Линейно разделимые выборки. Двойственная задача. Нелинейные обощения. Возможные виды ядер Лекции 6 8 ПК-2 Л2.2, Л1.3
3.2. Линейные модели классификации и регрессии Лабораторные 6 4 ПК-2 Л2.1, Л1.5, Л1.1, Л1.2
3.3. Логистическая регрессия и случайный лес Лабораторные 6 4 ПК-2 Л2.1, Л1.5, Л1.1, Л1.2
3.4. Линейная регрессия, Lasso и RF-регрессия. Построение и отбор признаков Лабораторные 6 4 ПК-2, ПК-9 Л2.2, Л1.5, Л1.3, Л1.2
3.5. Постановка задач линейной регрессии и линейной классификации. Метод наименьших квадратов в матричной форме. Аналитическое решение. Регуляризация в задач регрессии. Мультиколлинеарность и плохая обусловленность ковариационной матрицы. Гребневая регрессия. Метод лассо. Линейные классификаторы. Метод стохастического градиента. Улучшение сходимости метода SGD. Логистическая регрессия. Метод опорных векторов. Линейно разделимые выборки. Двойственная задача. Нелинейные обощения. Возможные виды ядер Сам. работа 6 20 ПК-9 Л2.2, Л1.3, Л1.2, Л1.4
Раздел 4. Обучение без учителя
4.1. Методы кластериации. Типы кластерных структур. Функционал качества кластеризации. EM-алгоритм. Метод k-средних. Иерархическая кластеризация. Формула Ланса-Уильямса. Быстрая агломеративная кластеризация. Лекции 6 2 ПК-9 Л2.2, Л1.3
4.2. Обучение без учителя. Метод главных компонент. Кластеризация Лабораторные 6 4 ПК-2 Л2.2, Л1.5, Л1.3, Л1.1, Л1.2
4.3. Стохастический градиентный спуск. Онлайн-обучение Лабораторные 6 4 ПК-2, ПК-9 Л2.2, Л1.5, Л1.3, Л1.2
4.4. Основы анализа временных рядов Лабораторные 6 4 ПК-2, ПК-9 Л2.2, Л1.5, Л1.3, Л1.2
4.5. Методы кластериации. Типы кластерных структур. Функционал качества кластеризации. EM-алгоритм. Метод k-средних. Иерархическая кластеризация. Формула Ланса-Уильямса. Быстрая агломеративная кластеризация. Сам. работа 6 19 ПК-9 Л2.2, Л1.3, Л1.2, Л1.4
Раздел 5. Экзамен
5.1. Экзамен 6 27 ПК-2, ПК-9

5. Фонд оценочных средств

5.1. Контрольные вопросы и задания для проведения текущего контроля и промежуточной аттестации по итогам освоения дисциплины
В Приложении
5.2. Темы письменных работ для проведения текущего контроля (эссе, рефераты, курсовые работы и др.)
В Приложении
5.3. Фонд оценочных средств для проведения промежуточной аттестации
В Приложении

6. Учебно-методическое и информационное обеспечение дисциплины

6.1. Рекомендуемая литература
6.1.1. Основная литература
Авторы Заглавие Издательство, год Эл. адрес
Л1.1 Л. Рамальо Python. К вершинам мастерства: ДМК Пресс, 2016//ЭБС издательства «Лань» e.lanbook.com
Л1.2 Маккинни У. Python и анализ данных: Москва: ДМК Пресс, 2020 https://e.lanbook.com/book/131721
Л1.3 П. Флах Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных: Учебник ДМК Пресс, 2015//ЭБС издательства «Лань» e.lanbook.com
Л1.4 Е.А. Черткова Статистика. Автоматизация обработки информации: Учебное пособие Юрайт, 2018//ЭБС Юрайт www.biblio-online.ru
Л1.5 Хахаев И. А. Практикум по алгоритмизации и программированию на Python: курс М.: Национальный Открытый Университет «ИНТУИТ», 2016//ЭБС «Университетская библиотека online» biblioclub.ru
6.1.2. Дополнительная литература
Авторы Заглавие Издательство, год Эл. адрес
Л2.1 Бессмертный И.А., Нугуманова А.Б., Платонов А.В. Интеллектуальные системы: Учебник и практикум для академического бакалавриата Юрайт, 2018 // ЭБС "Юрайт" urait.ru
Л2.2 Крутиков В. Н., Мешечкин В. В. Анализ данных: учебное пособие Кемеровский государственный университет, 2014 // ЭБС "Университетская библиотека online" biblioclub.ru
6.2. Перечень ресурсов информационно-телекоммуникационной сети "Интернет"
Название Эл. адрес
Э1 www.nns.ru/ Национальная электронная библиотека.
Э2 www.rsl.ru/ Российская государственная библиотека.
Э3 www.microinform.ru/ Учебный центр компьютерных технологий «Микроинформ».
Э4 www.tests.specialist.ru/ Центр компьютерного обучения МГТУ им. Н.Э.Баумана.
Э5 www.intuit.ru/ Образовательный сайт
Э6 www.window.edu.ru/ Библиотека учебной и методической литературы
Э7 www.osp.ru/ Журнал «Открытые системы»
Э8 www.ihtika.lib.ru/ Библиотека учебной и методической литературы
Э9 Основы машинного обучения portal.edu.asu.ru
6.3. Перечень программного обеспечения
Windows 7 Professional, № 60674416 от 17.07.2012 (бессрочная);
Office 2010 Professional, № 49464762 от 14.12.2011 (бессрочная);
Open Office, http://www.openoffice.org/license.html
Python c расширениями PIL, Py OpenGL, https://docs.python.org/3/license.html
FAR, http://www.farmanager.com/license.php?l=ru
7-Zip, http://www.7-zip.org/license.txt
AcrobatReader, http://wwwimages.adobe.com/content/dam/Adobe/en/legal/servicetou/Acrobat_com_Additional_TOU-en_US-20140618_1200.pdf
Chrome; http://www.chromium.org/chromium-os/licenses
DjVu reader, http://djvureader.org/
6.4. Перечень информационных справочных систем
Профессиональные базы данных:
1. Электронная база данных «Scopus» (http://www.scopus.com);
2. Электронная библиотечная система Алтайского государственного университета (http://elibrary.asu.ru/);
3. Научная электронная библиотека elibrary (http://elibrary.ru)

7. Материально-техническое обеспечение дисциплины

Аудитория Назначение Оборудование
Учебная аудитория для проведения занятий лекционного типа, занятий семинарского типа (лабораторных и(или) практических), групповых и индивидуальных консультаций, текущего контроля и промежуточной аттестации, курсового проектирования (выполнения курсовых работ), проведения практик Стандартное оборудование (учебная мебель для обучающихся, рабочее место преподавателя, доска, мультимедийное оборудование стационарное или переносное)
Помещение для самостоятельной работы помещение для самостоятельной работы обучающихся Компьютеры, ноутбуки с подключением к информационно-телекоммуникационной сети «Интернет», доступом в электронную информационно-образовательную среду АлтГУ
001вК склад экспериментальной мастерской - помещение для хранения и профилактического обслуживания учебного оборудования Акустический прибор 01021; виброизмеритель 00032; вольтметр Q1202 Э-500; вольтметр универсальный В7-34А; камера ВФУ -1; компьютер Турбо 86М; масспектрометр МРС -1; осциллограф ЕО -213- 2 ед.; осциллограф С1-91; осциллограф С7-19; программатор С-815; самописец 02060 – 2 ед.; стабилизатор 3218; терц-октавный фильтр 01023; шкаф вытяжной; шумомер 00026; анализатор АС-817; блок 23 Г-51; блок питания "Статрон" – 2 ед.; блок питания Ф 5075; вакуумный агрегат; весы; вольтметр VM -70; вольтметр В7-15; вольтметр В7-16; вольтметр ВУ-15; генератор Г-5-6А; генератор Г4-76А; генератор Г4-79; генератор Г5-48; датчик колебаний КВ -11/01; датчик колебаний КР -45/01; делитель Ф5093; измеритель ИМП -2; измеритель параметров Л2-12; интерферометр ИТ 51-30; источник "Агат" – 3 ед.; источник питания; источник питания 3222; источник питания ЭСВ -4; лабораторная установка для настройки газовых лазеров; лазер ЛГИ -21; М-кальк-р МК-44; М-калькул-р "Электроника"; магазин сопротивления Р4075; магазин сопротивления Р4077; микроскоп МБС -9; модулятор МДЕ; монохроматор СДМС -97; мост переменного тока Р5066; набор цветных стекол; насос вакумный; насос вакуумный ВН-01; осциллограф С1-31; осциллограф С1-67; осциллограф С1-70; осциллограф С1-81; осциллоскоп ЕО -174В – 2 ед.; пентакта L-100; пирометр "Промень"; пистонфон 05001; преобразователь В9-1; прибор УЗДН -2Т; скамья оптическая СО 1м; спектограф ДФС -452; спектограф ИСП -51; стабилизатор 1202; стабилизатор 3217 – 4 ед.; стабилизатор 3218; стабилизатор 3222 – 3 ед.; станок токарный ТВ-4; усилитель мощности ЛВ -103 – 4 ед.; усилитель У5-9; центрифуга ВЛ-15; частотомер Ч3-54А; шкаф металлический; эл.двигатель; электродинамический калибратор 11032
106Л помещение для хранения и профилактического обслуживания учебного оборудования Стеллажи – 3 шт. осциллограф, паяльная станция, источник тока, переносные ноутбуки
408К лаборатория программно-аппаратных средств обеспечения информационной безопасности; лаборатория криптографических методов защиты информации - учебная аудитория для проведения занятий семинарского типа (лабораторных и(или) практических); проведения групповых и индивидуальных консультаций, текущего контроля и промежуточной аттестации Учебная мебель на 15 посадочных мест; рабочее место преподавателя; компью-теры: модель Компьютер Парус 945 MSI PDualCore E2140/512Mb+1024/HDD80Gb/DVD-ROM/LCD17" LG/KM - 11 единиц; мо-ниторы: марка Samsung - 3 единицы; системный блок CTR Office Celeron 2533 MHz - 3 шт.; Аппаратные средства аутентификации пользователя: элек-тронные ключи Guardant Code (4 шт.); электронный ключ Guardant Time (1 шт.); электронные ключи Guardant Stealth (3 шт.); электронные ключи Alad-din eToken PRO (10 шт.). Программно-аппаратные комплексы защиты инфор-мации: Программно-аппаратный ком-плекс «Соболь» Версия 3.0 RU.403008570.501410.001; Программно-аппаратный комплекс «Соболь» Версия 2.1 УВАЛ 00030-58-01; система защиты информации «Secret Net 2000» версии 4.0 (автономный вариант). Комплекс проекционного оборудования для препо-давателя - проектор мультимедийный "Optoma W402", проектор мультимедиа "BenQ MP626 DLP".

8. Методические указания для обучающихся по освоению дисциплины

Рекомендации по подготовке к лекционным занятиям
- перед очередной лекцией необходимо просмотреть по конспекту материал предыдущей лекции.
- бегло ознакомиться с содержанием очередной лекции по основным источникам литературы в соответствии с рабочей программой дисциплины;
- обратить особое внимание на сущность и графическое сопровождение основных рассматриваемых теоретических положений.
Рекомендации по подготовке к лабораторным работам
- руководствоваться графиком лабораторных работ РПД;
- накануне перед очередной работой необходимо по конспекту или в методических указаниях к работе просмотреть теоретический материал работы;
- на лабораторном занятии, выполнив разработку алгоритма и реализовав задание на языке высокого уровня, необходимо проанализировать окончательные результаты и убедится в их достоверности;
- обратить внимание на оформление отчета, в котором должны присутствовать: цель работы, описание алгоритма, журнал опытных данных, реализация в опыте, цели работы, необходимые графические зависимости (при их наличии) и их анализ, результаты работы и выводы;
- при подготовке к отчету руководствоваться вопросами, приведенными в методических указаниях к данной работе, тренажерами программ на ЭВМ по отчету работ и компьютерным учебником.
Рекомендации по подготовке к самостоятельной работе
- руководствоваться графиком самостоятельной работы;
- выполнять все плановые задания, выдаваемые преподавателем для самостоятельного выполнения, и разбирать на семинарах и консультациях неясные вопросы;
- подготовку к экзамену необходимо проводить по экзаменационным теоретическим вопросам
- при подготовке к экзамену параллельно прорабатываете соответствующие теоретические и практические разделы курса, все неясные моменты фиксируйте и выносите на плановую консультацию.