МИНОБРНАУКИ РОССИИ
федеральное государственное бюджетное образовательное учреждение высшего образования
«Алтайский государственный университет»

Машинное обучение и большие данные

рабочая программа дисциплины
Закреплена за кафедройКафедра вычислительной техники и электроники
Направление подготовки09.03.01. Информатика и вычислительная техника
ПрофильПрограммно-техническое обеспечение инфокоммуникационных технологий
Форма обученияОчная
Общая трудоемкость4 ЗЕТ
Учебный план09_03_01_Информатика и вычислительная техника_ПОИТ-2023
Часов по учебному плану 144
в том числе:
аудиторные занятия 56
самостоятельная работа 88
Виды контроля по семестрам
диф. зачеты: 5

Распределение часов по семестрам

Курс (семестр) 3 (5) Итого
Недель 16
Вид занятий УПРПДУПРПД
Лекции 20 20 20 20
Лабораторные 36 36 36 36
Сам. работа 88 88 88 88
Итого 144 144 144 144

Программу составил(и):
к.ф-м.н., доцент, Калачев А.В.

Рецензент(ы):
к.ф-м.н., доцент, Мансуров А.В.

Рабочая программа дисциплины
Машинное обучение и большие данные

разработана в соответствии с ФГОС:
Федеральный государственный образовательный стандарт высшего образования - бакалавриат по направлению подготовки 09.03.01 Информатика и вычислительная техника (приказ Минобрнауки России от 19.09.2017 г. № 929)

составлена на основании учебного плана:
09.03.01 Информатика и вычислительная техника
утвержденного учёным советом вуза от 26.06.2023 протокол № 4.

Рабочая программа одобрена на заседании кафедры
Кафедра вычислительной техники и электроники

Протокол от г. №
Срок действия программы: уч. г.

Заведующий кафедрой
Пашнев Владимир Валентинович


1. Цели освоения дисциплины

1.1.Теоретическое изучение и практическое усвоение наиболее эффективных алгоритмов Машинного обучения в рамках стандартов WorldSkills по компетенции "Машинное обучение и большие данные"

2. Место дисциплины в структуре ООП

Цикл (раздел) ООП: Б1.В.01

3. Компетенции обучающегося, формируемые в результате освоения дисциплины

ПК-7Способен выполнять разработку технических документов, аппаратных схем адресованных специалисту по инфокоммуникационным технологиям.
ПК-7.1 Знать: распределение функций между аппаратным и программным обеспечением
ПК-7.2 Уметь: разрабатывать структурные и функциональные схемы систем в целом, ввод в эксплуатацию программно-аппаратных средств
ПК-7.3 Владеть: навыками разработки технического задания на аппаратное обеспечение
В результате освоения дисциплины обучающийся должен
3.1.Знать:
3.1.1.
3.2.Уметь:
3.2.1.
3.3.Иметь навыки и (или) опыт деятельности (владеть):
3.3.1.

4. Структура и содержание дисциплины

Код занятия Наименование разделов и тем Вид занятия Семестр Часов Компетенции Литература
Раздел 1. Подготовка данных
1.1. Предварительная обработка и очистка данных Лекции 5 2 Л1.1
1.2. Разведочный анализ данных Лекции 5 2 Л1.1
1.3. Подготовка данных. Библиотека Pandas Лекции 5 1 Л1.1
1.4. Разведочный анализ данных. Методы библиотек Pandas и SciLearn Лекции 5 1 Л1.1
1.5. Предварительная обработка и очистка данных Лабораторные 5 4 Л1.1
1.6. Разведочный анализ данных Лабораторные 5 4 Л1.1
1.7. Предварительная обработка и очистка данных Сам. работа 5 20 Л1.1
Раздел 2. Предварительная обработка данных
2.1. Изучение корреляции Лекции 5 1 Л1.1
2.2. Кросс-валидация Лекции 5 1 Л1.1
2.3. Оценка корреляции данных Лабораторные 5 4 Л1.1
2.4. Обучение моделей и кросс-валидация Лабораторные 5 4 Л1.1
Раздел 3. Алгоритмы и модели машинного обучения
3.1. Алгоритмы машинного обучения с учителем Лекции 5 1 Л1.1
3.2. Алгоритмы машинного обучения без учителя Лекции 5 3 Л1.1
3.3. Разработка математического аппарата модели МО Лекции 5 4 Л1.1
3.4. Подбор параметров и оптимизация моделей Лекции 5 2 Л1.1
3.5. Подбор и оптимизация параметров моделей Лабораторные 5 4 Л1.1
3.6. Машинное обучение с учителем Лабораторные 5 4 Л1.1
3.7. Машинное обучение без учителя Лабораторные 5 4 Л1.1
3.8. Разработка математического аппарата модели МО Лабораторные 5 4 Л1.1
3.9. Разработка математического аппарата модели МО Сам. работа 5 10 Л1.1
3.10. Машинное обучение с учителем Сам. работа 5 10 Л1.1
3.11. Машинное обучение без учителя Сам. работа 5 10 Л1.1
3.12. Подбор и оптимизация параметров моделей Сам. работа 5 28 Л1.1
Раздел 4. Разработка прикладного решения
4.1. Графический интерфейс. Видждеты Лекции 5 1 Л1.1
4.2. Документирование Лекции 5 1 Л1.1
4.3. Разработка графического интерфейса и документирование Лабораторные 5 4 Л1.1
4.4. Разработка графического интерфейса и документирование Сам. работа 5 10 Л1.1

5. Фонд оценочных средств

5.1. Контрольные вопросы и задания для проведения текущего контроля и промежуточной аттестации по итогам освоения дисциплины
ОЦЕНКА СФОРМИРОВАННОСТИ КОМПЕТЕНЦИИ ПК-10
Способен организовывать и руководить работой команды, вырабатывая командную стратегию для достижения поставленной цели

ПРИМЕРЫ ЗАДАНИЙ ЗАКРЫТОГО ТИПА


КРИТЕРИИ ОЦЕНИВАНИЯ: Каждое задание оценивается 1 баллом. Оценивание КИМ теоретического характера в целом:
• «зачтено» – верно выполнено более 50% заданий; «не зачтено» – верно выполнено 50% и менее 50% заданий;
• «отлично» – верно выполнено 85-100% заданий; «хорошо» – верно выполнено 70-84% заданий; «удовлетворительно» – верно выполнено 51-69% заданий; «неудовлетворительно» – верно выполнено 50% или менее 50% заданий.

ПРИМЕРЫ ЗАДАНИЙ ОТКРЫТОГО ТИПА

1.Что такое машинное обучение?
Машинное обучение - это процесс обучения компьютера на основе данных, чтобы он мог принимать решения или выполнять задачи без явного программирования.
2.Какие виды машинного обучения существуют?
Существует три основных вида машинного обучения: обучение с учителем, обучение без учителя и обучение с подкреплением.
3.Что такое обучение с учителем?
Обучение с учителем - это метод машинного обучения, при котором компьютеру предоставляются примеры данных с известными результатами, и он должен научиться распознавать закономерности в этих данных, чтобы делать предсказания.
4.Что такое обучение без учителя?
Обучение без учителя - это метод, при котором компьютер сам обнаруживает паттерны в данных без явного указания на то, какие паттерны искать.
5.Что такое обучение с подкреплением?
Обучение с подкреплением - это метод обучения, в котором компьютер учится выполнять задачи, получая положительное или отрицательное подкрепление за свои действия.
6.Какие алгоритмы машинного обучения вы знаете?
Некоторые популярные алгоритмы машинного обучения включают в себя: линейную регрессию, деревья решений, случайный лес, SVM, K-means, PCA, LDA и др.
7.Что такое большие данные?
Большие данные - это огромные объемы данных, которые слишком велики или сложны для традиционной обработки. Это может включать данные из интернета, социальных сетей, датчиков, научных экспериментов и т.д.
8.Какие типы больших данных существуют?
Существует несколько типов больших данных, включая структурированные, полуструктурированные и неструктурированные данные.
9. Какие виды алгоритмов машинного обучения используются в ИИ? В ИИ используются различные виды алгоритмов машинного обучения, такие как алгоритмы классификации, регрессии, кластеризации, обнаружения аномалий и др.
10. Как работает алгоритм машинного обучения? Алгоритм машинного обучения работает путем обучения на наборах данных и затем использования полученных знаний для предсказания или классификации новых данных.
11. Что такое глубокое обучение и как оно используется в ИИ? Глубокое обучение - это подвид машинного обучения, который использует нейронные сети с множеством слоев для обработки данных. Оно используется в ИИ для решения сложных задач, таких как распознавание речи, изображений и текста.
12. Что такое обработка естественного языка и как она связана с ИИ? Обработка естественного языка (NLP) - это область ИИ, которая занимается анализом и пониманием человеческого языка. Она включает в себя такие задачи, как анализ текста, машинный перевод, ответы на вопросы и т.д.
13. Какие еще применения ИИ вы знаете? ИИ также используется в медицине, финансах, транспорте, производстве и многих других областях.
Он может помочь улучшить качество жизни людей, повысить эффективность работы и снизить затраты. 

КРИТЕРИИ ОЦЕНИВАНИЯ ОТКРЫТЫХ ВОПРОСОВ.
«Отлично» (зачтено): Ответ полный, развернутый. Вопрос точно и исчерпывающе передан, терминология сохранена, студент превосходно владеет основной и дополнительной литературой, ошибок нет.
«Хорошо» (зачтено): Ответ полный, хотя краток, терминологически правильный, нет существенных недочетов. Студент хорошо владеет пройденным программным материалом; владеет основной литературой, суждения правильны.
«Удовлетворительно» (зачтено): Ответ неполный. В терминологии имеются недостатки. Студент владеет программным материалом, но имеются недочеты. Суждения фрагментарны.
«Неудовлетворительно» (не зачтено): Не использована специальная терминология. Ответ в сущности неверен. Переданы лишь отдельные фрагменты соответствующего материала вопроса. Ответ не соответствует вопросу или вовсе не дан.
5.2. Темы письменных работ для проведения текущего контроля (эссе, рефераты, курсовые работы и др.)
Не предусмотрено
5.3. Фонд оценочных средств для проведения промежуточной аттестации
Промежуточная аттестация проводится в формате демонстрационного экзамена по стандартам WorldSkills

6. Учебно-методическое и информационное обеспечение дисциплины

6.1. Рекомендуемая литература
6.1.1. Основная литература
Авторы Заглавие Издательство, год Эл. адрес
Л1.1 П. Флах Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных: Учебник ДМК Пресс, 2015//ЭБС издательства «Лань» e.lanbook.com
6.2. Перечень ресурсов информационно-телекоммуникационной сети "Интернет"
Название Эл. адрес
Э1 Машинное обучение и большие данные portal.edu.asu.ru
Э2 Первичный анализ данных с Pandas habrahabr.ru
Э3 Визуальный анализ данных c Python habrahabr.ru
Э4 Классификация, деревья решений и метод ближайших соседей habrahabr.ru
Э5 Линейные модели классификации и регрессии habrahabr.ru
Э6 Композиции: бэггинг, случайный лес. Кривые валидации и обучения habrahabr.ru
Э7 Построение и отбор признаков habrahabr.ru
Э8 Обучение без учителя: PCA, кластеризация habrahabr.ru
Э9 Обучение на гигабайтах c Vowpal Wabbit habrahabr.ru
Э10 Анализ временных рядов с помощью Python habrahabr.ru
Э11 Градиентный бустинг habrahabr.ru
6.3. Перечень программного обеспечения
6.4. Перечень информационных справочных систем

7. Материально-техническое обеспечение дисциплины

8. Методические указания для обучающихся по освоению дисциплины