МИНОБРНАУКИ РОССИИ
федеральное государственное бюджетное образовательное учреждение высшего образования
«Алтайский государственный университет»

Статистика больших данных

рабочая программа дисциплины
Закреплена за кафедройКафедра теоретической кибернетики и прикладной математики
Направление подготовки09.04.03. Прикладная информатика
ПрофильЦифровые технологии анализа данных для устойчивого развития регионов Северной и Центральной Азии
Форма обученияОчная
Общая трудоемкость6 ЗЕТ
Учебный план09_04_03_Прикладная информатика_ЦТАД_ЦА-2022
Часов по учебному плану 216
в том числе:
аудиторные занятия 64
самостоятельная работа 125
контроль 27
Виды контроля по семестрам
экзамены: 2

Распределение часов по семестрам

Курс (семестр) 1 (2) Итого
Недель 22,5
Вид занятий УПРПДУПРПД
Лекции 32 32 32 32
Лабораторные 32 32 32 32
Сам. работа 125 125 125 125
Часы на контроль 27 27 27 27
Итого 216 216 216 216

Программу составил(и):
к.ф.-м.н., Доцент, Журавлева В.В.;к.т.н., Доцент, Маничева А.С.

Рецензент(ы):
к.ф.-м.н., Доцент, Пономарев И.В.

Рабочая программа дисциплины
Статистика больших данных

разработана в соответствии с ФГОС:
Федеральный государственный образовательный стандарт высшего образования - магистратура по направлению подготовки 09.04.03 Прикладная информатика (приказ Минобрнауки России от 19.09.2017 г. № 916)

составлена на основании учебного плана:
09.04.03 Прикладная информатика
утвержденного учёным советом вуза от 27.04.2021 протокол № 6.

Рабочая программа одобрена на заседании кафедры
Кафедра теоретической кибернетики и прикладной математики

Протокол от 26.06.2023 г. № 4
Срок действия программы: 2023-2024 уч. г.

Заведующий кафедрой
к.т.н., доцент Понькина Е.В.


Визирование РПД для исполнения в очередном учебном году

Рабочая программа пересмотрена, обсуждена и одобрена для
исполнения в 2023-2024 учебном году на заседании кафедры

Кафедра теоретической кибернетики и прикладной математики

Протокол от 26.06.2023 г. № 4
Заведующий кафедрой к.т.н., доцент Понькина Е.В.


1. Цели освоения дисциплины

1.1.Формирование ключевых компетенций в области науки о данных за счет ознакомления с теоретическими и практическими аспектами работы с большими данными, разработки алгоритмов и программ сбора, обработки и анализа больших данных в прикладных задачах анализа устойчивого развития территорий и разработки специлизированных проектов.

2. Место дисциплины в структуре ООП

Цикл (раздел) ООП: Б1.О.03

3. Компетенции обучающегося, формируемые в результате освоения дисциплины

ПК-1Способен использовать и разрабатывать методы, модели, алгоритмы и цифровые технологии, а также различные инструментальные средства сбора, анализа и обработки данных различной природы для решения прикладных задач устойчивого развития территорий
ПК-1.1 Знает методы и программный инструментарий технологий анализа данных, методы сравнительного анализа методов, моделей, алгоритмов и информационных технологий, специфику применения и ограничения различных методов. Умеет применять на практике методы научных исследований и инструментарий информационных технологий для выполнения научноисследовательских задач в области устойчивого развития территорий. Владеет навыками проведения научного исследования параметров функционирования и/или развития территориальнораспределенных систем с использованием современных цифровых технологий.
ПК-1.2 Умеет применять на практике методы научных исследований и инструментарий информационных технологий для выполнения научноисследовательских задач в области устойчивого развития территорий.
ПК-1.3 Владеет навыками проведения научного исследования параметров функционирования и/или развития территориальнораспределенных систем с использованием современных цифровых технологий.
ПК-2Способен разрабатывать и реализовывать прикладные проекты по анализу данных (включая большие данные), осуществлять сбор и организовывать хранение данных, подбирать методы, технологии и программные средства обработки данных, выполнять экономическое обоснование реализации проекта и анализ его эффективности
ПК-2.1 Знает методы сбора, предварительного анализа и хранения данных, процедуру разработки прикладного проекта по анализу больших данных, включая этапы подбора команды, подбор методов и технологий анализа данных.
ПК-2.2 Умеет оценивать соответствие набора данных предметной области и задачам аналитических работ проекта, разрабатывать и оценивать модели и цифровые технологии анализа данных, проводить агрегирование и преобразование данных.
ПК-2.3 Владеет методами и инструментальными средствами анализа данных, включая большие данные, методами оценки и корректности результатов обработки данных, подходами сравнения и оценки эффективности различных технологий анализа данных в прикладных задачах.
В результате освоения дисциплины обучающийся должен
3.1.Знать:
3.1.1.Математические модели профессиональных типовых задач и интерпретацию полученных математические результаты, владение знаниями об ограничениях и границах применимости.
3.2.Уметь:
3.2.1.Собирать, обрабатывать и интерпретировать экспериментальные данные, необходимые для проектной и производственно-технологической деятельности.
3.3.Иметь навыки и (или) опыт деятельности (владеть):
3.3.1.Фундаментальными разделами математики и информатики, необходимыми для решения научно-исследовательских и практических задач в профессиональной области.

4. Структура и содержание дисциплины

Код занятия Наименование разделов и тем Вид занятия Семестр Часов Компетенции Литература
Раздел 1. Введение в БД. Основные элементы анализа данных. Введение в машинное обучение
1.1. Определение БД. Атрибуты БД.Аналитические инструменты работы с большими данными – MapReduce, Hadoop, R. Лекции 2 4 ПК-1.1, ПК-1.2, ПК-1.3, ПК-2.1, ПК-2.2, ПК-2.3 Л2.1, Л2.2, Л1.1
1.2. Методология подготовки данных. Форматы данных. Типы переменных. Выбор переменных. Конструирование признаков в БД. Неполные данные и методы их обогащения Лекции 2 4 ПК-1.1, ПК-1.2, ПК-1.3, ПК-2.1, ПК-2.2, ПК-2.3 Л2.1, Л2.2, Л1.1
1.3. Подготовка данных к анализу: формат данных, типы переменных, выбор переменных, конструирование признаков, неполные данные Лабораторные 2 8 ПК-1.1, ПК-1.2, ПК-1.3, ПК-2.1, ПК-2.2, ПК-2.3 Л2.1, Л2.2, Л1.1
1.4. Обзор алгоритмов обучения без учителя. Обзор алгоритмов обучения с учителем. Методология выбора алгоритма машинного обучения. Методология оценки результатов применения машинного обучения. Лекции 2 8 ПК-1.1, ПК-1.2, ПК-1.3, ПК-2.1, ПК-2.2, ПК-2.3 Л2.1, Л2.2, Л1.1
1.5. Выбор алгоритма (обучение с учителем, обучение без учителя, обучение с подкреплением). Факторы, влияющие на выбор алгоритма. Настройка параметров. Оценка результатов. Лабораторные 2 8 ПК-1.1, ПК-1.2, ПК-1.3, ПК-2.1, ПК-2.2, ПК-2.3 Л2.1, Л2.2, Л1.1
Раздел 2. Введение в регрессионный анализ
2.1. Линейный и нелинейный регрессионный анализ данных. Применение методов регрессионного анализа в БД. Лекции 2 4 ПК-1.1, ПК-1.2, ПК-1.3, ПК-2.1, ПК-2.2, ПК-2.3 Л2.1, Л2.2, Л1.1
2.2. Построение моделей линейной и нелинейной регрессии сравнение результатов прогноза на основе метрик качества. Лабораторные 2 4 ПК-1.1, ПК-1.2, ПК-1.3, ПК-2.1, ПК-2.2, ПК-2.3 Л2.1, Л2.2, Л1.1
Раздел 3. Методы автоматической классификации (обучение без учителя)
3.1. Методы обучения с учителем для классификации объектов. Метрики классификации. Кластеризация методом k-средних. Алгоритм DBSCAN. Лекции 2 4 ПК-1.1, ПК-1.2, ПК-1.3, ПК-2.1, ПК-2.2, ПК-2.3 Л2.1, Л2.2, Л1.1
3.2. Определение метрик классификации и их применение в БД. выбор оптимального количества кластеров. Определение главных компонент. Ограничения методов. Лабораторные 2 4 ПК-1.1, ПК-1.2, ПК-1.3, ПК-2.1, ПК-2.2, ПК-2.3 Л2.1, Л2.2, Л1.1
Раздел 4. Методы классификации (обучение с учителем)
4.1. Ассоциативные правила. Принцип A priopi. Метод опорных векторов. Метод k-ближайших соседей и обнаружение аномалий. Метод главных компонент. Дерево решений. Случайные леса. Введение в нейронные сети. A/B-тестирование. Введение в нейронные сети. Лекции 2 8 ПК-1.1, ПК-1.2, ПК-1.3, ПК-2.1, ПК-2.2, ПК-2.3 Л2.1, Л2.2, Л1.1
4.2. Реализация метода k-ближайших соседей, учет аномалий. Построение нейронной сети. Лабораторные 2 8 ПК-1.1, ПК-1.2, ПК-1.3, ПК-2.1, ПК-2.2, ПК-2.3 Л2.1, Л2.2, Л1.1
Раздел 5. Итоговая аттестация
5.1. Подготовка к экзамену, чтение литературы, выполнение расчетных заданий. Сам. работа 2 125 ПК-1.1, ПК-1.2, ПК-1.3, ПК-2.1, ПК-2.2, ПК-2.3 Л2.1, Л2.2, Л1.1

5. Фонд оценочных средств

5.1. Контрольные вопросы и задания для проведения текущего контроля и промежуточной аттестации по итогам освоения дисциплины
см. приложение
5.2. Темы письменных работ для проведения текущего контроля (эссе, рефераты, курсовые работы и др.)
см. приложение
5.3. Фонд оценочных средств для проведения промежуточной аттестации
см. приложение
Приложения

6. Учебно-методическое и информационное обеспечение дисциплины

6.1. Рекомендуемая литература
6.1.1. Основная литература
Авторы Заглавие Издательство, год Эл. адрес
Л1.1 Шарден Б., Массарон Л., Боскетти А. Крупномасштабное машинное обучение вместе с Python: Учебные пособия Издательство "ДМК Пресс", 2018 //ЭБС издательства «Лань» e.lanbook.com
6.1.2. Дополнительная литература
Авторы Заглавие Издательство, год Эл. адрес
Л2.1 Черткова Е.А. СТАТИСТИКА. АВТОМАТИЗАЦИЯ ОБРАБОТКИ ИНФОРМАЦИИ: учеб. пособие М. : Издательство Юрайт, 2018
Л2.2 Дронов С.В. Многомерный статистический анализ: Учебное пособие Барнаул, изд-во АлтГУ, 2007
6.2. Перечень ресурсов информационно-телекоммуникационной сети "Интернет"
Название Эл. адрес
Э1 Сайт библиотеки АлтГУ www.lib.asu.ru
Э2 Электронно-библиотечная система издательства «Лань» www.e.lanbook.com
Э3 Свободная энциклопедия «Википедия» ru.wikipedia.org
Э4 Единый образовательный портал АлтГУ: Статистика больших данных portal.edu.asu.ru
6.3. Перечень программного обеспечения
операционная система не ниже Windows 10 (x64), Ubuntu 20.04, Anaconda, Python 3.7.7 CUDA 10.2 (при наличии машин с GPU).
Microsoft Office 2010 (Office 2010 Professional, № 4065231 от 08.12.2010), (бессрочно);
Microsoft Windows 7 (Windows 7 Professional, № 61834699 от 22.04.2013), (бессрочно);
Chrome (http://www.chromium.org/chromium-os/licenses), (бессрочно); 7-Zip (http://www.7-zip.org/license.txt), (бессрочно);
AcrobatReader (http://wwwimages.adobe.com/content/dam/Adobe/en/legal/servicetou/Acrobat_com_Additional_TOU-en_US-20140618_1200.pdf), (бессрочно);
ASTRA LINUX SPECIAL EDITION (https://astralinux.ru/products/astra-linux-special-edition/), (бессрочно);
LibreOffice (https://ru.libreoffice.org/), (бессрочно);
Веб-браузер Chromium (https://www.chromium.org/Home/), (бессрочно);
Антивирус Касперский (https://www.kaspersky.ru/), (до 23 июня 2024);
Архиватор Ark (https://apps.kde.org/ark/), (бессрочно);
Okular (https://okular.kde.org/ru/download/), (бессрочно);
Редактор изображений Gimp (https://www.gimp.org/), (бессрочно)
6.4. Перечень информационных справочных систем
Сайт библиотеки АлтГУ: www.lib.asu.ru;
Электронно-библиотечная система издательства "Лань": www.e.lanbook.com;
Электронно-библиотечная система "Университетская библиотека online": www.biblioclub.ru;
Свободная энциклопедия "Википедия": http://ru.wikipedia.org;
Единый образовательный портал http://portal.edu.asu.ru
Электронная база данных ZBMATH: https://zbmath.org/

7. Материально-техническое обеспечение дисциплины

Аудитория Назначение Оборудование
408Л лаборатория математического моделирования - учебная аудитория для проведения занятий семинарского типа (лабораторных и(или) практических); проведения групповых и индивидуальных консультаций, текущего контроля и промежуточной аттестации Учебная мебель на 15 посадочных мест; рабочее место преподавателя; доска меловая 1 шт.; компьютер Depo - 10 шт., 5 шт. с мониторами LG и 5 шт. с мониторами Philips; мультимедиа-проектор Sony - 1 шт.; МФУ Canon - 1 шт.; стационарный экран: марка Digis Optima C - 1 шт.
Учебная аудитория для проведения занятий лекционного типа, занятий семинарского типа (лабораторных и(или) практических), групповых и индивидуальных консультаций, текущего контроля и промежуточной аттестации, курсового проектирования (выполнения курсовых работ), проведения практик Стандартное оборудование (учебная мебель для обучающихся, рабочее место преподавателя, доска)
519М электронный читальный зал с доступом к ресурсам «ПРЕЗИДЕНТСКОЙ БИБЛИОТЕКИ имени Б.Н. Ельцина» - помещение для самостоятельной работы Учебная мебель на 46 посадочных мест; 1 Флипчарт; компьютеры; ноутбуки с подключением к информационно-телекоммуникационной сети "Интернет" и доступом в электронную информационно-образовательную среду; стационарный проектор: марка Panasonic, модель PT-ST10E; стационарный экран: марка Projecta, модель 10200123; система видеоконференцсвязи Cisco Telepresence C20; конгресс система Bosch DCN Next Generation; 8 ЖК-панелей

8. Методические указания для обучающихся по освоению дисциплины

1. Лекция.
- На лекционных занятиях необходимо конспектировать изучаемый материал.
- Для систематизации лекционного материала, который будет полезен при подготовке к итоговому контролю знаний, записывайте на каждой лекции тему, вопросы для изучения, рекомендуемую литературу.
- В каждом вопросе выделяйте главное, обязательно запишите ключевые моменты (определение, факты, законы, правила и т.д.), подчеркните их.
- Если по содержанию материала возникают вопросы, не нужно выкрикивать, запишите их и задайте по окончании лекции или на семинарском занятии.
- Перед следующей лекцией обязательно прочитайте предыдущую, чтобы актуализировать знания и осознанно приступить к освоению нового содержания.
2.Семинарское (практическое) занятие – это форма работы, где студенты максимально активно участвуют в обсуждении темы.
- Для подготовки к семинару необходимо взять план семинарского занятия (у преподавателя, на кафедре или в методическом кабинете).
- Самостоятельную подготовку к семинарскому занятию необходимо начинать с изучения понятийного аппарата темы. Рекомендуем использовать справочную литературу (словари, справочники, энциклопедии), целесообразно создать и вести свой словарь терминов.
- На семинар выносится обсуждение не одного вопроса, поэтому важно просматривать и изучать все вопросы семинара, но один из вопросов исследовать наиболее глубоко, с использованием дополнительных источников (в том числе тех, которые вы нашли самостоятельно). Не нужно пересказывать лекцию.
- Важно запомнить, что любой источник должен нести достоверную информацию, особенно это относится к Internet-ресурсам. При использовании Internet - ресурсов в процессе подготовки не нужно их автоматически «скачивать», они должны быть проанализированы. Не нужно «скачивать» готовые рефераты, так как их однообразие преподаватель сразу выявляет, кроме того, они могут быть сомнительного качества.
- В процессе изучения темы анализируйте несколько источников. Используйте периодическую печать - специальные журналы.
- Полезным будет работа с электронными учебниками и учебными пособиями в Internet-библиотеках. Зарегистрируйтесь в них: университетская библиотека Онлайн (http://www.biblioclub.ru/) и электронно-библиотечная система «Лань» (http://e.lanbook.com/).
- В процессе подготовки и построения ответов при выступлении не просто пересказывайте текст учебника, но и выражайте свою личностно-профессиональную оценку прочитанного.
- Принимайте участие в дискуссиях, круглых столах, так как они развивают ваши навыки коммуникативного общения.
- Если к семинарским занятиям предлагаются задания практического характера, продумайте план их выполнения или решения при подготовке к семинару.
- При возникновении трудностей в процессе подготовки взаимодействуйте с преподавателем, консультируйтесь по самостоятельному изучению темы.
3. Самостоятельная работа.
- При изучении дисциплины не все вопросы рассматриваются на лекциях и семинарских занятиях, часть вопросов рекомендуется преподавателем для самостоятельного изучения.
- Поиск ответов на вопросы и выполнение заданий для самостоятельной работы позволит вам расширить и углубить свои знания по курсу, применить теоретические знания в решении задач практического содержания, закрепить изученное ранее.
- Эти задания следует выполнять не «наскоком», а постепенно, планомерно, следуя порядку изучения тем курса.
- При возникновении вопросов обратитесь к преподавателю в день консультаций на кафедру.
- Выполнив их, проанализируйте качество их выполнения. Это поможет вам развивать умения самоконтроля и оценочные компетенции.
4. Итоговый контроль. 
- Для подготовки к экзамену возьмите перечень примерных вопросов у методиста кафедры.
- В списке вопросов выделите те, которые были рассмотрены на лекции, семинарских занятиях. Обратитесь к своим записям, выделите существенное. Для более детального изучения изучите рекомендуемую литературу.
- Если в списке вопросов есть те, которые не рассматривались на лекции, семинарском занятии, изучите их самостоятельно. Если есть сомнения, задайте вопросы на консультации перед экзаменом.
- Продумайте свой ответ на экзамене, его логику. Помните, что ваш ответ украсит ссылка на источник литературы, иллюстрация практики применения теоретического знания, а также уверенность и наличие авторской аргументированной позиции как будущего субъекта профессиональной деятельности.