МИНОБРНАУКИ РОССИИ
федеральное государственное бюджетное образовательное учреждение высшего образования
«Алтайский государственный университет»

Решение аналитических задач на языке R

рабочая программа дисциплины
Закреплена за кафедройКафедра цифровых технологий и бизнес-аналитики
Направление подготовки27.03.03. Системный анализ и управление
ПрофильСистемный анализ и управление экономическими системами
Форма обученияОчная
Общая трудоемкость3 ЗЕТ
Учебный план27_03_03_САиУЭС-1-2020
Часов по учебному плану 108
в том числе:
аудиторные занятия 42
самостоятельная работа 66
Виды контроля по семестрам
диф. зачеты: 7

Распределение часов по семестрам

Курс (семестр) 4 (7) Итого
Недель 16
Вид занятий УПРПДУПРПД
Лекции 16 16 16 16
Лабораторные 26 26 26 26
Сам. работа 66 66 66 66
Итого 108 108 108 108

Программу составил(и):
канд. техн. наук, доцент, Трошкина Г. Н.

Рецензент(ы):
канд. физ.-мат. наук, доцент, Журенков О. В.

Рабочая программа дисциплины
Решение аналитических задач на языке R

разработана в соответствии с ФГОС:
Федеральный государственный образовательный стандарт высшего образования по направлению подготовки 27.03.03 СИСТЕМНЫЙ АНАЛИЗ И УПРАВЛЕНИЕ (уровень бакалавриата) (приказ Минобрнауки России от 11.03.2015г. №195)

составлена на основании учебного плана:
27.03.03 Системный анализ и управление
утвержденного учёным советом вуза от 30.06.2020 протокол № 6.

Рабочая программа одобрена на заседании кафедры
Кафедра цифровых технологий и бизнес-аналитики

Протокол от 14.05.2020 г. № 10
Срок действия программы: 2020-2021 уч. г.

Заведующий кафедрой
канд. физ.-мат. наук, доцент Юдинцев А.Ю.


Визирование РПД для исполнения в очередном учебном году

Рабочая программа пересмотрена, обсуждена и одобрена для
исполнения в 2020-2021 учебном году на заседании кафедры

Кафедра цифровых технологий и бизнес-аналитики

Протокол от 14.05.2020 г. № 10
Заведующий кафедрой канд. физ.-мат. наук, доцент Юдинцев А.Ю.


1. Цели освоения дисциплины

1.1.Формирование компетенций, связанных с решением задач по сбору, анализу и визуализации количественных данных. Курс направлен на освоение новых технологий при использовании известных методов анализа данных, ознакомление студентов с программной средой R. В результате освоения курса студенты должны уметь реализовать и документировать процесс исследования от сбора данных до (автоматизированной) публикации отчетов.

2. Место дисциплины в структуре ООП

Цикл (раздел) ООП: Б1.В.ДВ.08

3. Компетенции обучающегося, формируемые в результате освоения дисциплины

ПК-4 способностью применять методы системного анализа, технологии синтеза и управления для решения прикладных проектно-конструкторских задач
ПК-6 способностью создавать программные комплексы для системного анализа и синтеза сложных систем
ПК-7 способностью разрабатывать проекты компонентов сложных систем управления, применять для разработки современные инструментальные средства и технологии программирования на основе профессиональной подготовки
В результате освоения дисциплины обучающийся должен
3.1.Знать:
3.1.1.современные методы обработки и анализа данных;
основные принципы работы языка R;
синтаксис и базовые функции R;
функционал пакетов ggplot2.

3.2.Уметь:
3.2.1.обрабатывать и анализировать данные для подготовки аналитических решений, экспертных заключений и рекомендаций;
применять статистические и математические методы для представления и анализа исходных данных;
разрабатывать и проводить отладку программ с использованием современных инструментальных средств и технологий программирования.
3.3.Иметь навыки и (или) опыт деятельности (владеть):
3.3.1.навыками работы с разнородной информацией: типизация, структуризация данных;
навыками выбора статистических методов и инструментальных средств для работы с данными;
навыками подготовки данных и проведения статистического анализа наблюдений из разных областей знания;
навыки применения статистических методов и умения программирования на языке R при самостоятельном решении исследовательских задач.

4. Структура и содержание дисциплины

Код занятия Наименование разделов и тем Вид занятия Семестр Часов Компетенции Литература
Раздел 1. Введение в R
1.1. Общая характеристика языка R. Базовые команды, пакеты в R. RStudio и R commander. Лекции 7 2 ПК-4, ПК-6, ПК-7 Л1.1, Л2.2
1.2. Объекты и функции. Виды объектов. Понятие класса объекта. Типы хранения данных: векторы, двухмерные таблицы, матрицы, массивы, списки. Типы переменных: числовые, строчные, факторы. Лабораторные 7 4 ПК-4, ПК-6, ПК-7 Л1.1, Л2.2
1.3. Объекты и функции. Виды объектов. Понятие класса объекта. Типы хранения данных: векторы, двухмерные таблицы, матрицы, массивы, списки. Типы переменных: числовые, строчные, факторы. Сам. работа 7 6 ПК-4, ПК-6, ПК-7 Л1.1, Л2.2
1.4. Преобразование данных. Преобразование из одного типа в другой, объединение объектов (bind, transform и т.п.). Присваивание объектов. Обращение к атрибуту data.frame, выбор строк по условию (условный запрос), выбор отдельных атрибутов (фильтрация). Использование простейших графических возможностей R-Studio. Сам. работа 7 6 ПК-4, ПК-6, ПК-7 Л1.1, Л2.2
1.5. Виды пропущенных данных: NA, NaN. Способы работы с пропущенными данными. Понятие среды, ссылки на функции из разных пакетов, создание собственной среды. Циклы for, while, repeat. Создание собственной функции. Лабораторные 7 2 ПК-4, ПК-6, ПК-7 Л1.1, Л2.2
1.6. Виды пропущенных данных: NA, NaN. Способы работы с пропущенными данными. Понятие среды, ссылки на функции из разных пакетов, создание собственной среды. Циклы for, while, repeat. Создание собственной функции. Сам. работа 7 6 ПК-4, ПК-6, ПК-7 Л1.1, Л2.2
1.7. Конфирматорный факторный анализ Лекции 7 2 ПК-4, ПК-6, ПК-7 Л1.1, Л2.2
1.8. Модели измерения латентных переменных: разведывательный и подтверждающий факторный анализ. Анализ главных компонент. Частные наименьшие квадраты. Формативные и рефлективные измерительные инструменты. Этапы построения и модификации измерительной модели. MTMM модели, модели со структурой средних, факторы высшего порядка. Построение моделей эксплораторного и конфирматорного факторного анализа в пакетах factanal и lavaan. Сравнение моделей в lavaan. Лабораторные 7 2 ПК-4, ПК-6, ПК-7 Л1.1, Л2.2
1.9. Модели измерения латентных переменных: разведывательный и подтверждающий факторный анализ. Анализ главных компонент. Частные наименьшие квадраты. Формативные и рефлективные измерительные инструменты. Этапы построения и модификации измерительной модели. MTMM модели, модели со структурой средних, факторы высшего порядка. Построение моделей эксплораторного и конфирматорного факторного анализа в па-кетах factanal и lavaan. Сравнение моделей в lavaan. Сам. работа 7 8 ПК-4, ПК-6, ПК-7 Л1.1, Л2.2
1.10. Кластерный анализ в kmeans и hclust. Многомерное шкалирование в mds. Лекции 7 2 ПК-4, ПК-6, ПК-7 Л1.1, Л2.2
1.11. Кластерный анализ в kmeans и hclust. Многомерное шкалирование в mds. Лабораторные 7 4 ПК-4, ПК-6, ПК-7 Л1.1, Л2.2
1.12. Кластерный анализ в kmeans и hclust. Многомерное шкалирование в mds. Сам. работа 7 6 ПК-4, ПК-6, ПК-7 Л1.1, Л2.2
1.13. Чтение, преобразование, экспорт данных в R. Лекции 7 2 ПК-4, ПК-6, ПК-7 Л1.1, Л2.2
1.14. Основные функции пакетов foreign, haven, car, dplyr. Основные идеи html, markdown и LaTEX. Пакет stargazer. Имитация данных в R. Лабораторные 7 2 ПК-4, ПК-6, ПК-7 Л1.1, Л2.2
1.15. Основные функции пакетов foreign, haven, car, dplyr. Основные идеи html, markdown и LaTEX. Пакет stargazer. Имитация данных в R. Сам. работа 7 6 ПК-4, ПК-6, ПК-7 Л1.1, Л2.2
Раздел 2. Анализ данных в R
2.1. Линейные и логистические бинарные регрессии в lm и glm. Анализ главных компонент в prcomp и princom. Лекции 7 4 ПК-4, ПК-6, ПК-7 Л1.1, Л2.2
2.2. Линейные и логистические бинарные регрессии в lm и glm. Анализ главных компонент в prcomp и princom. Кластерный анализ в kmeans и hclust. Многомерное шкалирование в mds. Лабораторные 7 4 ПК-4, ПК-6, ПК-7 Л1.1, Л2.2
2.3. Линейные и логистические бинарные регрессии в lm и glm. Анализ главных компонент в prcomp и princom. Кластерный анализ в kmeans и hclust. Многомерное шкалирование в mds. Сам. работа 7 6 ПК-4, ПК-6, ПК-7 Л1.1, Л2.2
2.4. Команда sapply и mapply. Дебаггинг. Оптимизация кода. Создание автоматических отчетов, работа с rmarkdown. Лабораторные 7 2 ПК-4, ПК-6, ПК-7 Л1.1, Л2.2
2.5. Команда sapply и mapply. Дебаггинг. Оптимизация кода. Создание автоматических отчетов, работа с rmarkdown. Сам. работа 7 6 ПК-4, ПК-6, ПК-7 Л1.1, Л2.2
Раздел 3. Визуализация данных в R base и ggplot2
3.1. Мотивы визуализации. Виды графиков. Связь между моделью анализа и графика-ми. Синтаксис ggplot2: qplot, geom, aes. Использование пространства координат: одно-, двух-, трех- мерные, сферические, географические системы координат. Использование символов и цветов. Лекции 7 2 ПК-4, ПК-6, ПК-7 Л1.1, Л2.1, Л2.2
3.2. Мотивы визуализации. Виды графиков. Связь между моделью анализа и графика-ми. Синтаксис ggplot2: qplot, geom, aes. Использование пространства координат: одно-, двух-, трех- мерные, сферические, географические системы координат. Использование символов и цветов. Лабораторные 7 4 ПК-4, ПК-6, ПК-7 Л1.1, Л2.1, Л2.2
3.3. Мотивы визуализации. Виды графиков. Связь между моделью анализа и графика-ми. Синтаксис ggplot2: qplot, geom, aes. Использование пространства координат: одно-, двух-, трех- мерные, сферические, географические системы координат. Использование символов и цветов. Сам. работа 7 6 ПК-4, ПК-6, ПК-7 Л1.1, Л2.1, Л2.2
3.4. Создание анимированных графиков в пакете animation. Лекции 7 2 ПК-4, ПК-6, ПК-7 Л1.1, Л2.1, Л2.2
3.5. Создание анимированных графиков в пакете animation. Лабораторные 7 2 ПК-4, ПК-6, ПК-7 Л1.1, Л2.1, Л2.2
3.6. Создание анимированных графиков в пакете animation. Сам. работа 7 6 ПК-4, ПК-6, ПК-7 Л1.1, Л2.1, Л2.2
3.7. Подготовка к зачету Сам. работа 7 4 ПК-4, ПК-6, ПК-7 Л1.1, Л2.1, Л2.2

5. Фонд оценочных средств

5.1. Контрольные вопросы и задания для проведения текущего контроля и промежуточной аттестации по итогам освоения дисциплины
см. приложение 1
5.2. Темы письменных работ для проведения текущего контроля (эссе, рефераты, курсовые работы и др.)
не предусмотрены
5.3. Фонд оценочных средств для проведения промежуточной аттестации
см. приложение 1

6. Учебно-методическое и информационное обеспечение дисциплины

6.1. Рекомендуемая литература
6.1.1. Основная литература
Авторы Заглавие Издательство, год Эл. адрес
Л1.1 Агалаков, С.А. Анализ данных в среде R : практикум Омск : Омский государственный университет им. Ф.М. Достоевского, 2020 biblioclub.ru
6.1.2. Дополнительная литература
Авторы Заглавие Издательство, год Эл. адрес
Л2.1 Мастицкий, С. Э. Визуализация данных с помощью ggplot2 : Москва : ДМК Пресс, 2017 https://e.lanbook.com/book/107895
Л2.2 Митина, О. А. Языки программирования для статистической обработки данных (R) : учебное пособие Москва : РТУ МИРЭА, 2020 e.lanbook.com
6.2. Перечень ресурсов информационно-телекоммуникационной сети "Интернет"
Название Эл. адрес
Э1 Наглядная статистика Используем R! ashipunov.info
Э2 Онлайн учебник по анализу данных в R soc-research.info
Э3 Курс в Moodle "Решение аналитических задач на языке R" portal.edu.asu.ru
6.3. Перечень программного обеспечения
Open Office, http://www.openoffice.org/license.html , (бессрочно);
Microsoft Office 2010 (Office 2010 Professional, № 4065231 от 08.12.2010), (бессрочно);
Microsoft Windows 7 (Windows 7 Professional (№ 61834699 от 22.04.2013), (бессрочно);
7-Zip http://www.7-zip.org/license.txt , (бессрочно);
AcrobatReader, http://wwwimages.adobe.com/content/dam/Adobe/en/legal/servicetou/Acrobat_com_Additional_TOU-en_US-20140618_1200.pdf , (бессрочно);
R STUDIO (open source), http://www.rstudio.com/ , (бессрочно);
Пакет статистического анализа R с Cairo, ggplot2, ggvis, pcaPP, pls, robustbase, rrcovHD, tidyr, UsingR, http://www.r-project.org/, (бессрочно).
6.4. Перечень информационных справочных систем
Информационная справочная система:
СПС Консультант Плюс (инсталлированный ресурс АлтГУ или http://www.consultant.ru/).
Профессиональные базы данных:
1. Профессиональная база данных: электронная библиотечная система Алтайского государственного университета (http://elibrary.asu.ru/);
2. Профессиональная база данных: научная электронная библиотека elibrary (http://elibrary.ru)
3. Электронная база данных справочной правовой системы ГАРАНТ.

7. Материально-техническое обеспечение дисциплины

Аудитория Назначение Оборудование
208С лаборатория информационных технологий - компьютерный класс – учебная аудитория для проведения занятий семинарского типа (лабораторных и(или) практических); проведения групповых и индивидуальных консультаций, текущего контроля и промежуточной аттестации Учебная мебель на 15 посадочных мест; рабочее место преподавателя; доска магнитно-маркерная; компьютеры: марка HP модель ProOne 400 G2 20-in Non-Touch AiO - 15 единиц
Учебная аудитория для проведения занятий всех видов (дисциплинарной, междисциплинарной и модульной подготовки), групповых и индивидуальных консультаций, текущего контроля и промежуточной аттестации, курсового проекта (работы), проведения практики Стандартное оборудование (учебная мебель для обучающихся, рабочее место преподавателя, доска, мультимедийное оборудование стационарное или переносное)
Помещение для самостоятельной работы помещение для самостоятельной работы обучающихся Компьютеры, ноутбуки с подключением к информационно-телекоммуникационной сети «Интернет», доступом в электронную информационно-образовательную среду АлтГУ

8. Методические указания для обучающихся по освоению дисциплины

На лекциях преподаватель знакомит с основными понятиями по теме, алгоритмами, методами решения задач. На лекциях студент получает основной объем информации по каждой конкретной теме. Только посещение лекций является недостаточным для подготовки к лабораторным занятиям и зачету. Требуется также самостоятельная работа по изучению основной и дополнительной литературы и закрепление полученных на лабораторных занятиях навыков.
Самостоятельная работа студентов – способ активного, целенаправленного приобретения студентом новых для него знаний, умений и навыков без непосредственного участия в этом процессе преподавателя.
Качество получаемых студентом знаний напрямую зависит от качества и количества необходимого доступного материала, а также от желания (мотивации) студента их получить. При обучении осуществляется целенаправленный процесс, взаимодействие студента и преподавателя для формирования знаний, умений и навыков.
Задания по темам выполняются на лабораторных занятиях в компьютерном классе. Если лабораторные занятия пропущены по уважительной причине, то соответствующие задания необходимо выполнить самостоятельно и представить результаты преподавателю на очередном занятии или консультации.