Закреплена за кафедрой | Кафедра цифровых технологий и бизнес-аналитики |
---|---|
Направление подготовки | 27.03.03. Системный анализ и управление |
Профиль | Системный анализ и управление экономическими системами |
Форма обучения | Очная |
Общая трудоемкость | 3 ЗЕТ |
Учебный план | 27_03_03_САиУЭС-2020 |
|
|
Распределение часов по семестрам
Курс (семестр) | 4 (7) | Итого | ||
---|---|---|---|---|
Недель | 16 | |||
Вид занятий | УП | РПД | УП | РПД |
Лекции | 16 | 16 | 16 | 16 |
Лабораторные | 26 | 26 | 26 | 26 |
Сам. работа | 66 | 66 | 66 | 66 |
Итого | 108 | 108 | 108 | 108 |
Визирование РПД для исполнения в очередном учебном году
Рабочая программа пересмотрена, обсуждена и одобрена для
исполнения в 2023-2024 учебном году на заседании
кафедры
Кафедра цифровых технологий и бизнес-аналитики
Протокол от 14.04.2023 г. № 8
Заведующий кафедрой Шаховалов Н.Н.
1.1. | Формирование компетенций, связанных с решением задач по сбору, анализу и визуализации количественных данных. Курс направлен на освоение новых технологий при использовании известных методов анализа данных, ознакомление студентов с программной средой R. В результате освоения курса студенты должны уметь реализовать и документировать процесс исследования от сбора данных до (автоматизированной) публикации отчетов. |
---|
Цикл (раздел) ООП: Б1.В.ДВ.08 |
ПК-4 | способностью применять методы системного анализа, технологии синтеза и управления для решения прикладных проектно-конструкторских задач |
ПК-6 | способностью создавать программные комплексы для системного анализа и синтеза сложных систем |
ПК-7 | способностью разрабатывать проекты компонентов сложных систем управления, применять для разработки современные инструментальные средства и технологии программирования на основе профессиональной подготовки |
В результате освоения дисциплины обучающийся должен | |
3.1. | Знать: |
---|---|
3.1.1. | современные методы обработки и анализа данных; основные принципы работы языка R; синтаксис и базовые функции R; функционал пакетов ggplot2. |
3.2. | Уметь: |
3.2.1. | обрабатывать и анализировать данные для подготовки аналитических решений, экспертных заключений и рекомендаций; применять статистические и математические методы для представления и анализа исходных данных; разрабатывать и проводить отладку программ с использованием современных инструментальных средств и технологий программирования. |
3.3. | Иметь навыки и (или) опыт деятельности (владеть): |
3.3.1. | навыками работы с разнородной информацией: типизация, структуризация данных; навыками выбора статистических методов и инструментальных средств для работы с данными; навыками подготовки данных и проведения статистического анализа наблюдений из разных областей знания; навыки применения статистических методов и умения программирования на языке R при самостоятельном решении исследовательских задач. |
Код занятия | Наименование разделов и тем | Вид занятия | Семестр | Часов | Компетенции | Литература |
---|---|---|---|---|---|---|
Раздел 1. Введение в R | ||||||
1.1. | Общая характеристика языка R. Базовые команды, пакеты в R. RStudio и R commander. | Лекции | 7 | 2 | ПК-4, ПК-6, ПК-7 | Л1.1, Л2.2 |
1.2. | Объекты и функции. Виды объектов. Понятие класса объекта. Типы хранения данных: векторы, двухмерные таблицы, матрицы, массивы, списки. Типы переменных: числовые, строчные, факторы. | Лабораторные | 7 | 4 | ПК-4, ПК-6, ПК-7 | Л1.1, Л2.2 |
1.3. | Объекты и функции. Виды объектов. Понятие класса объекта. Типы хранения данных: векторы, двухмерные таблицы, матрицы, массивы, списки. Типы переменных: числовые, строчные, факторы. | Сам. работа | 7 | 6 | ПК-4, ПК-6, ПК-7 | Л1.1, Л2.2 |
1.4. | Преобразование данных. Преобразование из одного типа в другой, объединение объектов (bind, transform и т.п.). Присваивание объектов. Обращение к атрибуту data.frame, выбор строк по условию (условный запрос), выбор отдельных атрибутов (фильтрация). Использование простейших графических возможностей R-Studio. | Сам. работа | 7 | 6 | ПК-4, ПК-6, ПК-7 | Л1.1, Л2.2 |
1.5. | Виды пропущенных данных: NA, NaN. Способы работы с пропущенными данными. Понятие среды, ссылки на функции из разных пакетов, создание собственной среды. Циклы for, while, repeat. Создание собственной функции. | Лабораторные | 7 | 2 | ПК-4, ПК-6, ПК-7 | Л1.1, Л2.2 |
1.6. | Виды пропущенных данных: NA, NaN. Способы работы с пропущенными данными. Понятие среды, ссылки на функции из разных пакетов, создание собственной среды. Циклы for, while, repeat. Создание собственной функции. | Сам. работа | 7 | 6 | ПК-4, ПК-6, ПК-7 | Л1.1, Л2.2 |
1.7. | Конфирматорный факторный анализ | Лекции | 7 | 2 | ПК-4, ПК-6, ПК-7 | Л1.1, Л2.2 |
1.8. | Модели измерения латентных переменных: разведывательный и подтверждающий факторный анализ. Анализ главных компонент. Частные наименьшие квадраты. Формативные и рефлективные измерительные инструменты. Этапы построения и модификации измерительной модели. MTMM модели, модели со структурой средних, факторы высшего порядка. Построение моделей эксплораторного и конфирматорного факторного анализа в пакетах factanal и lavaan. Сравнение моделей в lavaan. | Лабораторные | 7 | 2 | ПК-4, ПК-6, ПК-7 | Л1.1, Л2.2 |
1.9. | Модели измерения латентных переменных: разведывательный и подтверждающий факторный анализ. Анализ главных компонент. Частные наименьшие квадраты. Формативные и рефлективные измерительные инструменты. Этапы построения и модификации измерительной модели. MTMM модели, модели со структурой средних, факторы высшего порядка. Построение моделей эксплораторного и конфирматорного факторного анализа в па-кетах factanal и lavaan. Сравнение моделей в lavaan. | Сам. работа | 7 | 8 | ПК-4, ПК-6, ПК-7 | Л1.1, Л2.2 |
1.10. | Кластерный анализ в kmeans и hclust. Многомерное шкалирование в mds. | Лекции | 7 | 2 | ПК-4, ПК-6, ПК-7 | Л1.1, Л2.2 |
1.11. | Кластерный анализ в kmeans и hclust. Многомерное шкалирование в mds. | Лабораторные | 7 | 4 | ПК-4, ПК-6, ПК-7 | Л1.1, Л2.2 |
1.12. | Кластерный анализ в kmeans и hclust. Многомерное шкалирование в mds. | Сам. работа | 7 | 6 | ПК-4, ПК-6, ПК-7 | Л1.1, Л2.2 |
1.13. | Чтение, преобразование, экспорт данных в R. | Лекции | 7 | 2 | ПК-4, ПК-6, ПК-7 | Л1.1, Л2.2 |
1.14. | Основные функции пакетов foreign, haven, car, dplyr. Основные идеи html, markdown и LaTEX. Пакет stargazer. Имитация данных в R. | Лабораторные | 7 | 2 | ПК-4, ПК-6, ПК-7 | Л1.1, Л2.2 |
1.15. | Основные функции пакетов foreign, haven, car, dplyr. Основные идеи html, markdown и LaTEX. Пакет stargazer. Имитация данных в R. | Сам. работа | 7 | 6 | ПК-4, ПК-6, ПК-7 | Л1.1, Л2.2 |
Раздел 2. Анализ данных в R | ||||||
2.1. | Линейные и логистические бинарные регрессии в lm и glm. Анализ главных компонент в prcomp и princom. | Лекции | 7 | 4 | ПК-4, ПК-6, ПК-7 | Л1.1, Л2.2 |
2.2. | Линейные и логистические бинарные регрессии в lm и glm. Анализ главных компонент в prcomp и princom. Кластерный анализ в kmeans и hclust. Многомерное шкалирование в mds. | Лабораторные | 7 | 4 | ПК-4, ПК-6, ПК-7 | Л1.1, Л2.2 |
2.3. | Линейные и логистические бинарные регрессии в lm и glm. Анализ главных компонент в prcomp и princom. Кластерный анализ в kmeans и hclust. Многомерное шкалирование в mds. | Сам. работа | 7 | 6 | ПК-4, ПК-6, ПК-7 | Л1.1, Л2.2 |
2.4. | Команда sapply и mapply. Дебаггинг. Оптимизация кода. Создание автоматических отчетов, работа с rmarkdown. | Лабораторные | 7 | 2 | ПК-4, ПК-6, ПК-7 | Л1.1, Л2.2 |
2.5. | Команда sapply и mapply. Дебаггинг. Оптимизация кода. Создание автоматических отчетов, работа с rmarkdown. | Сам. работа | 7 | 6 | ПК-4, ПК-6, ПК-7 | Л1.1, Л2.2 |
Раздел 3. Визуализация данных в R base и ggplot2 | ||||||
3.1. | Мотивы визуализации. Виды графиков. Связь между моделью анализа и графика-ми. Синтаксис ggplot2: qplot, geom, aes. Использование пространства координат: одно-, двух-, трех- мерные, сферические, географические системы координат. Использование символов и цветов. | Лекции | 7 | 2 | ПК-4, ПК-6, ПК-7 | Л1.1, Л2.1, Л2.2 |
3.2. | Мотивы визуализации. Виды графиков. Связь между моделью анализа и графика-ми. Синтаксис ggplot2: qplot, geom, aes. Использование пространства координат: одно-, двух-, трех- мерные, сферические, географические системы координат. Использование символов и цветов. | Лабораторные | 7 | 4 | ПК-4, ПК-6, ПК-7 | Л1.1, Л2.1, Л2.2 |
3.3. | Мотивы визуализации. Виды графиков. Связь между моделью анализа и графика-ми. Синтаксис ggplot2: qplot, geom, aes. Использование пространства координат: одно-, двух-, трех- мерные, сферические, географические системы координат. Использование символов и цветов. | Сам. работа | 7 | 6 | ПК-4, ПК-6, ПК-7 | Л1.1, Л2.1, Л2.2 |
3.4. | Создание анимированных графиков в пакете animation. | Лекции | 7 | 2 | ПК-4, ПК-6, ПК-7 | Л1.1, Л2.1, Л2.2 |
3.5. | Создание анимированных графиков в пакете animation. | Лабораторные | 7 | 2 | ПК-4, ПК-6, ПК-7 | Л1.1, Л2.1, Л2.2 |
3.6. | Создание анимированных графиков в пакете animation. | Сам. работа | 7 | 6 | ПК-4, ПК-6, ПК-7 | Л1.1, Л2.1, Л2.2 |
3.7. | Подготовка к зачету | Сам. работа | 7 | 4 | ПК-4, ПК-6, ПК-7 | Л1.1, Л2.1, Л2.2 |
5.1. Контрольные вопросы и задания для проведения текущего контроля и промежуточной аттестации по итогам освоения дисциплины |
1. На основе какого языка был создан R? Ответ: (1) C + (2) S (3) Java (4) Python 2. Какие из перечисленных языков оказали влияние на R? Ответ: (1) Ruby (2) Matlab + (3) Scheme + (4) S 3. R является: Ответ: + (1) языком программирования для статистической обработки данных и работы с графикой, созданный на основе языка S + (2) свободной программной средой вычислений с открытым исходным кодом (3) высокоуровневым языком программирования общего назначения, ориентированным на повышение производительности разработчика и читаемости кода + (4) языком программирования с динамической типизацией данных 4. Присваивание в языке R можно осуществить с помощью оператора: Ответ: + (1) = + (2) <- + (3) -> (4) := 5. Присваивание в R нельзя осуществить с помощью оператора: Ответ: (1) = (2) <- (3) -> + (4) := 6. Какие из вариантов присвоения не вызовут ошибки: Ответ: (1) x -> 3 + (2) x <- 3 (3) 3 <- x + (4) 3 -> x 7. Как сделать вектор из трех чисел? Ответ: (1) (7,7,7) (2) [7,7,7] (3) {7,7,7} + (4) c(7,7,7) 8. Чему равняется length(c(7,7,7)) Ответ: 3 9. В каких из следующих случаях исполнение выдаст ошибку? Ответ: + (1) (7,7,7) + (2) [7,7,7] + (3) {7,7,7} (4) c(7,7,7) 10. Для каких аргументов функция is.finite вернет true? Ответ: + (1) 1 (2) NA (3) NaN (4) (+Inf) 11. Для каких аргументов функция is.finite вернет false? Ответ: (1) 1 + (2) NA + (3) NaN + (4) (+Inf) 12. Какой результат будет у функции is.finite(Inf-Inf)? Ответ: (1) TRUE + (2) FALSE (3) NAN (4) ошибка 13. Что вернет следующее выражение sum(1:3>2)? Ответ: (1) 0 + (2) 1 (3) 2 (4) 3. Ошибка 14. Каким образом можно сформировать вектор (FALSE, FALSE, TRUE)? Ответ: + (1) c(FALSE, FALSE, TRUE) + (2) 2:4>3 (3) 2:4<3 (4) -c(TRUE, TRUE, FALSE) 15. Что вернет следующее выражение sum(1:3>1)? Ответ: 2 16. p.x=1.y=2 Что выведет print(p)? Ответ: (1) (1,2) (2) {x=1;y=2} (3) NaN + (4) ошибка 17. Как правильно присвоить p значение типа данных, имеющих две координаты x=1 и y=2? Ответ: (1) p.x=1.y=2 + (2) p = c(x=1, y=2) + (3) p = c(y=2, x=1) (4) p(x,y)<-c(1,2) 18. Является ли ошибкой использование такой записи: x.x=1? Ответ: (1) да + (2) нет 19. Какая типизация в языке R? Ответ: (1) статическая + (2) динамическая (3) статическая с элементами динамической (4) типизация отсутствует 20. Выберите неверные утверждения: Ответ: + (1) язык R имеет статическую типизацию (2) язык R имеет динамическую типизацию + (3) язык R имеет статическую типизацию с элементами динамической + (4) язык R не имеет типизации 21. Какая типизация в языке R? Ответ: динамическая 22. Операция с диапазонами x=1:3 y=4:6 Чему будет равно x+y? Ответ: + (1) 5 7 9 (2) 1 2 3 4 5 6 (3) 5:9 (4) 1:6 23. Операция с диапазонами x=1:3 y=4:6 Чему будет равно x+y? (Введите цифры через пробел) Ответ: 5 7 9 24. Каким образом можно описать вектор (1,2,3,4,5,6)? Ответ: (1) 1:2+4:6 (2) 1:8-7:8 + (3) 1:6 (4) 2:12/2 |
5.2. Темы письменных работ для проведения текущего контроля (эссе, рефераты, курсовые работы и др.) |
Не предусмотрены |
5.3. Фонд оценочных средств для проведения промежуточной аттестации |
1.Назначение среды R, решаемые задачи. 2.Проблемы обработки данных различной природы. Автоматизация обработки и представления данных с помощью стандартного и специализированного программного обеспечения. 3.Возможности и ограничения среды, перспективы развития. 4.Особенности установки среды R на различных операционных системах. 5.Запуск среды R. Рабочее пространство среды. Простейшие команды. 6.Пакеты среды R. Понятие пакета. Загрузка и установка пакета. 7.Пакетная обработка. Действия при работе с большими массивами данных. 8.Последовательность действий по созданию набора данных в среде R. 9.Понятие набора данных. Ключевые характеристики структуры данных. 10.Векторы, матрицы данных. 11.Массивы и таблицы данных. 12.Факторы и списки данных. 13.Технологии получения данных из различных источников. 14.Правила импорта данных из файлов CSV, Excel, XML-файлов. 15.Извлечение данных из web-страниц. 16.Импорт данных из баз данных. 17.Аннотирование наборов данных. 18.Графические возможности среды R. 19.Управление графическимипараметрами среды при визуализации. 20.Настройка параметров символов, линий, цвета, текста, осей, условных обозначений. 21.Объединение диаграмм в среде R. 22.Управление данными в среде R. 23.Создание, переименование и перекодировка переменных. 24.Проблема обнаружения пропущенных значений и исключение пропущенных значений из анализа. 25.Преобразование типов в среде R. 26.Сортировка и объединение наборов данных. 27.Добавление столбцов и строк в наборы данных. Разделение наборов данных на составляющие. 28.Получение случайных выборок в среде R. 29.Команды SQL для преобразования таблиц. 30.Обработка данных в среде R. 31.Математические функции в среде R. 32.Статистические функции в среде R. 33.Функции распределения в среде R. 34.Применение функций к матрицам и таблицам данных. 35.Управление выполнением команд. 36.Задание повторений и управление циклами. 37.Выполнение алгоритма обработки данных с наступлением условия. 38.Правила написания пользовательских функций. 39.Агрегирование и изменение структуры данных. 40.Транспонирование данных. 41.Агрегирование данных средствами пакета reshape. 42.Базовые диаграммы среды R. Столбчатые диаграммы. Простые диаграммы, составные и диаграммы с группировкой. Диаграммы для средних значений. 43.Оптимизация столбчатых диаграмм. Создание и анализ спинограмм. Создание и анализ круговых диаграмм. 44.Гистограммы и диаграммы оценки функции плотности. Диаграммы размахов и точечные диаграммы. 45.Понятие корреляции. Типы корреляций. Визуализация корреляций. 46.Признаки и параметры простой линейной регрессии. 47.Признаки и параметры полиномиальной регрессии. 48.Исследование множественной линейной регрессии. Множественная линейная регрессия со взаимодействиями. 49.Способы диагностики регрессионных моделей. 50.Методы сравнения регрессионных моделей. 51.Выполнение при наступлении условия. Оператор if. Оператор if else. Оператор switch. 52.Повторение и циклы. Оператор for. Оператор while. Операторы repeat, break и next. 53.Стандартная форма задания пользовательской функции. Формальные аргументы, локальные переменные, свободные переменные. 54.Полная форма задания функции. Сильное присваивание. Команды apply(), sapply(), lapply(). 55.Примеры написания пользовательских функций с использованием управляющих конструкций. 56.Постановка задач предметной области. Алгоритмизация решения задачи на языке R. 57.Алгоритмы расчета базовых экономических показателей. 58.Использование графических возможностей среды R для анализа экономической эффективности хозяйственной деятельности организации. |
6.1. Рекомендуемая литература | ||||
6.1.1. Основная литература | ||||
Авторы | Заглавие | Издательство, год | Эл. адрес | |
Л1.1 | Агалаков, С.А. | Анализ данных в среде R : практикум | Омск : Омский государственный университет им. Ф.М. Достоевского, 2020 | biblioclub.ru |
6.1.2. Дополнительная литература | ||||
Авторы | Заглавие | Издательство, год | Эл. адрес | |
Л2.1 | Мастицкий, С. Э. | Визуализация данных с помощью ggplot2 : | Москва : ДМК Пресс, 2017 | https://e.lanbook.com/book/107895 |
Л2.2 | Митина, О. А. | Языки программирования для статистической обработки данных (R) : учебное пособие | Москва : РТУ МИРЭА, 2020 | e.lanbook.com |
6.2. Перечень ресурсов информационно-телекоммуникационной сети "Интернет" | ||||
Название | Эл. адрес | |||
Э1 | Наглядная статистика Используем R! | ashipunov.info | ||
Э2 | Онлайн учебник по анализу данных в R | soc-research.info | ||
Э3 | Курс в Moodle "Решение аналитических задач на языке R" | portal.edu.asu.ru | ||
6.3. Перечень программного обеспечения | ||||
Open Office, http://www.openoffice.org/license.html , (бессрочно); Microsoft Office 2010 (Office 2010 Professional, № 4065231 от 08.12.2010), (бессрочно); Microsoft Windows 7 (Windows 7 Professional (№ 61834699 от 22.04.2013), (бессрочно); 7-Zip http://www.7-zip.org/license.txt , (бессрочно); AcrobatReader, http://wwwimages.adobe.com/content/dam/Adobe/en/legal/servicetou/Acrobat_com_Additional_TOU-en_US-20140618_1200.pdf , (бессрочно); R STUDIO (open source), http://www.rstudio.com/ , (бессрочно); Пакет статистического анализа R с Cairo, ggplot2, ggvis, pcaPP, pls, robustbase, rrcovHD, tidyr, UsingR, http://www.r-project.org/, (бессрочно). Microsoft Office 2010 (Office 2010 Professional, № 4065231 от 08.12.2010), (бессрочно); Microsoft Windows 7 (Windows 7 Professional, № 61834699 от 22.04.2013), (бессрочно); Chrome (http://www.chromium.org/chromium-os/licenses), (бессрочно); 7-Zip (http://www.7-zip.org/license.txt), (бессрочно); AcrobatReader (http://wwwimages.adobe.com/content/dam/Adobe/en/legal/servicetou/Acrobat_com_Additional_TOU-en_US-20140618_1200.pdf), (бессрочно); ASTRA LINUX SPECIAL EDITION (https://astralinux.ru/products/astra-linux-special-edition/), (бессрочно); LibreOffice (https://ru.libreoffice.org/), (бессрочно); Веб-браузер Chromium (https://www.chromium.org/Home/), (бессрочно); Антивирус Касперский (https://www.kaspersky.ru/), (до 23 июня 2024); Архиватор Ark (https://apps.kde.org/ark/), (бессрочно); Okular (https://okular.kde.org/ru/download/), (бессрочно); Редактор изображений Gimp (https://www.gimp.org/), (бессрочно) | ||||
6.4. Перечень информационных справочных систем | ||||
Информационная справочная система: СПС Консультант Плюс (инсталлированный ресурс АлтГУ или http://www.consultant.ru/). Профессиональные базы данных: 1. Профессиональная база данных: электронная библиотечная система Алтайского государственного университета (http://elibrary.asu.ru/); 2. Профессиональная база данных: научная электронная библиотека elibrary (http://elibrary.ru) 3. Электронная база данных справочной правовой системы ГАРАНТ. |
Аудитория | Назначение | Оборудование |
---|---|---|
Учебная аудитория | для проведения занятий всех видов (дисциплинарной, междисциплинарной и модульной подготовки), групповых и индивидуальных консультаций, текущего контроля и промежуточной аттестации, курсового проекта (работы), проведения практики | Стандартное оборудование (учебная мебель для обучающихся, рабочее место преподавателя, доска, мультимедийное оборудование стационарное или переносное) |
Помещение для самостоятельной работы | помещение для самостоятельной работы обучающихся | Компьютеры, ноутбуки с подключением к информационно-телекоммуникационной сети «Интернет», доступом в электронную информационно-образовательную среду АлтГУ |
208С | лаборатория информационных технологий - компьютерный класс – учебная аудитория для проведения занятий семинарского типа (лабораторных и(или) практических); проведения групповых и индивидуальных консультаций, текущего контроля и промежуточной аттестации | Учебная мебель на 15 посадочных мест; рабочее место преподавателя; доска магнитно-маркерная; компьютеры: марка HP модель ProOne 400 G2 20-in Non-Touch AiO - 15 единиц |
На лекциях преподаватель знакомит с основными понятиями по теме, алгоритмами, методами решения задач. На лекциях студент получает основной объем информации по каждой конкретной теме. Только посещение лекций является недостаточным для подготовки к лабораторным занятиям и зачету. Требуется также самостоятельная работа по изучению основной и дополнительной литературы и закрепление полученных на лабораторных занятиях навыков. Самостоятельная работа студентов – способ активного, целенаправленного приобретения студентом новых для него знаний, умений и навыков без непосредственного участия в этом процессе преподавателя. Качество получаемых студентом знаний напрямую зависит от качества и количества необходимого доступного материала, а также от желания (мотивации) студента их получить. При обучении осуществляется целенаправленный процесс, взаимодействие студента и преподавателя для формирования знаний, умений и навыков. Задания по темам выполняются на лабораторных занятиях в компьютерном классе. Если лабораторные занятия пропущены по уважительной причине, то соответствующие задания необходимо выполнить самостоятельно и представить результаты преподавателю на очередном занятии или консультации. |