МИНОБРНАУКИ РОССИИ
федеральное государственное бюджетное образовательное учреждение высшего образования
«Алтайский государственный университет»

Анализ данных в программе R
рабочая программа дисциплины

Закреплена за кафедройНET (реорганизована) 55
Направление подготовки39.04.01. Социология
ПрофильЦифровые методы анализа и визуализации данных в социальных исследованиях. ФГОС 3++
Форма обученияЗаочная
Общая трудоемкость4 ЗЕТ
Учебный планz39_04_01_ЦМА-1-2020
Часов по учебному плану 144
в том числе:
аудиторные занятия 14
самостоятельная работа 121
контроль 9
Виды контроля по курсам
экзамены: 3

Распределение часов по курсам

Курс 3 Итого
Вид занятий УПРПДУПРПД
Лекции 6 6 6 6
Практические 8 8 8 8
Сам. работа 121 121 121 121
Часы на контроль 9 9 9 9
Итого 144 144 144 144

Программу составил(и):
к.с.н., Доцент, Д.А. Омельченко

Рецензент(ы):
к.с.н., Доцент, В.В. Нагайцев

Рабочая программа дисциплины
Анализ данных в программе R

разработана в соответствии с ФГОС:
Федеральный государственный образовательный стандарт высшего образования по направлению подготовки 39.04.01 Социология (уровень магистратуры) (приказ Минобрнауки России от 05.02.2018 г. № 79)

составлена на основании учебного плана:
39.04.01 Социология
утвержденного учёным советом вуза от 30.06.2020 протокол № 6.

Рабочая программа одобрена на заседании кафедры
НET (реорганизована) 55

Протокол от 31.08.2020 г. № 1
Срок действия программы: 2020-2023 уч. г.

Заведующий кафедрой
Максимова Светлана Геннадьевна

Визирование РПД для исполнения в очередном учебном году

Рабочая программа пересмотрена, обсуждена и одобрена для
исполнения в 2020-2021 учебном году на заседании кафедры

НET (реорганизована) 55

Протокол от 31.08.2020 г. № 1
Заведующий кафедрой Максимова Светлана Геннадьевна

1. Цели освоения дисциплины

1.1.Дисциплина «Анализ данных в программе R» предназначена для освоения основ работы в среде программирования R, навыков статистического анализа и визуализации результатов исследования.

2. Место дисциплины в структуре ООП

Цикл (раздел) ООП: Б1.О.4

3. Компетенции обучающегося, формируемые в результате освоения дисциплины

ОПК-2.1: Обосновывает актуальность постановки фундаментальных и прикладных социологических исследований, формулирует цели и задачи социологического исследования;
ОПК-2.2: На основе теорий и концепций социологии формулирует задачи и гипотезы для выполнения исследовательских задач при постановке прикладных и фундаментальных социологических исследований;
ОПК-2.3: Анализирует и развивает новые методы исследования применительно к задачам социологического исследования
ОПК-2.4: Обосновывает предложения по совершенствованию и разработке методов сбора и анализа социологических данных;
ОПК-2.5: Разрабатывает стратегию управления социологическим исследованием
В результате освоения дисциплины обучающийся должен
3.1.Знать:
3.1.1.Возможности применения среды программирования R для сбора (извлечения) данных из виртуальных источников информации и анализа результатов прикладных социологических исследований.
Знать принципы работы в программе R, основные функции и библиотеки, используемые для статистического анализа.
Алгоритмы работы в программе R для проведения многомерных видов анализа (регрессии, классификации, факторного анализа)
Основы статистического вывода и возможности программы R проверки статистических гипотез, формулируемых в рамках прикладных и фундаментальных социологических исследований.
Алгоритмы работы в программе R с данными разного типа, верифицировать гипотезы на основе различных статистических методов и моделей.
Основы разработки статистических пакетов, работы в сообществе пользователей программы R.
Основные направления применения и развития среды программирования R.
Алгоритмы расчета для применения классических и современных статистических методов в среде R.
Возможности применения методов статистического анализа применительно к задачам социологического исследования.
Возможности и ограничения применения программной среды R.
Перспектив развития R для совершенствования и разработки методов сбора и анализа социологических данных.
Способы совершенствования существующих методов для анализа и визуализации социологических данных.
Основные компоненты статистической среды R, организацию вычислений и функций.
Основные этапы стратегии управления социологическим исследованием и ключевые пакеты среды R соответствующие данным этапам.
Возможности совершенствования стратегии социологического исследования с помощью среды программирования R.
Историю и основные принципы организации среды R,объекты, пакеты, функции и устройства. Типы данных, векторы и матрицы, импорт данных. Основы одномерного и многомерного статистического анализа, в том числе пространственного анализа, базовые и специализированные графические возможности.
3.2.Уметь:
3.2.1.Проводить элементарный статистический анализ в программе R.
Сделать выбор во множестве пользовательских пакетов сообразно задачам конкретного социологического исследования.
Применять программу R для многомерных методов статистического анализа, корректной визуализации результатов.
Проверять простые статистические гипотезы в программе R, создавать элементарные графики для одномерного анализа.
Комбинировать алгоритмы анализа на основе нескольких пользовательских пакетов.
Ставить сложные исследовательские задачи и гипотезы и проверять их с помощью среды программирования R.
Ориентироваться в существующих методах статистического анализа и их реализации в среде R.
Выбрать из множества программных возможностей соответствующие задачам социологическиго исследования.
Проводить сравнительный анализ методов и возможностей новых пакетов для решения задач социологического исследования.
Обосновывать необходимость применения программной среды R в рамках конкретного социологического исследования.
Обосновывать необходимость применения программной среды R для совершенствования механизмов сбора и анализа данных в рамках конкретного социологического исследования.
Обосновывать предложения по совершенствованию методов сбора и анализа данных с учетом современных достижений в области статистики и программирования.
Применять программную среду R для сбора и импорта данных, статистических вычислений.
Применять программную среду R на различных этапах исследования, в том числе для подготовки аналитических отчетов и презентаций.
Применять программную среду R для совершенствования стратегии социологического исследования.
3.3.Иметь навыки и (или) опыт деятельности (владеть):
3.3.1.Элементарными навыками написания программного кода на языке R. Основами статистического анализа в программе R, содержание которого определяется задачами фундаментального или прикладного исследования. Навыками комплексного статистического анализа и визуализации данных в среде программирования R. Навыками элементарного статистического анализа, визуализации данных. Навыками статистического обучения, регрессионного анализа и классификации.
Навыками проведения многомерного анализа и комплексной визуализации.Навыками применения базовых методов анализа и визуализации, встроенных в R.
Навыками импорта данных, применения классических методов статистики в R, использования базовых и более продвинутых возможностей R,
Навыками проверки множественных статистических гипотез, сравнительного анализа в R.
Навыками сбора и импорта данных, первичного статистического анализа. Навыками анализа методов и функций из различных статистических пакетов, разработки собственных пакетов применительнок задачам конкретного социологического исследования. Навыками анализа и визуализации данных в программной среде R, перспектив развития новых методов анализа. Начальными навыками программирования в среде R для реализации стратегии социологического исследования.
Основными навыками владения возможностями среды R для управления социологическим исследованием.
Продвинутыми навыками владения возможностями среды R для управления социологическим исследованием.


4. Структура и содержание дисциплины

Код занятия Наименование разделов и тем Вид занятия Курс Часов Компетенции Литература
Раздел 1. Введение в программную среду R
1.1. История создания и ключевые принципы программирования. Фундаментальные основы манипуляции данными. Лекции 3 2 ОПК-2.1, ОПК-2.2, ОПК-2.3, ОПК-2.4, ОПК-2.5 Л2.1
1.2. Импорт данных, первичная статистическая обработка. Базовые графики в R. Практические 3 2 ОПК-2.1, ОПК-2.2, ОПК-2.3, ОПК-2.4, ОПК-2.5
1.3. Двумерный анализ в R. Обзор основных пакетов. Лекции 3 2 ОПК-2.1, ОПК-2.2, ОПК-2.3, ОПК-2.4, ОПК-2.5 Л1.3
1.4. Эксплораторный анализ в R. Практические 3 2 ОПК-2.1, ОПК-2.2, ОПК-2.3, ОПК-2.4, ОПК-2.5
1.5. Подготовка самостоятельного исследовательского проекта по анализу данных в R. Поиск источников и сбор данных. Манипуляции и трансформации данных. Эксплораторный анализ и подготовка к моделированию. Сам. работа 3 60 ОПК-2.1, ОПК-2.2, ОПК-2.3, ОПК-2.4, ОПК-2.5
Раздел 2. Многомерные методы и основы машинного (статистического) обучения в R
2.1. Основы регрессионного моделирования, классификации и деревья решений. Лекции 3 2 ОПК-2.1, ОПК-2.2, ОПК-2.3, ОПК-2.4, ОПК-2.5 Л1.1
2.2. Обучение без учителя. Метод главных компонент. Кластерный анализ. Практические 3 2 ОПК-2.1, ОПК-2.2, ОПК-2.3, ОПК-2.4, ОПК-2.5 Л1.2
2.3. Пространственный анализ в R. Практические 3 2 ОПК-2.1, ОПК-2.2, ОПК-2.3, ОПК-2.4, ОПК-2.5 Л1.3
2.4. Подготовка к защите исследовательского проекта по анализу данных в R. Сам. работа 3 61 ОПК-2.1, ОПК-2.2, ОПК-2.3, ОПК-2.4, ОПК-2.5 Л1.2

5. Фонд оценочных средств

5.1. Контрольные вопросы и задания
ФОС размещен на странице курса на образовательном портале Алтайского государственного университета.
5.2. Темы письменных работ (эссе, рефераты, курсовые работы и др.)
Не предусмотрены. Индивидуальные темы исследовательских проектов утверждаются на практических занятиях.
5.3. Фонд оценочных средств
ОС размещен на странице курса на образовательном портале Алтайского государственного университета.
Приложения

6. Учебно-методическое и информационное обеспечение дисциплины

6.1. Рекомендуемая литература
6.1.1. Основная литература
Авторы Заглавие Издательство, год Эл. адрес
Л1.1 Гитис Л. Х. Статистическая классификация и кластерный анализ : М.: Изд-во МГГУ, 2003
Л1.2 П. Флах Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных: Учебник ДМК Пресс, 2015//ЭБС издательства «Лань» http://e.lanbook.com/books/element.php?pl1_id=69955
Л1.3 Комарова Е. С. Парный регрессионный анализ: Учебники и учебные пособия для ВУЗов Директ-Медиа, 2015 http://biblioclub.ru/index.php?page=book_red&id=278250
6.1.2. Дополнительная литература
Авторы Заглавие Издательство, год Эл. адрес
Л2.1 Кубенский А.А. ФУНКЦИОНАЛЬНОЕ ПРОГРАММИРОВАНИЕ. Учебник и практикум для академического бакалавриата: Гриф УМО ВО М.:Издательство Юрайт, 2018 https://biblio-online.ru/book/658E3C89-AAD5-498B-8B34-A29E1750D810
6.2. Перечень ресурсов информационно-телекоммуникационной сети "Интернет"
Название Эл. адрес
Э1 Everitt B.S., Hothorn T. A Handbook of Statistical Analyses Using R https://cran.r-project.org/web/packages/HSAUR/vignettes/Ch_introduction_to_R.pdf
Э2 Grolemund G. Wickham H. R for Data Science https://r4ds.had.co.nz/index.html
Э3 Maindonald John , Braun W. John Data Analysis and Graphics Using R – an Example-Based Approach http://www.ievbras.ru/ecostat/Kiril/R/Biblio_N/R_Eng/Maindonald2010.pdf
Э4 James G., Hastie T., Tibshirani R. An Introduction to Statistical Learning with Applications in R https://faculty.marshall.usc.edu/gareth-james/ISL/ISLR%20Seventh%20Printing.pdf
Э5 Курс на образовательном портале Алтайского государственного университета https://portal.edu.asu.ru/course/view.php?id=7511
6.3. Перечень программного обеспечения
R, RStudio, R Markdown
6.4. Перечень информационных справочных систем
https://community.rstudio.com/
https://cran.r-project.org/
https://journal.r-project.org/
http://www.r-tutor.com/
https://www.r-graph-gallery.com/
http://www.rdatamining.com/

7. Материально-техническое обеспечение дисциплины

Аудитория Назначение Оборудование
Учебная аудитория для проведения занятий лекционного типа, занятий семинарского типа (лабораторных и(или) практических), групповых и индивидуальных консультаций, текущего контроля и промежуточной аттестации, курсового проектирования (выполнения курсовых работ), проведения практик Стандартное оборудование (учебная мебель для обучающихся, рабочее место преподавателя, доска)
511Д лаборатория математического обеспечения социально-психологических исследований - учебная аудитория для проведения занятий лекционного типа; занятий семинарского типа (лабораторных и(или) практических); проведения групповых и индивидуальных консультаций, текущего контроля и промежуточной аттестации Учебная мебель на 20 посадочных мест; рабочее место преподавателя; доска меловая 1 шт.; компьютеры: 10 единиц; мониторы: 10 единиц.

8. Методические указания для обучающихся по освоению дисциплины

Для освоения курса необходимы: посещение лекций, выполнение заданий на практических занятиях (предоставляются в виде файлов с кодом в R и сгенерированных html файлов в специализированной программе для разметки R Markdown), подготовка индивидуального исследовательского проекта по анализу данных в R. Для получения аттестации студент должен продемонстрировать все навыки работы в программе: подготовка данных (импорт, чистка, фильтрация), первичная статистическая обработка и одномерная визуализация, проверка статистических гипотез на основе двух переменных, построение комплексных статистических моделей.