МИНОБРНАУКИ РОССИИ
федеральное государственное бюджетное образовательное учреждение высшего образования
«Алтайский государственный университет»

Анализ данных в программе R

рабочая программа дисциплины
Закреплена за кафедройНET (реорганизована) 55
Направление подготовки39.04.01. Социология
ПрофильЦифровые методы анализа и визуализации данных в социальных исследованиях
Форма обученияЗаочная
Общая трудоемкость4 ЗЕТ
Учебный планz39_04_01_ЦМА-1-2020
Часов по учебному плану 144
в том числе:
аудиторные занятия 14
самостоятельная работа 121
контроль 9
Виды контроля по курсам
экзамены: 3

Распределение часов по курсам

Курс 3 Итого
Вид занятий УПРПДУПРПД
Лекции 6 6 6 6
Практические 8 8 8 8
Сам. работа 121 121 121 121
Часы на контроль 9 9 9 9
Итого 144 144 144 144

Программу составил(и):
к.с.н., Доцент, Д.А. Омельченко

Рецензент(ы):
к.с.н., Доцент, В.В. Нагайцев

Рабочая программа дисциплины
Анализ данных в программе R

разработана в соответствии с ФГОС:
Федеральный государственный образовательный стандарт высшего образования по направлению подготовки 39.04.01 Социология (уровень магистратуры) (приказ Минобрнауки России от 05.02.2018 г. № 79)

составлена на основании учебного плана:
39.04.01 Социология
утвержденного учёным советом вуза от 30.06.2020 протокол № 6.

Рабочая программа одобрена на заседании кафедры
НET (реорганизована) 55

Протокол от 31.08.2020 г. № 1
Срок действия программы: 2020-2023 уч. г.

Заведующий кафедрой
Максимова Светлана Геннадьевна


Визирование РПД для исполнения в очередном учебном году

Рабочая программа пересмотрена, обсуждена и одобрена для
исполнения в 2020-2021 учебном году на заседании кафедры

НET (реорганизована) 55

Протокол от 31.08.2020 г. № 1
Заведующий кафедрой Максимова Светлана Геннадьевна


1. Цели освоения дисциплины

1.1.Дисциплина «Анализ данных в программе R» предназначена для освоения основ работы в среде программирования R, навыков статистического анализа и визуализации результатов исследования.

2. Место дисциплины в структуре ООП

Цикл (раздел) ООП: Б1.О.4

3. Компетенции обучающегося, формируемые в результате освоения дисциплины

ОПК-2.1 Обосновывает актуальность постановки фундаментальных и прикладных социологических исследований, формулирует цели и задачи социологического исследования;
ОПК-2.2 На основе теорий и концепций социологии формулирует задачи и гипотезы для выполнения исследовательских задач при постановке прикладных и фундаментальных социологических исследований;
ОПК-2.3 Анализирует и развивает новые методы исследования применительно к задачам социологического исследования
ОПК-2.4 Обосновывает предложения по совершенствованию и разработке методов сбора и анализа социологических данных;
ОПК-2.5 Разрабатывает стратегию управления социологическим исследованием
В результате освоения дисциплины обучающийся должен
3.1.Знать:
3.1.1.Возможности применения среды программирования R для сбора (извлечения) данных из виртуальных источников информации и анализа результатов прикладных социологических исследований.
Знать принципы работы в программе R, основные функции и библиотеки, используемые для статистического анализа.
Алгоритмы работы в программе R для проведения многомерных видов анализа (регрессии, классификации, факторного анализа)
Основы статистического вывода и возможности программы R проверки статистических гипотез, формулируемых в рамках прикладных и фундаментальных социологических исследований.
Алгоритмы работы в программе R с данными разного типа, верифицировать гипотезы на основе различных статистических методов и моделей.
Основы разработки статистических пакетов, работы в сообществе пользователей программы R.
Основные направления применения и развития среды программирования R.
Алгоритмы расчета для применения классических и современных статистических методов в среде R.
Возможности применения методов статистического анализа применительно к задачам социологического исследования.
Возможности и ограничения применения программной среды R.
Перспектив развития R для совершенствования и разработки методов сбора и анализа социологических данных.
Способы совершенствования существующих методов для анализа и визуализации социологических данных.
Основные компоненты статистической среды R, организацию вычислений и функций.
Основные этапы стратегии управления социологическим исследованием и ключевые пакеты среды R соответствующие данным этапам.
Возможности совершенствования стратегии социологического исследования с помощью среды программирования R.
Историю и основные принципы организации среды R,объекты, пакеты, функции и устройства. Типы данных, векторы и матрицы, импорт данных. Основы одномерного и многомерного статистического анализа, в том числе пространственного анализа, базовые и специализированные графические возможности.
3.2.Уметь:
3.2.1.Проводить элементарный статистический анализ в программе R.
Сделать выбор во множестве пользовательских пакетов сообразно задачам конкретного социологического исследования.
Применять программу R для многомерных методов статистического анализа, корректной визуализации результатов.
Проверять простые статистические гипотезы в программе R, создавать элементарные графики для одномерного анализа.
Комбинировать алгоритмы анализа на основе нескольких пользовательских пакетов.
Ставить сложные исследовательские задачи и гипотезы и проверять их с помощью среды программирования R.
Ориентироваться в существующих методах статистического анализа и их реализации в среде R.
Выбрать из множества программных возможностей соответствующие задачам социологическиго исследования.
Проводить сравнительный анализ методов и возможностей новых пакетов для решения задач социологического исследования.
Обосновывать необходимость применения программной среды R в рамках конкретного социологического исследования.
Обосновывать необходимость применения программной среды R для совершенствования механизмов сбора и анализа данных в рамках конкретного социологического исследования.
Обосновывать предложения по совершенствованию методов сбора и анализа данных с учетом современных достижений в области статистики и программирования.
Применять программную среду R для сбора и импорта данных, статистических вычислений.
Применять программную среду R на различных этапах исследования, в том числе для подготовки аналитических отчетов и презентаций.
Применять программную среду R для совершенствования стратегии социологического исследования.
3.3.Иметь навыки и (или) опыт деятельности (владеть):
3.3.1.Элементарными навыками написания программного кода на языке R. Основами статистического анализа в программе R, содержание которого определяется задачами фундаментального или прикладного исследования. Навыками комплексного статистического анализа и визуализации данных в среде программирования R. Навыками элементарного статистического анализа, визуализации данных. Навыками статистического обучения, регрессионного анализа и классификации.
Навыками проведения многомерного анализа и комплексной визуализации.Навыками применения базовых методов анализа и визуализации, встроенных в R.
Навыками импорта данных, применения классических методов статистики в R, использования базовых и более продвинутых возможностей R,
Навыками проверки множественных статистических гипотез, сравнительного анализа в R.
Навыками сбора и импорта данных, первичного статистического анализа. Навыками анализа методов и функций из различных статистических пакетов, разработки собственных пакетов применительнок задачам конкретного социологического исследования. Навыками анализа и визуализации данных в программной среде R, перспектив развития новых методов анализа. Начальными навыками программирования в среде R для реализации стратегии социологического исследования.
Основными навыками владения возможностями среды R для управления социологическим исследованием.
Продвинутыми навыками владения возможностями среды R для управления социологическим исследованием.


4. Структура и содержание дисциплины

Код занятия Наименование разделов и тем Вид занятия Курс Часов Компетенции Литература
Раздел 1. Введение в программную среду R
1.1. История создания и ключевые принципы программирования. Фундаментальные основы манипуляции данными. Лекции 3 2 ОПК-2.1, ОПК-2.2, ОПК-2.3, ОПК-2.4, ОПК-2.5 Л2.1
1.2. Импорт данных, первичная статистическая обработка. Базовые графики в R. Практические 3 2 ОПК-2.1, ОПК-2.2, ОПК-2.3, ОПК-2.4, ОПК-2.5
1.3. Двумерный анализ в R. Обзор основных пакетов. Лекции 3 2 ОПК-2.1, ОПК-2.2, ОПК-2.3, ОПК-2.4, ОПК-2.5 Л1.2
1.4. Эксплораторный анализ в R. Практические 3 2 ОПК-2.1, ОПК-2.2, ОПК-2.3, ОПК-2.4, ОПК-2.5
1.5. Подготовка самостоятельного исследовательского проекта по анализу данных в R. Поиск источников и сбор данных. Манипуляции и трансформации данных. Эксплораторный анализ и подготовка к моделированию. Сам. работа 3 60 ОПК-2.1, ОПК-2.2, ОПК-2.3, ОПК-2.4, ОПК-2.5
Раздел 2. Многомерные методы и основы машинного (статистического) обучения в R
2.1. Основы регрессионного моделирования, классификации и деревья решений. Лекции 3 2 ОПК-2.1, ОПК-2.2, ОПК-2.3, ОПК-2.4, ОПК-2.5 Л1.1
2.2. Обучение без учителя. Метод главных компонент. Кластерный анализ. Практические 3 2 ОПК-2.1, ОПК-2.2, ОПК-2.3, ОПК-2.4, ОПК-2.5 Л1.3
2.3. Пространственный анализ в R. Практические 3 2 ОПК-2.1, ОПК-2.2, ОПК-2.3, ОПК-2.4, ОПК-2.5 Л1.2
2.4. Подготовка к защите исследовательского проекта по анализу данных в R. Сам. работа 3 61 ОПК-2.1, ОПК-2.2, ОПК-2.3, ОПК-2.4, ОПК-2.5 Л1.3

5. Фонд оценочных средств

5.1. Контрольные вопросы и задания для проведения текущего контроля и промежуточной аттестации по итогам освоения дисциплины
ФОС размещен на странице курса на образовательном портале Алтайского государственного университета.
5.2. Темы письменных работ для проведения текущего контроля (эссе, рефераты, курсовые работы и др.)
Не предусмотрены. Индивидуальные темы исследовательских проектов утверждаются на практических занятиях.
5.3. Фонд оценочных средств для проведения промежуточной аттестации
ОС размещен на странице курса на образовательном портале Алтайского государственного университета.

6. Учебно-методическое и информационное обеспечение дисциплины

6.1. Рекомендуемая литература
6.1.1. Основная литература
Авторы Заглавие Издательство, год Эл. адрес
Л1.1 Гитис Л. Х. Статистическая классификация и кластерный анализ : М.: Изд-во МГГУ, 2003
Л1.2 Комарова Е. С. Парный регрессионный анализ: Учебники и учебные пособия для ВУЗов Директ-Медиа, 2015 biblioclub.ru
Л1.3 П. Флах Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных: Учебник ДМК Пресс, 2015//ЭБС издательства «Лань» e.lanbook.com
6.1.2. Дополнительная литература
Авторы Заглавие Издательство, год Эл. адрес
Л2.1 Кубенский А.А. ФУНКЦИОНАЛЬНОЕ ПРОГРАММИРОВАНИЕ. Учебник и практикум для академического бакалавриата: Гриф УМО ВО М.:Издательство Юрайт, 2018 biblio-online.ru
6.2. Перечень ресурсов информационно-телекоммуникационной сети "Интернет"
Название Эл. адрес
Э1 Everitt B.S., Hothorn T. A Handbook of Statistical Analyses Using R cran.r-project.org
Э2 Grolemund G. Wickham H. R for Data Science r4ds.had.co.nz
Э3 Maindonald John , Braun W. John Data Analysis and Graphics Using R – an Example-Based Approach www.ievbras.ru
Э4 James G., Hastie T., Tibshirani R. An Introduction to Statistical Learning with Applications in R faculty.marshall.usc.edu
Э5 Курс на образовательном портале Алтайского государственного университета portal.edu.asu.ru
6.3. Перечень программного обеспечения
R, RStudio, R Markdown
6.4. Перечень информационных справочных систем
https://community.rstudio.com/
https://cran.r-project.org/
https://journal.r-project.org/
http://www.r-tutor.com/
https://www.r-graph-gallery.com/
http://www.rdatamining.com/

7. Материально-техническое обеспечение дисциплины

Аудитория Назначение Оборудование
511Д лаборатория математического обеспечения социально-психологических исследований - учебная аудитория для проведения занятий лекционного типа; занятий семинарского типа (лабораторных и(или) практических); проведения групповых и индивидуальных консультаций, текущего контроля и промежуточной аттестации Учебная мебель на 20 посадочных мест; рабочее место преподавателя; доска меловая 1 шт.; компьютеры: 10 единиц; мониторы: 10 единиц.
Учебная аудитория для проведения занятий лекционного типа, занятий семинарского типа (лабораторных и(или) практических), групповых и индивидуальных консультаций, текущего контроля и промежуточной аттестации, курсового проектирования (выполнения курсовых работ), проведения практик Стандартное оборудование (учебная мебель для обучающихся, рабочее место преподавателя, доска)

8. Методические указания для обучающихся по освоению дисциплины

Для освоения курса необходимы: посещение лекций, выполнение заданий на практических занятиях (предоставляются в виде файлов с кодом в R и сгенерированных html файлов в специализированной программе для разметки R Markdown), подготовка индивидуального исследовательского проекта по анализу данных в R. Для получения аттестации студент должен продемонстрировать все навыки работы в программе: подготовка данных (импорт, чистка, фильтрация), первичная статистическая обработка и одномерная визуализация, проверка статистических гипотез на основе двух переменных, построение комплексных статистических моделей.