Закреплена за кафедрой | Кафедра социальной и молодежной политики |
---|---|
Направление подготовки | 39.04.01. Социология |
Профиль | Цифровые методы анализа и визуализации данных в социальных исследованиях |
Форма обучения | Очная |
Общая трудоемкость | 6 ЗЕТ |
Учебный план | 39_04_01_Социология_ЦМА-2022 |
|
|
Распределение часов по семестрам
Курс (семестр) | 2 (4) | Итого | ||
---|---|---|---|---|
Недель | 11,5 | |||
Вид занятий | УП | РПД | УП | РПД |
Лекции | 20 | 20 | 20 | 20 |
Лабораторные | 32 | 32 | 32 | 32 |
Сам. работа | 69 | 69 | 69 | 69 |
Консультации | 68 | 68 | 68 | 68 |
Часы на контроль | 27 | 27 | 27 | 27 |
Итого | 216 | 216 | 216 | 216 |
Визирование РПД для исполнения в очередном учебном году
Рабочая программа пересмотрена, обсуждена и одобрена для
исполнения в 2023-2024 учебном году на заседании
кафедры
Кафедра социальной и молодежной политики
Протокол от 31.08.2020 г. № 1
Заведующий кафедрой Максимова Светлана Геннадьевна
1.1. | Дисциплина «Анализ данных в программе R» предназначена для освоения основ работы в среде программирования R, навыков статистического анализа и визуализации результатов исследования. |
---|
Цикл (раздел) ООП: Б1.О.03 |
ОПК-2 | Способен проводить фундаментальные и прикладные социологические исследования и представлять их результаты |
ОПК-2.1 | Обосновывает актуальность постановки фундаментальных и прикладных социологических исследований, формулирует цели и задачи социологического исследования |
ОПК-2.2 | На основе теорий и концепций социологии формулирует задачи и гипотезы для выполнения исследовательских задач при постановке прикладных и фундаментальных социологических исследований |
ОПК-2.3 | Анализирует и создает инструментарий исследования применительно к задачам социологического исследования |
ОПК-2.4 | Обосновывает предложения по совершенствованию и разработке методов сбора и анализа социологических данных |
ОПК-2.5 | Представляет результаты фундаментального прикладного социологического исследования на научных мероприятиях |
В результате освоения дисциплины обучающийся должен | |
3.1. | Знать: |
---|---|
3.1.1. | На основе теорий и концепций социологии формулирует задачи и гипотезы для выполнения исследовательских задач при постановке прикладных и фундаментальных социологических исследований |
3.2. | Уметь: |
3.2.1. | Анализирует и создает инструментарий исследования применительно к задачам социологического исследования |
3.3. | Иметь навыки и (или) опыт деятельности (владеть): |
3.3.1. | Представляет результаты фундаментального прикладного социологического исследования на научных мероприятиях |
Код занятия | Наименование разделов и тем | Вид занятия | Семестр | Часов | Компетенции | Литература |
---|---|---|---|---|---|---|
Раздел 1. Введение в программную среду R | ||||||
1.1. | История создания и ключевые принципы программирования. Фундаментальные основы манипуляции данными. | Лекции | 4 | 4 | Л2.1 | |
1.2. | Введение в R. Установка программы, начало работы в R и RStudio. Установка основных библиотек. Типы данных и основы кодирования на R. | Лекции | 4 | 2 | ||
1.3. | Импорт данных, первичная статистическая обработка. Базовые графики в R. | Лабораторные | 4 | 6 | ||
1.4. | Двумерный анализ в R. Обзор основных пакетов. | Лекции | 4 | 6 | Л1.1 | |
1.5. | Эксплораторный анализ в R. | Лабораторные | 4 | 10 | ||
1.6. | Подготовка самостоятельного исследовательского проекта по анализу данных в R. Поиск источников и сбор данных. Манипуляции и трансформации данных. Эксплораторный анализ и подготовка к моделированию. | Сам. работа | 4 | 30 | ||
1.7. | Подготовка самостоятельного исследовательского проекта по анализу данных в R. Поиск источников и сбор данных. Манипуляции и трансформации данных. Эксплораторный анализ и подготовка к моделированию. | Консультации | 4 | 30 | ||
Раздел 2. Многомерные методы и основы машинного (статистического) обучения в R | ||||||
2.1. | Основы регрессионного моделирования, классификации и деревья решений. | Лекции | 4 | 6 | ||
2.2. | Возможности сетевого анализа и анализа текстовой информации в R. | Лекции | 4 | 2 | Л1.2 | |
2.3. | Обучение без учителя. Метод главных компонент. Кластерный анализ. | Лабораторные | 4 | 6 | Л1.2 | |
2.4. | Регрессионный анализ в R. | Лабораторные | 4 | 6 | ||
2.5. | Представление результатов анализа в R Markdown | Лабораторные | 4 | 4 | Л1.1 | |
2.6. | Подготовка к защите исследовательского проекта по анализу данных в R. | Сам. работа | 4 | 39 | Л1.2 | |
2.7. | Подготовка к защите исследовательского проекта по анализу данных в R. | Консультации | 4 | 38 |
5.1. Контрольные вопросы и задания для проведения текущего контроля и промежуточной аттестации по итогам освоения дисциплины |
Оценочные материалы для текущего контроля по разделам и темам дисциплины в полном объеме размещены в онлайн-курсе на образовательном портале «Цифровой университет АлтГУ»: https://portal.edu.asu.ru/enrol/index.php?id=7511 ОЦЕНКА СФОРМИРОВАННОСТИ КОМПЕТЕНЦИИ ОПК-2 Способен проводить фундаментальные и прикладные социологические исследования и представлять их результаты ПРИМЕРЫ ЗАДАНИЙ ЗАКРЫТОГО ТИПА 1. С помощью какой библиотеки можно импортировать данные в формате spss? a) rvest b) haven c) readr ОТВЕТ: b 2. Вы проводите трансформацию данных социологического опроса. В массиве data – три переменных – пол, возраст по трем категориям и среднемесячный доход в тысячах рублей. Каким образом с помощью языка R создать таблицу с этими же переменными так, чтобы в ячейках был подсчитан средний доход для каждой группы, образуемой переменными пола и возраста? a) data |> group_by(пол, возраст) |> summarize(mean=mean(доход)) b) data |> group_by(пол, возраст) |> mutate(mean=mean(доход)) c) data |> group_by(пол, возраст) |> count(mean=mean(доход)) ОТВЕТ: a 3. Какая структура данных в R представляет собой список переменных разного типа, имеющих одинаковую длину и уникальные имена? a) vector b) data frame c) list d) array ОТВЕТ: b 4. С помощью какого кода на языке R возможно переопределить уровни факторной переменной «удовлетворенность жизнью»? a) order(df$satisfaction, levels=c('совсем не удовлетворен', 'скорее не удовлетворен', 'и да, и нет', 'скорее удовлетворен', 'полностью удовлетворен')) b) level(df$satisfaction, order=c('совсем не удовлетворен', 'скорее не удовлетворен', 'и да, и нет', 'скорее удовлетворен', 'полностью удовлетворен')) c) factor(df$satisfaction, levels=c('совсем не удовлетворен', 'скорее не удовлетворен', 'и да, и нет', 'скорее удовлетворен', 'полностью удовлетворен')) ОТВЕТ: c 5. Какие функции в R позволяют получить таблицу одномерных частот признака? a) table() b) tbl() c) freq() d) tibble() ОТВЕТ: аc 6. Какая функция используется для того, чтобы разбить график, построенный по результатам социологического исследования, на несколько на основе двух дополнительных переменных? a) coord_flip() b) facet_wrap() c) facet_grid() ОТВЕТ: с 7. Какая функция библиотеки dplyr используется для отбора переменных для анализа? a) select() b) filter() c) find() d) remove() ОТВЕТ: a 8. Какая из функций библиотеки infer отвечает за представление взаимоотношений между переменными, включенными в анализ? a) specify() b) hypothesize() c) generate() d) calculate() ОТВЕТ: a 9. Вы проводите корреляционный анализ между показателями социологического исследования с помощью функции cor.test(). Какой из включенных в данную функцию методов является параметрическим? a) Kendall b) Pearson c) Spearman ОТВЕТ: b 10. Какие графические функции в большей степени подходят для представления взаимосвязи между двумя категориальными переменными? a) scatter() b) network_plot() c) mosaic() d) barplot() ОТВЕТ: cd 11. С помощью какого критерия можно сравнить различия между ожидаемыми и наблюдаемыми частотами в таблице сопряженности? a) wilcox.test () b) chisq.test() c) t.test() ОТВЕТ: b 12. Для создания выборки из набора данных используется функция: a) sample() b) bootstrap() c) permutation() ОТВЕТ: a 13. Какой метод из нижеперечисленных позволяет проводить кластерный анализ в R? a) lm() b) kmeans() c) fa() d) nls() ОТВЕТ: b 14. Как в регрессионном анализе в R записывается формула взаимосвязи между зависимой и независимой переменной? a) y ~ x b) y:x c) y+x ОТВЕТ: a 15. Вы провели комплексное социологическое исследование, в котором использовалось два вида инструментария: опросник для домохозяйств и индивидуальный опросник. Как объединить два набора данных в R, если имеется общая идентифицирующая переменная ID? a) merge(set1, set2, all = TRUE, by = "ID") b) set1 %>% full_join(set2, by = "ID") c) collapse(set1, set2, by=”ID”) d) cbind(set1, set2) ОТВЕТ: ab КРИТЕРИИ ОЦЕНИВАНИЯ: Каждое задание оценивается 1 баллом. Оценивание КИМ теоретического характера в целом: • «зачтено» – верно выполнено более 50% заданий; «не зачтено» – верно выполнено 50% и менее 50% заданий; • «отлично» – верно выполнено 85-100% заданий; «хорошо» – верно выполнено 70-84% заданий; «удовлетворительно» – верно выполнено 51-69% заданий; «неудовлетворительно» – верно выполнено 50% или менее 50% заданий. ПРИМЕРЫ ЗАДАНИЙ ОТКРЫТОГО ТИПА 1. К какому типу относится язык программирования R? Ответ: К интерпретируемым языкам. 2. На каких этапах социологического исследования возможно применение языка R? Ответ: на этапе сбора данных, предварительной обработки данных, проведения статистического анализа, представления результатов. 3. Структура данных в R, содержащая элементы различных типов, такие как числа, строки, вектора, матрицы или даже функции. Каждый элемент может иметь разную длину и имя. Доступ к элементам осуществляется с помощью индексирования. Ответ: список. 4. Предположим, что в наборе данных smoke есть переменная о частоте курения (freq), содержащая варианты ответа «никогда», «время от времени», «регулярно», «постоянно». Как с помощью R перекодировать эту переменную так, чтобы варианты ответа были представлены в числовом виде? Ответ: smoke<-smoke %>%mutate(freq = recode(freq, "Никогда" = 1, "время от времени " = 2, "регулярно" = 3, "постоянно " = 4)) ИЛИ Smoke<-smoke %>% mutate( freq = case_match( freq, " Никогда " ~ 1 " время от времени" ~ 2, "регулярно" ~ 3, " постоянно" ~ 4) 5. – описывает в графической системе ggplot2 тип графика, который будет использован для визуализации результатов исследования. Ответ: геометрический объект, geom. 6. Назовите три основных составляющих «чистых» данных (tidy data) в R? Ответ: 1. Каждый столбец содержит одну переменную. 2. Каждая строка содержит одно наблюдение. 3. В каждой ячейке содержится только одно значение. 7. Вы проводите анализ результатов социологического исследования, посвященного репродуктивным установкам, и хотите проанализировать отдельно группу лиц с высшим образованием. Данные хранятся в наборе df, переменная образования – educ, уровни – 1 – Основное общее образование (9 классов) или меньше, 2 – Среднее (полное) общее образование, 3 – Начальное или среднее профессиональное образование, 4 – высшее образование (диплом специалиста, бакалавра или магистра). Создайте новый набор df_new с отфильтрованными данными: Ответ: df1<-df[which(df$educ==4),] ИЛИ data2<-filter(data, пол==1) 8. В наборе данных df, представляющем результаты лонгитюдного социологического исследования удовлетворенности трудом в десяти организациях, проводимого ежегодно в период 2015-2022 гг., данные представлены в «длинном формате», то есть для каждой организации имеется восемь строк, по одной на каждый год исследования. Каким образом можно переформатировать данные в «широкий формат», чтобы количество строк совпадало с количеством организаций, а значения показателя удовлетворенности трудом (LS) были бы представлены в столбцах, отдельно для каждого года? Ответ: df %>% pivot_wider(id_cols = organization, names_from = year, values_from =LS) -> df ИЛИ df <- dcast(df, organization ~ year, value.var = "LS") 9. Во многих социологических исследованиях применяется комплексный дизайн, предполагающий разделение генеральной совокупности на страты или кластеры. Как можно учесть особенности формирования выборочной совокупности, проводя анализ в R? Ответ: существует ряд библиотек, позволяющий провести статистический анализ с учетом определенного дизайна исследования, сделать пост-стратификацию и калибровку. Для социологических исследований интерес представляют такие библиотеки как survey и sampling. 10. Как в R сделать проверку количественной переменной на нормальность распределения? Ответ: Проверка на нормальность может быть проведена путем анализа описательных статистик, графического анализа и применения статистических критериев. Описательные статистики могут быть исследованы с помощью функции summary из базового R или describe() из библиотеки psych. Графически исследовать данные можно с помощью гистограммы – hist(), boxplot(), qqnorm(). Возможными статистическими критериями являются критерий Колмогорова-Смирнова – ks.test() или Шапиро-Уилка – shapiro.test() 11. Как с помощью языка R проанализировать различия в средней выраженности признака в двух группах? Ответ: Нужно провести предварительный описательный анализ, позволяющий определить методы, которые можно использовать для проверки гипотезы о равенстве средних значений. Если распределение количественной переменной близко к нормальному, можно воспользоваться t-критерием Стьюдента – t.test(), если есть существенные отклонения, лучше воспользоваться его непараметрическим аналогом – wilcox.test(). 12. В одном из социологических опросов изучались установки населения в отношении религии. Для оценки использовалось семь показателей, представленных в пятибалльной шкале Ликерта (от «совершенно согласен» до «совершенно не согласен»). Как сделать визуализацию результатов исследования, упорядочив шкалы по количеству положительных оценок? Ответ: для анализа подобных шкал в R есть специальная библиотека likert. 13. С помощью каких функций и библиотек R можно провести факторный анализ? Приведите 1-2 примера. Ответ. Встроенной функцией для проведения факторного анализа является factanal(). Альтернативным и более гибким способом, представляющим дополнительные инструменты вращения факторов и оценки факторных значений, а также проведения параллельного анализа для определения количества факторов, является функция fa() в библиотеке psych. 14. К какому типу статистических моделей относится glm(y ~ x + y, family = binomial)? Ответ: модель логистической регрессии 15. Метод оценки аналитической модели на независимых данных, в ходе применения которого данные разбиваются на k частей, которые используются для обучения и проверки качества моделирования, называется ______________ Ответ: кросс-валидация 16. Приведите три примера библиотек, позволяющих осуществлять анализ пропущенных значений и множественные импутации? Ответ: mice, mitools, mi 17. Какой инструмент R позволяет проводить анализ результатов социологического исследования, объединяя статистическую обработку данных и описание результатов Ответ: R Markdown 18. Как в R можно создать презентацию, включающую результаты социологического исследования, представленную в формате pdf? Ответ: презентацию в формате pdf можно создать с помощью R Markdown, выбрав в качестве формата вывода Beamer, либо можно выбрать формат html и затем сохранить файл в формате pdf с помощью pagedown::chrome_print(). 19. Каковы преимущества R Markdown для представления результатов социологического исследования? Ответ: R Markdown – это доступный язык разметки с синтаксисом форматирования текста, позволяющий создавать документы, сочетающие код (расчеты, методы анализа) и его описание. Его преимуществами являются: возможности создания документов разной структуры (от простых страниц, до многостраничных книг и технических руководств) и природы (как статические документы, так и интерактивные визуализации и приложения); возможность конвертировать код во множество форматов – PDF, HTML, docs и т.д.; создание отчетов по результатам исследования, которые могут быть воспроизведены и верифицированы независимыми исследователями; высокое качество и разнообразие инструментов визуализации результатов исследования, возможность быстрого распространения и совместной работы членов исследовательского коллектива. 20. Как текст, создаваемый в R Markdown, можно интегрировать код с анализом результатов социологического исследования? Ответ: Есть два способа включения кода в R Markdown. Первый способ – построчный (inline), осуществляется с помощью включения в текст кода в одинарных кавычках – ‘r <код> ‘. Второй способ – создание чанков (chunks), в которых происходит загрузка данных и необходимых библиотек, выполнение функций и вывод результатов проведенного анализа. КРИТЕРИИ ОЦЕНИВАНИЯ ОТКРЫТЫХ ВОПРОСОВ. «Отлично»: Ответ полный, развернутый. Вопрос точно и исчерпывающе передан, терминология сохранена, студент превосходно владеет основной и дополнительной литературой, ошибок нет. «Хорошо»: Ответ полный, хотя краток, терминологически правильный, нет существенных недочетов. Студент хорошо владеет пройденным программным материалом; владеет основной литературой, суждения правильны. «Удовлетворительно»: Ответ неполный. В терминологии имеются недостатки. Студент владеет программным материалом, но имеются недочеты. Суждения фрагментарны. «Неудовлетворительно»: Не использована специальная терминология. Ответ в сущности неверен. Переданы лишь отдельные фрагменты соответствующего материала вопроса. Ответ не соответствует вопросу или вовсе не дан. |
5.2. Темы письменных работ для проведения текущего контроля (эссе, рефераты, курсовые работы и др.) |
Не предусмотрены. Индивидуальные темы исследовательских проектов утверждаются на практических занятиях. |
5.3. Фонд оценочных средств для проведения промежуточной аттестации |
Промежуточная аттестация заключается в проведении в конце семестра экзамена по всему изученному курсу. Экзамен проводится в виде теста и защиты индивидуального проекта. Тест размещен в разделе «Промежуточная аттестация по дисциплине» онлайн-курса на образовательном портале «Цифровой университет АлтГУ». Количество заданий в контрольно-измерительном тесте для промежуточной аттестации, составляет 40. КРИТЕРИИ ОЦЕНИВАНИЯ: Каждое задание оценивается в 1 балл. Оценивание теста: Для экзамена: «отлично» – верно выполнено 85-100% заданий; «хорошо» – верно выполнено 70-84% заданий; «удовлетворительно» – верно выполнено 51-69% заданий; «неудовлетворительно» – верно выполнено 50% и менее 50% заданий. КРИТЕРИИ ОЦЕНИВАНИЯ ИНДИВИДУАЛЬНЫХ ПРОЕКТОВ: «отлично» – продемонстрировано владение основными функциями и библиотеками R для анализа и визуализации данных, включая методы многомерного анализа, создания интерактивных графиков и приложений «хорошо» – проект выполнен с небольшими нарушениями, возможно отсутствие некоторых элементов (например, shiny); «удовлетворительно» – проект выполнен формально, студент демонстрирует общие знания языка R, отсутствуют знания многомерных методов анализа на R, визуализации отличаются примитивностью, есть ошибки кода ; «неудовлетворительно» – выполнено менее половины заданий по проекту. |
6.1. Рекомендуемая литература | ||||
6.1.1. Основная литература | ||||
Авторы | Заглавие | Издательство, год | Эл. адрес | |
Л1.1 | Комарова Е. С. | Парный регрессионный анализ: Учебники и учебные пособия для ВУЗов | Директ-Медиа, 2015 | biblioclub.ru |
Л1.2 | П. Флах | Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных: Учебник | ДМК Пресс, 2015//ЭБС издательства «Лань» | e.lanbook.com |
6.1.2. Дополнительная литература | ||||
Авторы | Заглавие | Издательство, год | Эл. адрес | |
Л2.1 | Кубенский А.А. | ФУНКЦИОНАЛЬНОЕ ПРОГРАММИРОВАНИЕ. Учебник и практикум для академического бакалавриата: Гриф УМО ВО | М.:Издательство Юрайт, 2018 | biblio-online.ru |
6.2. Перечень ресурсов информационно-телекоммуникационной сети "Интернет" | ||||
Название | Эл. адрес | |||
Э1 | Everitt B.S., Hothorn T. A Handbook of Statistical Analyses Using R | cran.r-project.org | ||
Э2 | Grolemund G. Wickham H. R for Data Science | r4ds.had.co.nz | ||
Э3 | Maindonald John , Braun W. John Data Analysis and Graphics Using R – an Example-Based Approach | www.ievbras.ru | ||
Э4 | James G., Hastie T., Tibshirani R. An Introduction to Statistical Learning with Applications in R | faculty.marshall.usc.edu | ||
Э5 | Курс на образовательном портале Алтайского государственного университета | portal.edu.asu.ru | ||
6.3. Перечень программного обеспечения | ||||
«Microsoft Office 2010 (Office 2010 Professional, № 4065231 от 08.12.2010), (бессрочно); Microsoft Windows 7 (Windows 7 Professional, № 61834699 от 22.04.2013), (бессрочно); Chrome (http://www.chromium.org/chromium-os/licenses ), (бессрочно); 7-Zip (http://www.7-zip.org/license.txt ), (бессрочно); AcrobatReader (http://wwwimages.adobe.com/content/dam/Adobe/en/legal/servicetou/Acrobat_com_Additional_TOU-en_US-20140618_1200.pdf), (бессрочно); ASTRA LINUX SPECIAL EDITION (https://astralinux.ru/products/astra-linux-special-edition/), (бессрочно); LibreOffice (https://ru.libreoffice.org/), (бессрочно); Веб-браузер Chromium (https://www.chromium.org/Home/), (бессрочно); Антивирус Касперский (https://www.kaspersky.ru/), (до 23 июня 2024); Архиватор Ark (https://apps.kde.org/ark/), (бессрочно); Okular (https://okular.kde.org/ru/download/), (бессрочно); Редактор изображений Gimp (https://www.gimp.org/), (бессрочно)». Язык программирования для статистической обработки данных и работы с графикой R-4.3.1 Интегрированная среда разработки RStudio | ||||
6.4. Перечень информационных справочных систем | ||||
https://community.rstudio.com/ https://cran.r-project.org/ https://journal.r-project.org/ http://www.r-tutor.com/ https://www.r-graph-gallery.com/ http://www.rdatamining.com/ |
Аудитория | Назначение | Оборудование |
---|---|---|
415Д | специализированный компьютерный класс кафедры связей с общественностью и рекламы - компьютерный класс - учебная аудитория для проведения занятий семинарского типа (лабораторных и(или) практических); проведения групповых и индивидуальных консультаций, текущего контроля и промежуточной аттестации | Учебная мебель на 16 посадочных мест; рабочее место преподавателя; доска меловая 1шт.; системный блок: IntelCore 2 DuoE7400 -17 шт.; сервер: системный блок: AquariusIntelPentiumD; монитор: Acer V173 B -16 шт.; монитор: Acer V193W 1 шт.; телевизор Samsung |
410Д | лаборатория информационных технологий - компьютерный класс кафедры теории и практики журналистики - учебная аудитория для проведения занятий лекционного типа; занятий семинарского типа (лабораторных и(или) практических); проведения групповых и индивидуальных консультаций, текущего контроля и промежуточной аттестации | Учебная мебель на 24 посадочных места; рабочее место преподавателя; доска пластиковая - 1 шт.; компьютеры: марка Intel Core модель i3-2120 3,3 ГГц/DDR3 2 ГБ/500 ГБ/DVD RW/22» - 11 единиц; монитор: марка samsung модель 943T - 1 единица; мониторы: BenQ G950A/КМ/ - 10 шт.; бесперебойник: UPS IPPon Black Power Pro 500 - 12 шт.; телевизор: LCD 46" Samsung LE-46S81B |
511Д | лаборатория математического обеспечения социально-психологических исследований - учебная аудитория для проведения занятий лекционного типа; занятий семинарского типа (лабораторных и(или) практических); проведения групповых и индивидуальных консультаций, текущего контроля и промежуточной аттестации | Учебная мебель на 20 посадочных мест; рабочее место преподавателя; доска меловая 1 шт.; компьютеры: 10 единиц; мониторы: 10 единиц. |
Учебная аудитория | для проведения занятий лекционного типа, занятий семинарского типа (лабораторных и(или) практических), групповых и индивидуальных консультаций, текущего контроля и промежуточной аттестации, курсового проектирования (выполнения курсовых работ), проведения практик | Стандартное оборудование (учебная мебель для обучающихся, рабочее место преподавателя, доска) |
Для освоения курса необходимы: посещение лекций, выполнение заданий на практических занятиях (предоставляются в виде файлов с кодом в R и сгенерированных html файлов в специализированной программе для разметки R Markdown), подготовка индивидуального исследовательского проекта по анализу данных в R. Для получения аттестации студент должен продемонстрировать все навыки работы в программе: подготовка данных (импорт, чистка, фильтрация), первичная статистическая обработка и одномерная визуализация, проверка статистических гипотез на основе двух переменных, построение комплексных статистических моделей. |