| Закреплена за кафедрой | Кафедра социальной и молодежной политики |
|---|---|
| Направление подготовки | 39.04.01. Социология |
| Профиль | Цифровые методы анализа и визуализации данных в социальных исследованиях |
| Форма обучения | Очная |
| Общая трудоемкость | 3 ЗЕТ |
| Учебный план | 39_04_01_Социология_ЦМА-2025 |
|
|
||||||||||||||||
Распределение часов по семестрам
| Курс (семестр) | 2 (4) | Итого | ||
|---|---|---|---|---|
| Недель | 11 | |||
| Вид занятий | УП | РПД | УП | РПД |
| Лекции | 12 | 24 | 12 | 24 |
| Лабораторные | 20 | 40 | 20 | 40 |
| Сам. работа | 27 | 69 | 27 | 69 |
| Консультации | 22 | 56 | 22 | 56 |
| Часы на контроль | 27 | 27 | 27 | 27 |
| Итого | 108 | 216 | 108 | 216 |
| 1.1. | Целями освоения курса «Анализ социальных сетей и Big Data» является получение знаний, умений и навыков применения метода анализа социальных сетей (social network analysis) для исследования сетей различной природы, в том числе сетей большой размерности. Дополнительной целью является знакомство с big data как подходом к управлению данных большого объема и многообразия, его применения в области социальных наук. |
|---|
| Цикл (раздел) ООП: Б1.В.ДВ.01.02 |
| ПК-2 | Способен применять технологии искусственного интеллекта, методы машинного обучения и интеллектуального анализа данных для решения фундаментальных и прикладных исследовательских задач |
| ПК-2.1 | Знает методы и технологии искусственного интеллекта, интеллектуального и сетевого анализа данных, алгоритмы машинного обучения, возможности их применения для решения задач фундаментальных и прикладных социологических исследований; |
| ПК-2.2 | Умеет применять языки программирования для предобработки, анализа, разработки моделей машинного обучения, интеллектуального, сетевого анализа, визуализации результатов фундаментальных и прикладных социологических исследований; |
| ПК-2.3 | Владеет навыками работы с технологиями искусственного интеллекта, разработки моделей машинного обучения, сетевого анализа, оценки качества моделирования для изучения социальных явлений и процессов, обоснования возможностей их практического применения для решения социальных проблем. |
| ПК-3 | Способен разрабатывать и осуществлять социологические и маркетинговые проекты для органов власти, бизнеса и некоммерческого сектора с помощью цифровых методов анализа. |
| ПК-3.1 | Знает теоретические основы разработки программной и методической документации, методы и технологии осуществления социологических и маркетинговых проектов, основывающиеся на применении современных цифровых технологий; |
| ПК-3.2 | Умеет разрабатывать проектные предложения по проведению социологических и маркетинговых исследований с учетом потребностей общества, коммерческой сферы; |
| ПК-3.3 | Владеет навыками разработки и реализации социологических и маркетинговых проектов, представления и распространения результатов исследовательской проектной деятельности с использованием цифровых аналитических инструментов для решения прикладных задач, стоящих перед государством, обществом и бизнесом. |
| В результате освоения дисциплины обучающийся должен | |
| 3.1. | Знать: |
|---|---|
| 3.1.1. | Знает основные этапы и способы разработки и распространения результатов проектной деятельности по изучения общественного мнения |
| 3.2. | Уметь: |
| 3.2.1. | Анализирует проблемы развития социальных явлений и процессов с использованием статистических процедур для обработки социологических данных Предлагает описательные, объяснительные и прогнозные модели социальных явлений и процессов на основе социологических теорий |
| 3.3. | Иметь навыки и (или) опыт деятельности (владеть): |
| 3.3.1. | Владеет методами разработки и распространения результатов проектов по изучению общественного мнения с помощью цифровых методов анализа |
| Код занятия | Наименование разделов и тем | Вид занятия | Семестр | Часов | Компетенции | Литература |
|---|---|---|---|---|---|---|
| Раздел 1. Концептуальные основы анализа социальных сетей и больших данных | ||||||
| 1.1. | Сетевые подходы в социологии. Основные теории и их взаимосвязь в решении практических задач | Лекции | 4 | 2 | Л1.1 | |
| 1.2. | Изучение теорий социального капитала, социального обмена, антропологических подходов, теорий сетевого общества | Лабораторные | 4 | 4 | Л1.1 | |
| 1.3. | Знакомство с банками и наборами данных для сетевых исследований. Введние в Python, Gefi, Pajek. Обзор возможностей Университетского консорциума исследователей больших данных. | Лабораторные | 4 | 4 | Л1.1 | |
| 1.4. | Введение в теорию графов. Основные понятия и определения | Лекции | 4 | 4 | Л1.1 | |
| 1.5. | Связность сети (network connectivity) | Лекции | 4 | 2 | Л2.1, Л1.1 | |
| 1.6. | Связность сети (network connectivity) | Лабораторные | 4 | 2 | Л2.1, Л1.1 | |
| 1.7. | Виды центральности сети (centrality) и способы их измерения. | Лекции | 4 | 2 | Л2.1, Л1.1 | |
| 1.8. | Виды центральности сети (centrality) и способы их измерения | Лабораторные | 4 | 4 | Л2.1, Л1.1 | |
| 1.9. | Алгоритмы PageRank и HITS | Лабораторные | 4 | 2 | Л2.1, Л1.1 | |
| 1.10. | Сетевой анализ персональных сетей, стратификации и сегрегации, организаций и публичных сообществ. Большие данные в социальных исследованиях. | Лекции | 4 | 2 | Л2.1, Л1.1 | |
| 1.11. | Анализ модулярности и выделение сообществ в социальных сетях | Лабораторные | 4 | 4 | Л2.1, Л1.1 | |
| 1.12. | Анализ примеров использования сетевой методологии в социальных исследованиях межпоколенных отношений, частных трансферов, межгрупповых отношений, профессиональных сообществ, публичных коммуникаций. | Сам. работа | 4 | 20 | Л2.1, Л1.1 | |
| 1.13. | Подготовка исследовательского проекта: обоснования целей и задач, подбор источников, сбор исходных данных. | Сам. работа | 4 | 22 | Л2.1, Л1.1, Л1.2 | |
| 1.14. | Консультации по подготовке исследовательского проекта | Консультации | 4 | 34 | Л2.1, Л1.1 | |
| Раздел 2. Анализ больших данных в социологических исследованиях | ||||||
| 2.1. | Введение в большие данные: основы методологии, принципы и алгоритмы | Лекции | 4 | 2 | Л1.1 | |
| 2.2. | Большие данные в Google Colab. становка PYSPARK и подключение к KAGGLE | Лабораторные | 4 | 2 | Л1.1 | |
| 2.3. | Большие данные и модели сетей реального мира | Лекции | 4 | 2 | Л1.1 | |
| 2.4. | Большие данные и модели сетей реального мира | Лабораторные | 4 | 4 | Л1.1 | |
| 2.5. | Основы анализа больших данных со Spark и Hadoop в Google Colab | Лекции | 4 | 4 | Л1.1 | |
| 2.6. | Основы анализа больших данных со Spark и Hadoop в Google Colab | Лабораторные | 4 | 4 | Л1.1 | |
| 2.7. | Основы анализа больших данных на основе методологии TenzorFlow и Keras | Лекции | 4 | 2 | Л1.1 | |
| 2.8. | Основы анализа больших данных на основе методологии TenzorFlow и Keras | Лабораторные | 4 | 4 | Л1.1 | |
| 2.9. | Обработка естественного языка и сентиментный анализ с помощью Keras и Python | Лекции | 4 | 2 | Л1.1 | |
| 2.10. | Обработка естественного языка и сентиментный анализ с помощью Keras и Python | Лабораторные | 4 | 6 | Л1.1 | |
| 2.11. | Подготовка самостоятельного исследовательского проекта на основе методологии и технологий анализа больших данных | Сам. работа | 4 | 27 | Л2.1, Л1.1, Л1.2 | |
| 2.12. | Консультация по подготовке исследовательского проекта | Консультации | 4 | 22 | Л1.1 | |
| 5.1. Контрольные вопросы и задания для проведения текущего контроля и промежуточной аттестации по итогам освоения дисциплины |
| Оценочные материалы для текущего контроля по разделам и темам дисциплины в полном объеме размещены в онлайн-курсе на образовательном портале «Цифровой университет АлтГУ» – https://portal.edu.asu.ru/course/view.php?id=6646. ОЦЕНКА СФОРМИРОВАННОСТИ КОМПЕТЕНЦИИ ОПК-3 Способен прогнозировать социальные явления и процессы, выявлять социально значимые проблемы и вырабатывать пути их решения на основе использования научных теорий, концепций, подходов и социальных технологий Примеры заданий закрытого типа 1. В рамках какой науки были проведены пионерные сетевые исследования? a. Антропология b. Социология c. Демография d. Культурология Ответ: a 2. Какая научная школа провела первые полевые исследования сетей социальных общин в Африке, Индии и Великобритании? a. Чикагская b. Манчестерская c. Франкфуртская Ответ: b 3. Автором социометрического подхода, используемого для анализа межличностных отношений и структуры неформальных групп, является: a. Э. Дюркгейм b. Г. Зиммель c. О. Конт d. Дж. Морено 4. Концепция американского социолога Марка Грановеттера, согласно которой в межличностной коммуникации большое значение имеют связи с людьми, не входящими в ближайший круг, а являющимися дальними знакомыми, бывшими коллегами и пр.: a. Социального капитала b. Структурных дыр c. Слабых связей d. Сетевых мостов Ответ: c 5. Назовите ключевые характеристики связей, создающих сеть: a. дискретность b. подобие c. близость d. взаимность e. частота f. интенсивность Ответ: abcd 6. Выберите правильные утверждения, описывающие сети различного типа: a. Ненаправленный граф - хороший способ описать асимметричные отношения между узлами. b. Связи между объектами сети называются вершинами. c. Когда между узлами имеются отношения противоположной модальности, знаковый граф – это хороший способ представления такой сети. d. Взвешенные сети (графы) используются для описания сетей с неравноценными отношениями между узлами (объектами). Ответ: cd 7. Сеть, в которой есть параллельные связи (то есть пара узлов связана несколькими типами конкурентных отношений), называется ________ a. Знаковая сеть b. Взвешенная сеть c. Мультиграф d. Направленная сеть Ответ: c 8. Выберите правильные утверждения, описывающие графы (сети) a. Запрос атрибутов узла или связи в NetworkX предоставляет собой то же самое, что и запрос значений в словаре Python. b. Представим, что G это граф, а A, B - два его узла. Запуск кода G.edge[‘A’][‘B’] иG.edge[‘B’][‘A’] приведет к одним и тем же результатам для различных типов сетей. c. Предположим, что мы создали nx.Graph() граф G с какими-то узлами и связями. The statement G.nodes(data=True) вернет список кортежей (tuples). d. Связи могут иметь несколько атрибутов или наименований. Ответ: acd 9. Какие утверждения верно описывают устойчивость и связность сети? Выберите все, что подходит. a. Добавление связей в сеть всегда делает ее более устойчивой. b. Устойчивость сети показывает ее способность поддерживать коннективность. c. Закрытие автобусного маршрута или отмена рейса являются примерами различных видов атак на социальные сети в современном мире. d. Добавление связей не может ухудшить связность сети. e. Сеть, которая имеет высокий средний коэффициент локальной кластеризации всегда имеет большую связность. Ответ: acde 10. Выберите все верные утверждения: a. Центральность по близости узла описывает насколько далеко узел находится по отношению к другим узлам сети. b. Мы можем использовать наборы узлов, чтобы примерно оценить центральность по посредничеству в больших сетях. c. Главная идея центральности по степени состоит в том, что важные узлы имеют большее количество связей. d. В направленных сетях центральность по входящим и исходящим связям всегда одинакова. e. Узел с наибольшим значением центральности по посредничеству имеет и самую высокую центральность по близости. Ответ: abс 11. Выберите все верные утверждения о применении алгоритмов Page Rank (PR) и HITS в направленных сетях: a. Добавление входящих связей никогда не приводит к ухудшению PR. b. Узлы, имеющие исходящие связи к хорошим хабам, являются авторитетными источниками, и узлы, имеющие входящие связи от авторитетных источников, являются хорошими хабами. c. Узлы с высокой степенью входящих связей (in-degree) имеют более высокий PR, чем узлы с низкой степенью входящих связей. d. Добавление исходящих связей к узлу всегда приводит к снижению его PR. e. Значение авторитетности (authority score) и концентрации (hub score) каждого узла получается путем многочисленного повторения алгоритма HITS до сходимости обоих значений. Ответ: ae 12. Выберите правильные утверждения о степенном законе и модели предпочтительного присоединения: a. Сети со степенным законом распределения имеют множество узлов с большим количеством степеней и небольшое количество узлов с маленькой степенью. b. Если мы представим степенное распределение на двойной логарифмической шкале (log-log), то его график будет выглядеть как прямая линия. c. Модель предпочтительного присоединения позволяет сгенерировать сеть со степенным законом распределения степеней узла. d. В модели предпочтительного присоединения, новый узел всегда присоединяется к узлу с наибольшей входной степенью. Ответ: bc 13. Отметьте правильные утверждения: a. Некоторые модели «малого мира» имеют высокий коэффициент кластеризации и маленькие значения кратчайших путей. b. Модель предпочтительного присоединения генерирует социальную сеть "малого мира". c. В моделях "малого мира" с k ближайшими соседями, увеличение увеличение вероятности переключения (rewiring) p обычно приводит к уменьшению как среднего коэффициента кластеризации так и средних кратчайших расстояний между узлами. d. Сети типа "малого мира" всегда являются связными. e. Распределение степеней узлов в моделях "малого мира" согласуется со степенным законом (power-law distribution). Ответ: ac 14. Предположим, мы хотим смоделировать несколько сетей типа "малого мира" с k ближайшими соседями и вероятностью переключения связей p. Если значение p останется тем же и мы увеличим число k, что будет лучшим образом описывать изменение среднего коэффициента кластеризации и среднего кратчайшего пути сети? a. Средний коэффициент кластеризации будет уменьшаться, а среднее расстояние - увеличиваться. b. Оба показателя будут увеличиваться. c. Коэффициент кластеризации будет увеличиваться, а среднее расстояние между узлами будет уменьшаться. d. Оба показателя будут уменьшаться. Ответ: с 16. Каковы преимущества сетевого анализа? a. Множество сложных структур могут быть смоделированы как социальные сети b. Это современное и востребованное направление исследований c. Изучая структуру социальных сетей, мы можем лучше понимать многие социальные явления, управлять ими, прогнозировать их d. Компьютерные приложения могут обрабатывать информацию об очень больших социальных сетях, что позволяет проводить действительно комплексный анализ и получать значимые результаты e. Методы статистического анализа социальных сетей значительно превосходят обычные статистические методы по мощности и доказательности Ответ: acd Открытые вопросы 1. Дайте базовое определение сети. Ответ: Это совокупность каких-то объектов (узлы, nodes), связанных друг с другом (связи, edges). 2. Что представляет собой социальная сеть? Ответ: Это объединение социальных позиций — социальных акторов и их связей (социальных взаимодействий) по поводу обмена ресурсами (информацией, финансами, отношениями и т. д.). 3. Приведите 3-4 примера социальных сетей. Ответ: сети друзей, социальная сеть некоммерческих организаций, социальные сети научных коллективов и ученых, сети мигрантов. 4. Приведите примеры возможного применения сетевого анализа. Ответ: Анализ авторитетности и распространение слухов в организации, анализ неформальных структур в коллективе, анализ политических коммуникаций и распределение голосов избирателей, анализ и прогнозирование поведения пользователей в социальных сетях, анализ общественного мнения по постам в социальных сетях, анализ сетей цитирования ученых. 5. Что представляет собой анализ социальных сетей? Ответ: Анализ социальных сетей – междисциплинарный подход, совокупность теорий, объясняющих паттерны, существующие в данных структурах и методов анализа структур различных социальных образований (общество, организация, коллектив и пр.). 6. Математической теорией сетевого анализа выступает __________. Ответ: теория графов. 7. Разрыв между двумя людьми или другими акторами сети, обладающими важными ресурсами, называется ________________ Ответ: структурная дыра. 8. Число прямых связей, включенных в индивидуальные объединения. Данный показатель используется при измерениях величины популяций и иногда определяется как общее количество узлов сети. Ответ: размер сети 9. Доля возможных связей в сети, представленная в реальных взаимодействиях, или соотношение между реальными и всеми возможными связями в сети. Ответ: Плотность сети 10. Какими могут быть связи в социальной сети? Приведите 2-3 типологии. Ответ: направленные (есть направление связи между акторами), ненаправленные (важно только наличие связи между акторами), маркированные (означенными) (когда фиксируются положительные, отрицательные и нейтральные выборы), оценочные (измеряется интенсивность связи между акторами через частоту контактов, денежный торговый оборот между странами и др.). 11. Тенденция для людей, имеющих общие связи в социальной сети, становиться связанными, называется ___________________ Ответ: триадическое замыкание 12. Как рассчитывается локальный коэффициент кластеризации? Ответ: Локальный коэффициент кластеризации узла рассчитывается как число связей межу соседями данного узла деленное на возможное число связей между соседями. 13. Характеристика сети, показывающая степень взаимодействия между собой ближайших вершин графа. Ответ: Транзитивность 14. Последовательность соединенных друг с другом узлов. Ответ: Путь 15. Чему равно расстояние между двумя узлами? Ответ: Расстоянием между двумя узлами принято считать длину самого короткого пути между ними 16. Максимальное расстояние между узлом n и всеми другими узлами. Ответ: Эксцентриситет узла 17. Радиус сети – это __________________. Ответ: Ее минимальный эксцентриситет 18. Что называется компонентой связности в сети? Ответ: это совокупность узлов, обладающая свойствами: 1. Каждый узел в наборе связан с каждым другим узлом. 2. Никакой другой узел не имеет связи с каким-либо узлом этого набора 19. Что позволяют определить меры центральности в сети? Приведите конкретные примеры. Ответ: Меры центральности могут помочь определить наиболее влиятельных (авторитетных) лиц, лидеров социальной сети, ключевых информаторов, распространяющих информацию в сети, наиболее значимые транспортные узлы, наиболее важные страницы в сети Интернет (которые читают, на которые ссылаются), узлы, которые удерживают сеть в стабильном состоянии, не позволяют ей распасться, позволяют выявить роль косвенных связей (скрытых участников, непредсказуемых явлений), влияние групп на отдельные узлы 20. Сеть, в которой типичное расстояние между двумя случайно выбранными узлами возрастает пропорционально логрифку количества узлов в сети и в описании которой ставится акцент на наличии большого количества коротких путей в социальных связей, связывающих удаленные узлы сети. Ответ: сеть «малого мира» или модель «малого мира» или сеть «мир тесен». ОЦЕНКА СФОРМИРОВАННОСТИ КОМПЕТЕНЦИИ ПК-3 Способен разрабатывать проекты по изучению общественного мнения с помощью цифровых методов анализа 1. Термин «большие данные» появился и получил распространение: a. В 2000-х b. В 1990-х c. В 1980-х Ответ: a 2. Какие типы могут быть отнесены к «большим данным»? a. Только структурированные. b. Полуструктурированные или слабоструктурированные данные – c. Неструктурированные данные d. Данные всех видов Ответ: d 3. Из каких компонентов состоит структура архитектуры для обработки больших данных? a. Источники данных (Data Source) b. Хранилище данных (Data Storage) c. Пакетная обработка (Batch Processing) d. Прием сообщений в реальном времени (Real-time message ingestion) e. Потоковая обработка (Stream processing) f. Хранилище аналитических данных (Analytical data store) g. Анализ и создание отчетов (Analytics and reporting) h. Оркестрация (Orchestration) Ответ: abcdefgh 4. Какой тип больших данных содержит наиболее значимую информацию о объекте анализа и происходящих в нем процессах (бизнес, управленческих, социальных и др.)? a. Транзакционные данные (Transactional Data, Application Specific Data, Operational Data) –Ретроспективные данные (Historical data) b. Ссылочные данные (Reference Data, Lookup Data, Dictionaries) c. Мастер-данные (Master Data) d. Логистические (Logistic Data) e. Операционные данные (Operational Data) Ответ: c 5. Для какой архитектуры Biс Data систем характерно меньшее потребление ресурсов и соответствие задачам обработки данных в режиме реального времени? a. Лямбда-архитектура b. Каппа-архитектура Ответ: b 6. Какие технологии используются для обработки и анализа больших данных? a. Hadoop b. SAS c. Spark d. NoSQL e. Kafka f. SPSS Ответ: acde 7. Фреймворк для распределенной обработки и хранения больших объемов данных, позволяющий обрабатывать данные параллельно на кластере компьютеров. a. Hadoop b. PostgreSQL c. MapReduce d. Spark Ответ: a 8. Что представляет собой MapReduce в контексте анализа больших данных? a. MapReduce является алгоритмом для предсказания поведения пользователей. b. MapReduce - метод агрегации данных и распределенной обработки, позволяющий обрабатывать большие объемы данных. c. MapReduce это стандартный протокол связи между различными системами обработки данных. Ответ: b 9. Каков принцип действия MapReduce в распределенной обработке и анализе больших данных? a. MapReduce использует иерархическую модель для сохранения данных и обеспечения высокой производительности. b. MapReduce использует линейную модель для сжатия и шифрования данных во время обработки. c. MapReduce предоставляет графический интерфейс для взаимодействия с данными и выполнения анализа. d. MapReduce разделяет данные на фрагменты для параллельной обработки и объединяет результаты в конечный вывод. Ответ: a 10. Для каких сценариев используется архитектура обработки больших: a. хранение и обработка данных в объемах, слишком больших для традиционной базы данных. b. резервное копирование структурированных данных для анализа и отчетности c. преобразование неструктурированных данных для анализа и создания отчетов; d. запись, обработка и анализ непривязанных потоков данных в режиме реального времени или с низкой задержкой; Ответ: acd 11. Какой режим организации параллельных вычислений используется для параллельной обработки данных, при которой используется несколько обрабатывающих устройств, достаточно удаленных друг от друга? a. многозадачный режим b. параллельное выполнение c. распределенные вычисления Ответ: c 12. Какой источник сбора и хранения больших данных представляет собой хранилище, где хранятся все необработанные данные в исходном формате без преобразования, а каждый элемент обозначен уникальным идентификатором и набором тегов метаданных? a. Data warehouse b. Data lake c. Нереляционные СУБД Ответ: b 13. Какой из классов методов анализа социальных сетей и общественного мнения в парадигме «больших данных» позволяет выявить лидеров мнений, осуществлять управление медиа-кампанией, оценивать отношение пользователей к той или иной информации. a. Анализ инфопотоков, структуры и метрик социальной сети b. Анализ тональности сообщений c. Анализ и извлечение тем d. Анализ изображений Ответ: a 14. Какая модель распространения информации в больших социальных сетях делит всех участников сети на три группы: группа, которая начинает распространение слуха, группа, которая после получения слуха продолжает распространять его, группа, которая после получения слуха принимает решение не распространять его. a. Детерминированная модель эпидемии SIR b. Модель Далея-Кендалла c. Модель клеточного автомата Ответ: b 15. Явление в социальных сетях, заключающееся в образовании групп людей со схожим мнением, а также предрасположенность коммуницировать с представителями одних гендерных, национальных, возрастных и пр. групп, называется: a. Эхо-камера b. Ассортативное смешивание c. Триадическое замыкание d. Вирусная активация Ответ: b Открытые вопросы 1. Что такое концепция больших данных и каковы возможности ее социологического применения? Ответ: Концепция больших данных относится к обработке и анализу больших объемов данных с целью выявления паттернов, тенденций и важной информации в обществе, анализа социальных закономерностей, объяснения и предсказания развития социальных процессов, оценки функционирования социальных институтов, описания актуального состояния и изменения структуры общества. 2. Какие компоненты входят в 3V, определяющих концепцию «больших данных»? Ответ: Volume — большой объем данных, Velocity — скорость накопления и обработки массивов данных. Variety — разнообразие типов данных. Данные могут быть структурированными, неструктурированными или структурированными частично. 3. Базовый принцип обработки больших данных, обеспечивающий обработку данных, распределённых на большое количество вычислительных узлов, без деградации производительности _________________ Ответ: горизонтальная масштабируемость 4. Каковы основные этапы работы с большими данными в анализе социальных явлений и процессов? Ответ: Основными этапами работы с большими данными являются сбор, хранение, обработка, анализ и визуализация данных. 5. Какие источники больших данных можно использовать для анализа общественного мнения? Ответ: Источники данных включать социальные сети, платформы онлайн-общения, государственные базы данных, платформы для онлайн-опросов, сенсорные устройства и многие другие. 6. Какие методы и инструменты используются для анализа больших данных в рамках социологической перспективы? Ответ: Для анализа больших данных в контексте социальных процессов используются методы машинного обучения, статистические модели, алгоритмы кластеризации и визуализации данных. 7. Какие ограничения существуют при работе с большими данными в анализе социальных явлений и общественного мнения? Ответ: Ограничения работы с большими данными могут включать проблемы конфиденциальности данных, недостаточную точность и неполноту данных, а также сложность интерпретации результатов. 8. Какие преимущества и вызовы связаны с использованием машинного обучения и искусственного интеллекта при анализе больших данных в социальных процессах? Ответ: Преимущества использования машинного обучения и искусственного интеллекта при анализе больших данных в социальных процессах включают более точные и быстрые прогнозы, автоматизацию анализа и обнаружение сложных связей в данных. Однако вызовы включают сложность интерпретации результатов и потенциальные ошибки в решениях, принятых искусственным интеллектом. 9. Как большие данные могут помочь в планировании и оптимизации социальных программ и политик? Ответ: Большие данные могут помочь в планировании и оптимизации социальных программ и политик, путем выявления эффективных стратегий и стимулирования положительных изменений. Возможными направлениями исследования могут выступать: 1. Анализ общественного мнения. 2. Прогнозирование и предсказание: Анализ больших данных позволяет выявить скрытые паттерны и тенденции, которые могут быть использованы для прогнозирования социальных явлений. 3. Географический анализ: Большие данные о местоположении и географических характеристиках людей и объектов помогают определить социальные проблемы и потребности в различных географических областях. 4. Оценка эффективности: Большие данные позволяют проводить более точную оценку эффективности социальных программ и политик. Например, на основе данных о показателях здоровья и социального благополучия можно определить, какие программы действительно помогают улучшить ситуацию в определенных группах или регионах. 5. Анализ данных о поведении: Собранные данные о поведении людей, такие как покупки, потребление контента, социальная активность и путешествия, могут быть использованы для анализа предпочтений и поведения различных групп населения в контексте реализуемой политики. В целом, использование больших данных в планировании и оптимизации социальных программ и политик позволяет принять более точные и обоснованные решения, что приводит к более успешным и устойчивым результатам для общества. 10. Какие этические вопросы возникают при использовании больших данных для анализа социальных процессов и каковы возможные пути их решения? Ответ: Этические вопросы при использовании больших данных для анализа социальных процессов включают защиту конфиденциальности данных, предотвращение дискриминации и справедливое использование данных. 11. Как можно адаптировать методы анализа больших данных в социальных процессах для учета географического и культурного контекста? Ответ: Для учета географического и культурного контекста в анализе больших данных в социальных процессах могут использоваться географические информационные системы (ГИС) и комплексный подход к анализу данных. 12. Какие примеры успешного использования больших данных в анализе социальных процессов можно назвать? Ответ: Примерами успешного использования больших данных в анализе социальных процессов могут быть изучение влияния социальных медиа на общественное мнение, предсказание социальных трендов и выявление социальных неравенств. 13. Как можно использовать анализ больших данных для определения лучших стратегий и подходов к социальному взаимодействию и коммуникации? Ответ: Анализ больших данных может быть использован для определения лучших стратегий и подходов к социальному взаимодействию и коммуникации через выявление предпочтений и поведенческих паттернов в данных. 14. Какие вызовы и возможности связаны с использованием больших данных для предсказания и реагирования на социальные кризисы и чрезвычайные ситуации? Ответ: Большие данные могут помочь предсказать и реагировать на социальные кризисы и чрезвычайные ситуации путем обнаружения аномалий и выявления рисковых показателей. 15. Какую роль играет анализ больших данных в выявлении и анализе социальных неравенств. Ответ: В качестве примеров успешного использования больших данных в этой области можно привести следующие: 1. Анализ данных о доходах и расходах населения: Большие данные о зарплатах и доходах людей могут помочь выявить социальные неравенства в оплате труда и доходах населения. Анализ данных по различным факторам, таким как пол, возраст, образование и местоположение, может позволить определить существующие различия и их влияние на социальное неравенство. 2. Исследование доступности социальных услуг и ресурсов: С использованием больших данных можно проанализировать доступность и распределение услуг здравоохранения, образования, жилья и других важных ресурсов. Если данные указывают на неравномерное распределение этих ресурсов, можно разработать меры для сокращения социального неравенства и улучшения доступности. 3. Анализ мобильности и транспорта: Использование больших данных о перемещениях и транспортных сетях позволяет исследовать мобильность населения и выявить социальные неравенства в доступности транспорта и возможностях перемещения. Это может помочь в оптимизации сетей общественного транспорта и создании более равных возможностей для всех групп населения. 4. Мониторинг социальных медиа: Использование больших данных из социальных медиа позволяет исследовать социальные неравенства и неравномерности в общественном мнении, предпочтениях и отношениях. Анализ публичных обсуждений и реакций на различные события может раскрыть неравенства в отношении тем, испытываемых различными группами населения. 5. Исследование использования общественного пространства: Анализ больших данных о пользовании и использовании общественных пространств, таких как парки, площади и другие общественные места, может помочь выявить социальные неравенства в доступе к ним. Это может быть полезно при планировании городской инфраструктуры и создании равных возможностей для всех групп населения. Все эти примеры показывают, что анализ больших данных может быть мощным инструментом для выявления социальных неравенств, что затем позволяет принимать меры по их устранению и созданию более справедливого и инклюзивного общества. 16. Каковы основные этапы развития и истории исследования больших данных? Ответ: В конце 1980-х и начале 1990-х годов фокус был на разработке и применении методов хранения, управления и обработки больших объемов данных. В 2000-х годах появилась необходимость в анализе и извлечении информации из больших объемов данных, что привело к развитию методов и алгоритмов анализа данных. С 2010-х годов развитие машинного обучения и искусственного интеллекта привело к новым возможностям обработки и анализа больших данных. 17. Какие исторические события и технологические прорывы способствовали развитию исследования больших данных? Ответ: В развитии изучения и использования больших данных важную роль сыграли события и технологические прорывы, такие как: - Появление интернета и онлайн-платформ, что привело к большому количеству новых источников данных. - Развитие вычислительной мощности, включая распределенные вычисления и облачные вычисления, позволяющие эффективно обрабатывать и анализировать большие объемы данных. - Развитие алгоритмов машинного обучения, которые стали основой для анализа больших данных и выявления паттернов и зависимостей. 18. Как изменилось восприятие и понимание больших данных со временем? Ответ: Восприятие и понимание больших данных с течением времени изменилось. Если раньше большие данные воспринимались как проблема из-за их больших объемов и сложности обработки, то сейчас они рассматриваются как ценный ресурс, который можно использовать для принятия важных решений и выявления новых знаний. 19. Как критическая социологическая мысль отреагировала на появление «больших данных». Приведите примеры негативных оценок. Ответ: Критическими замечаниями в адрес Big Data являются следующие: большие данные переоценены, их ценность преувеличена, люди дезинформированы средствами массовой информации, поскольку данные «не могут говорить сами». Дана Бойд выражает скептичность относительно объема данных (много данных не всегда хорошо), другие исследователи выражают обеспокоенность относительно будущего социологических теорий и концепций, их замены алгоритмами и готовыми решениями. Создается неверное впечатление, что большие данные могут заменить традиционные методы исследования, однако на самом деле речь идет о переоценке классических теорий и концепций, адаптации старых и разработки новых методов исследования, адекватных реалиям цифрового общества, совмещение традиционных и современных методов и предметов исследования. 20. Как анализ больших данных может помочь в выявлении и анализе сообществ в социальных сетях? Ответ: Анализ больших данных позволяет выявить группировку пользователей в сообщества, определить структуру и взаимосвязи между участниками сообщества, а также понять динамику внутренних и внешних взаимодействий в сообществе. КРИТЕРИИ ОЦЕНИВАНИЯ ЗАКРЫТЫХ ВОПРОСОВ: Каждое задание оценивается 1 баллом. • «зачтено» – верно выполнено более 50% заданий; «не зачтено» – верно выполнено 50% и менее 50% заданий; • «отлично» – верно выполнено 85-100% заданий; «хорошо» – верно выполнено 70-84% заданий; «удовлетворительно» – верно выполнено 51-69% заданий; «неудовлетворительно» – верно выполнено 50% или менее 50% заданий. КРИТЕРИИ ОЦЕНИВАНИЯ ОТКРЫТЫХ ВОПРОСОВ. «Отлично» (зачтено): Ответ полный, развернутый. Вопрос точно и исчерпывающе передан, терминология сохранена, студент превосходно владеет основной и дополнительной литературой, ошибок нет. «Хорошо» (зачтено): Ответ полный, хотя краток, терминологически правильный, нет существенных недочетов. Студент хорошо владеет пройденным программным материалом; владеет основной литературой, суждения правильны. «Удовлетворительно» (зачтено): Ответ неполный. В терминологии имеются недостатки. Студент владеет программным материалом, но имеются недочеты. Суждения фрагментарны. «Неудовлетворительно» (не зачтено): Не использована специальная терминология. Ответ в сущности неверен. Переданы лишь отдельные фрагменты соответствующего материала вопроса. Ответ не соответствует вопросу или вовсе не дан. |
| 5.2. Темы письменных работ для проведения текущего контроля (эссе, рефераты, курсовые работы и др.) |
| 1.Теории социального капитала и сетевой анализ 2.Теория сетевого общества М. Кастельса: теоретико-социологический анализ 3.Сила «слабых» связей и сетевые работы М. Грановеттера: перспективы и возможности для применения 4.Концепция «small world» в сетевом анализе 5.Социальная и пространственная этническая сегрегация: возможности сетевого анализа 6.Поведение, влияние друзей и социальное «заражение». 7.Структурные «дыры» в сетевой теории Р. Берта 8.Сетевой подход в экономическом анализе и экономической социологии 9.Сетевой анализ в менеджменте. Иерархии и сети внутри организаций. 10.Инновации, потоки знания. Сети и распространение инноваций. 11.Сети соавторства и со-цитирования. Сетевой подход в анализе науки. 12.Организация местных сообществ. Репутационные лидеры. Изучение местных элит сетевыми методами. 13.Политическое действие: партии, политики и сети. 14.Социальные движения и коллективное действие. 15.Сетевой анализ социальных медиа: возможности, алгоритмы, технологии. 16.Теория графов и сетевой анализ 17.Описательные статистики реальных сетей, модели формирования сети 18.Меры влияния агентов в сетях 19.Распространение информации и эпидемии в сетях 20.Принципы работы с большими данными в сетевом анализе |
| 5.3. Фонд оценочных средств для проведения промежуточной аттестации |
| Промежуточная аттестация заключается в проведении в конце третьего семестра зачета (для обучающихся, не получивших зачет по результатам текущей успеваемости) по всему изученному курсу, а в конце четвертого семестра - экзамена. Зачет проводится в формате онлайн тестирования. Тест размещен в разделе «Промежуточная аттестация по дисциплине» онлайн-курса на образовательном портале «Цифровой университет АлтГУ». Количество заданий в контрольно-измерительном материале (тесте) для промежуточной аттестации, составляет 30 вопросов. Экзамен проводится в устной форме по билетам. В билет входит 2 вопроса: 1 вопрос теоретического характера и 1 вопрос практико-ориентированного характера. Вопросы к экзамену 1. Понятие социальной сети 2. Основные метрики, применяемые для оценки сети: размер, ранг, плотность, радиус, диаметр, эксцентриситет 3. Меры оценки центральности социальных сетей 4. Связность сети. Компоненты связности 5. Основные понятия и положения теории социальных сетей. 6. Теоретический потенциал применения сетевых методов в социологии. 7. Теория графов: применение к сетевым измерениям. 8. Связь сетевых подходов в социологии с другими современными социологическими теориями. 9. Методологические принципы изучения социальных сетей. 10. Предпосылки и возникновение сетевых подходов в социологии. 11. Современные направления исследований социальных сетей. 12. Теории социального капитала и сетевой анализ 13. Теория сетевого общества М. Кастельса: теоретико-социологический анализ 14. Сила «слабых» связей и сетевые работы М. Грановеттера: перспективы и возможности для применения 15. Концепция «small world» в сетевом анализе 16. Структурные «дыры» в сетевой теории Р. Берта 17. Сетевой подход в экономическом анализе и экономической социологии 18. Сетевой анализ в менеджменте. Иерархии и сети внутри организаций. 19. Инновации, потоки знания. Сети и распространение инноваций. 20. Сети соавторства и со-цитирования. Сетевой подход в анализе науки. 21. Организация местных сообществ. Репутационные лидеры. Изучение местных элит сетевыми методами. 22. Сетевой анализ социальных медиа: возможности, алгоритмы, технологии. 23. Меры влияния агентов в сетях 24. Распространение информации и эпидемии в сетях 25. Специфика анализа социальных сетей. 26. Методы анализа социальных сетей. 27. Принципы моделирования социальных сетей. Основные модели. 28. Концепция больших данных в современном цифровом обществе 29. Технологии обработки и анализа больших данных: общий обзор 30. Принципы работы с большими данными в сетевом анализе КРИТЕРИИ ОЦЕНИВАНИЯ: «Отлично»: студентом дан полный, в логической последовательности развернутый ответ на поставленные вопросы, где он продемонстрировал знания предмета в полном объеме учебной программы, достаточно глубоко осмысливает дисциплину, самостоятельно, и исчерпывающе отвечает на дополнительные вопросы, приводит собственные примеры по проблематике поставленного вопроса, решил предложенные практические задания без ошибок. «Хорошо»: студентом дан развернутый ответ на поставленный вопрос, где студент демонстрирует знания, приобретенные на лекционных и семинарских занятиях, а также полученные посредством изучения обязательных учебных материалов по курсу, дает аргументированные ответы, приводит примеры, в ответе присутствует свободное владение монологической речью, логичность и последовательность ответа. Однако допускаются неточности в ответе. Решил предложенные практические задания с небольшими неточностями. «Удовлетворительно»: студентом дан ответ, свидетельствующий в основном о знании процессов изучаемой дисциплины, отличающийся недостаточной глубиной и полнотой раскрытия темы, знанием основных вопросов теории, слабо сформированными навыками анализа явлений, процессов, недостаточным умением давать аргументированные ответы и приводить примеры, недостаточно свободным владением монологической речью, логичностью и последовательностью ответа. Допускается несколько ошибок в содержании ответа и решении практических заданий. «Неудовлетворительно»: студентом дан ответ, который содержит ряд серьезных неточностей, обнаруживающий незнание процессов изучаемой предметной области, отличающийся неглубоким раскрытием темы, незнанием основных вопросов теории, неумением давать аргументированные ответы. Выводы поверхностны. Решение практических заданий не выполнено. Студент не способен ответить на вопросы даже при дополнительных наводящих вопросах преподавателя. |
| 6.1. Рекомендуемая литература | ||||
| 6.1.1. Основная литература | ||||
| Авторы | Заглавие | Издательство, год | Эл. адрес | |
| Л1.1 | Клековкин Г.А., Коннова Л.П., Коннов В.В. | ГЕОМЕТРИЧЕСКАЯ ТЕОРИЯ ГРАФОВ 2-е изд., испр. и доп. Учебное пособие для СПО: Гриф УМО СПО | М.:Издательство Юрайт, 2018 | biblio-online.ru |
| Л1.2 | Люк Д.А. | Анализ сетей (графов) в среде R. Руководство пользователя: | Издательство "ДМК Пресс", 2017 | e.lanbook.com |
| 6.1.2. Дополнительная литература | ||||
| Авторы | Заглавие | Издательство, год | Эл. адрес | |
| Л2.1 | Л. Рамальо | Python. К вершинам мастерства: | ДМК Пресс, 2016//ЭБС издательства «Лань» | e.lanbook.com |
| 6.2. Перечень ресурсов информационно-телекоммуникационной сети "Интернет" | ||||
| Название | Эл. адрес | |||
| Э1 | Курс "Анализ социальных сетей и Big Data" на образовательном портале АлтГУ | portal.edu.asu.ru | ||
| Э2 | Danneman N. Social Media Mining with R | pzs.dstu.dp.ua | ||
| Э3 | Zhang G. Social network analysis with R sna package | www.r-project.org | ||
| Э4 | Grandjean M. GEPHI – Introduction to Network Analysis and Visualization | www.martingrandjean.ch | ||
| Э5 | Градосельская Г. Сетевые измерения в социологии. М.: Издательский дом "Новый учебник", 2004. | ecsocman.hse.ru | ||
| Э6 | Buyya R., Calheiros R., Dastjerdi A. Big Data Principles and Paradigms. Elsevier, 2016. | dhoto.lecturer.pens.ac.id | ||
| Э7 | Майер-Шенбергер В., Кукьер К. Большие данные. Революция, которая изменит то, как мы живем, работаем и мыслим Манн, Иванов и Фербер, 2013. | www.mann-ivanov-ferber.ru | ||
| 6.3. Перечень программного обеспечения | ||||
| «Microsoft Office 2010 (Office 2010 Professional, № 4065231 от 08.12.2010), (бессрочно); Microsoft Windows 7 (Windows 7 Professional, № 61834699 от 22.04.2013), (бессрочно); Chrome (http://www.chromium.org/chromium-os/licenses ), (бессрочно); 7-Zip (http://www.7-zip.org/license.txt ), (бессрочно); AcrobatReader (http://wwwimages.adobe.com/content/dam/Adobe/en/legal/servicetou/Acrobat_com_Additional_TOU-en_US-20140618_1200.pdf), (бессрочно); ASTRA LINUX SPECIAL EDITION (https://astralinux.ru/products/astra-linux-special-edition/), (бессрочно); LibreOffice (https://ru.libreoffice.org/), (бессрочно); Веб-браузер Chromium (https://www.chromium.org/Home/), (бессрочно); Антивирус Касперский (https://www.kaspersky.ru/), (до 23 июня 2024); Архиватор Ark (https://apps.kde.org/ark/), (бессрочно); Okular (https://okular.kde.org/ru/download/), (бессрочно); Редактор изображений Gimp (https://www.gimp.org/), (бессрочно)». Jupyter Notebook Gephi 0.10 | ||||
| 6.4. Перечень информационных справочных систем | ||||
| Stanford Large Network Dataset Collection - https://snap.stanford.edu/data/ Pajek datasets - http://vlado.fmf.uni-lj.si/pub/networks/data/ UC Irvine Network Data Repository - http://networkdata.ics.uci.edu/index.html The Center for Complex Network Research (CCNR) - https://www.barabasilab.com/ | ||||
| Аудитория | Назначение | Оборудование |
|---|---|---|
| 415Д | специализированный компьютерный класс кафедры связей с общественностью и рекламы - компьютерный класс - учебная аудитория для проведения занятий семинарского типа (лабораторных и(или) практических); проведения групповых и индивидуальных консультаций, текущего контроля и промежуточной аттестации | Учебная мебель на 16 посадочных мест; рабочее место преподавателя; доска меловая 1шт.; системный блок: IntelCore 2 DuoE7400 -17 шт.; сервер: системный блок: AquariusIntelPentiumD; монитор: Acer V173 B -16 шт.; монитор: Acer V193W 1 шт.; телевизор Samsung |
| 410Д | лаборатория информационных технологий - компьютерный класс кафедры теории и практики журналистики - учебная аудитория для проведения занятий лекционного типа; занятий семинарского типа (лабораторных и(или) практических); проведения групповых и индивидуальных консультаций, текущего контроля и промежуточной аттестации | Учебная мебель на 24 посадочных места; рабочее место преподавателя; доска пластиковая - 1 шт.; компьютеры: марка Intel Core модель i3-2120 3,3 ГГц/DDR3 2 ГБ/500 ГБ/DVD RW/22» - 11 единиц; монитор: марка samsung модель 943T - 1 единица; мониторы: BenQ G950A/КМ/ - 10 шт.; бесперебойник: UPS IPPon Black Power Pro 500 - 12 шт.; телевизор: LCD 46" Samsung LE-46S81B |
| 511Д | лаборатория математического обеспечения социально-психологических исследований - учебная аудитория для проведения занятий лекционного типа; занятий семинарского типа (лабораторных и(или) практических); проведения групповых и индивидуальных консультаций, текущего контроля и промежуточной аттестации | Учебная мебель на 20 посадочных мест; рабочее место преподавателя; доска меловая 1 шт.; компьютеры: 10 единиц; мониторы: 10 единиц. |
| Помещение для самостоятельной работы | помещение для самостоятельной работы обучающихся | Компьютеры, ноутбуки с подключением к информационно-телекоммуникационной сети «Интернет», доступом в электронную информационно-образовательную среду АлтГУ |
| Учебная аудитория | для проведения занятий лекционного типа, занятий семинарского типа (лабораторных и(или) практических), групповых и индивидуальных консультаций, текущего контроля и промежуточной аттестации, курсового проектирования (выполнения курсовых работ), проведения практик | Стандартное оборудование (учебная мебель для обучающихся, рабочее место преподавателя, доска) |
| Для освоения курса «Анализ социальных сетей и Big Data» необходимо посещение 100% лекционных и лабораторных занятий и интенсивная самостоятельная работа, позволяющая погрузиться в процесс исследования социальных сетей. Требуется обязательное освоение навыков, связанных с работой в программах R, Python, Gefi, Pajek,которые демонстрируются в ходе реализации исследовательского проекта, его защиты. Для получения зачета студенты готовят научное эссе по теоретическим основам сетевого анализа и практический исследовательский проект. |