МИНОБРНАУКИ РОССИИ
федеральное государственное бюджетное образовательное учреждение высшего образования
«Алтайский государственный университет»

Методы анализа данных

рабочая программа дисциплины
Закреплена за кафедройКафедра экономики и эконометрики
Направление подготовки38.03.02. Менеджмент
ПрофильМаркетинг и цифровые коммуникации; Управление бизнесом
Форма обученияОчная
Общая трудоемкость6 ЗЕТ
Учебный план38_03_02_Менеджмент_Профили-2023
Часов по учебному плану 216
в том числе:
аудиторные занятия 84
самостоятельная работа 105
контроль 27
Виды контроля по семестрам
экзамены: 6
зачеты: 5

Распределение часов по семестрам

Курс (семестр) 3 (5) 3 (6) Итого
Недель 15,5 18
Вид занятий УПРПДУПРПДУПРПД
Лекции 16 16 16 16 32 32
Лабораторные 26 26 26 26 52 52
Сам. работа 66 66 39 39 105 105
Часы на контроль 0 0 27 27 27 27
Итого 108 108 108 108 216 216

Программу составил(и):
к.э.н., доцент, Кузнецова О.В.

Рецензент(ы):
к.э.н., доцент, Деркач Н.О.

Рабочая программа дисциплины
Методы анализа данных

разработана в соответствии с ФГОС:
Федеральный государственный образовательный стандарт высшего образования - бакалавриат по направлению подготовки 38.03.02 Менеджмент (приказ Минобрнауки России от 12.08.2020 г. № 970)

составлена на основании учебного плана:
38.03.02 Менеджмент
утвержденного учёным советом вуза от 26.06.2023 протокол № 4.

Рабочая программа одобрена на заседании кафедры
Кафедра экономики и эконометрики

Протокол от 07.06.2023 г. № 9
Срок действия программы: 2023-2027 уч. г.

Заведующий кафедрой
Шваков Е.Е.


Визирование РПД для исполнения в очередном учебном году

Рабочая программа пересмотрена, обсуждена и одобрена для
исполнения в 2023-2024 учебном году на заседании кафедры

Кафедра экономики и эконометрики

Протокол от 07.06.2023 г. № 9
Заведующий кафедрой Шваков Е.Е.


1. Цели освоения дисциплины

1.1.Изучение технологий анализа данных и подготовки данных

2. Место дисциплины в структуре ООП

Цикл (раздел) ООП: Б1.О.05

3. Компетенции обучающегося, формируемые в результате освоения дисциплины

ОПК-2Способен осуществлять сбор, обработку и анализ данных, необходимых для решения поставленных управленческих задач, с использованием современного инструментария и интеллектуальных информационно-аналитических систем;
ОПК-2.1 Знает основные приемы и методы сбора, обработки и анализа больших данных для решения экономических и управленческих задач, принятия мер регулирующего воздействия, современный инструментарий интеллектуальных информационно-аналитических систем
ОПК-2.2 Умеет выбирать математические модели организационных систем, анализировать их адекватность, проводить адаптацию выбранной модели к конкретным задачам управления
ОПК-2.3 Умеет проводить мониторинг технологических трендов и цифровых решений в своей деятельности, обрабатывать и анализировать данные для решения экономических задач, разработки и принятия управленческих решений, мер регулирующего воздействия, использовать современный инструментарий интеллектуальных информационно-аналитических систем
ОПК-2.4 Владеет приемами и методами сбора, обработки и анализа данных для решения экономических задач, разработки и принятия управленческих решений, мер регулирующеговоздействия
ОПК-2.5 Владеет навыками количественного и качественного анализа информации при принятии управленческих решений, построения экономических, финансовых и организационно-управленческих моделей путем их адаптации к конкретным задачам управления
В результате освоения дисциплины обучающийся должен
3.1.Знать:
3.1.1.
3.2.Уметь:
3.2.1.
3.3.Иметь навыки и (или) опыт деятельности (владеть):
3.3.1.

4. Структура и содержание дисциплины

Код занятия Наименование разделов и тем Вид занятия Семестр Часов Компетенции Литература
Раздел 1. Основы анализа данных
1.1. Методология построения моделей сложных систем Лекции 5 8 ОПК-2.1, ОПК-2.2, ОПК-2.3, ОПК-2.4, ОПК-2.5 Л2.2, Л1.1, Л2.1
1.2. Модель черного ящика Сам. работа 5 24 ОПК-2.1, ОПК-2.2, ОПК-2.3, ОПК-2.4, ОПК-2.5 Л2.2, Л1.1, Л2.1
1.3. Основы анализа данных Лабораторные 5 12 ОПК-2.1, ОПК-2.2, ОПК-2.3, ОПК-2.4, ОПК-2.5
1.4. Основные этапы моделирования. Методика анализа данных Лекции 5 8 ОПК-2.1, ОПК-2.2, ОПК-2.3, ОПК-2.4, ОПК-2.5 Л2.2, Л1.1, Л2.1
1.5. Основные этапы моделирования. Методика анализа данных Сам. работа 5 42 ОПК-2.1, ОПК-2.2, ОПК-2.3, ОПК-2.4, ОПК-2.5 Л2.2, Л1.1, Л2.1
1.6. Основные этапы моделирования. Методика анализа данных Лабораторные 5 14 ОПК-2.1, ОПК-2.2, ОПК-2.3, ОПК-2.4, ОПК-2.5
Раздел 2. Методы интеллектуального анализа данных
2.1. Определения OLAP, Data Mining, KDD и взаимосвязи между ними Лекции 6 4 ОПК-2.1, ОПК-2.2, ОПК-2.3, ОПК-2.4, ОПК-2.5 Л2.2, Л1.1, Л2.1
2.2. Определения OLAP, Data Mining, KDD и взаимосвязи между ними Сам. работа 6 28 ОПК-2.1, ОПК-2.2, ОПК-2.3, ОПК-2.4, ОПК-2.5 Л2.2, Л1.1, Л2.1
2.3. Типы задач, решаемые методами Data Mining: классификация, кластеризация, регрессия, ассоциация, поиск последовательных шаблонов Лекции 6 6 ОПК-2.1, ОПК-2.2, ОПК-2.3, ОПК-2.4, ОПК-2.5 Л2.2, Л1.1, Л2.1
2.4. Алгоритмы, получившие наибольшее распространение для каждого типа задач: самоорганизующиеся карты, деревья решений, линейная регрессия, нейронные сети, ассоциативные правила Лекции 6 6 ОПК-2.1, ОПК-2.2, ОПК-2.3, ОПК-2.4, ОПК-2.5 Л2.2, Л1.1, Л2.1
2.5. Построение аналитической отчетности Лабораторные 6 6 ОПК-2.1, ОПК-2.2, ОПК-2.3, ОПК-2.4, ОПК-2.5 Л2.2, Л1.1, Л2.1
2.6. Построение регрессионной прогнозной модели спроса. Лабораторные 6 6 ОПК-2.1, ОПК-2.2, ОПК-2.3, ОПК-2.4, ОПК-2.5 Л2.2, Л1.1, Л2.1
2.7. Построение скоринговой модели кредитования (деревья решений) Лабораторные 6 4 ОПК-2.1, ОПК-2.2, ОПК-2.3, ОПК-2.4, ОПК-2.5 Л2.2, Л1.1, Л2.1
2.8. Построение нейросетевой прогнозной модели спроса Лабораторные 6 4 ОПК-2.1, ОПК-2.2, ОПК-2.3, ОПК-2.4, ОПК-2.5 Л2.2, Л1.1, Л2.1
2.9. Подготовка данных и интерпретация результатов Сам. работа 6 11 ОПК-2.1, ОПК-2.2, ОПК-2.3, ОПК-2.4, ОПК-2.5 Л2.2, Л1.1, Л2.1
2.10. Построение сценария предобработки данных в программе Deductor Лабораторные 6 6 ОПК-2.1, ОПК-2.2, ОПК-2.3, ОПК-2.4, ОПК-2.5 Л2.2, Л1.1, Л2.1

5. Фонд оценочных средств

5.1. Контрольные вопросы и задания для проведения текущего контроля и промежуточной аттестации по итогам освоения дисциплины
ТЕСТОВЫЕ ВОПРОСЫ

В какой шкале представлен следующий признак?
Время решения задачи
Выберите один ответ:
a. номинативной
b. порядковой
c. отношений
d. интервальной

Для какой шкалы некорректно использование операции сложения?
Выберите один или несколько ответов:
a. порядковая шкала
b. шкала отношений
c. номинативная шкала
d. интервальная шкала

В какой шкале представлен следующий признак?
Телефонный номер
Выберите один ответ:
a. порядковой
b. интервальной
c. отношений
d. номинативной

Для какой шкалы корректно использование всех арифметических операций?
Выберите один или несколько ответов:
a. номинативная шкала
b. шкала отношений
c. интервальная шкала
d. порядковая шкала


Для какой шкалы некорректно использование операции сравнения?
Выберите один ответ:
a. номинативная шкала
b. порядковая шкала
c. шкала отношений
d. интервальная шкала

Для какой шкалы некорректно использование операции деления?
Выберите один или несколько ответов:
a. номинативная шкала
b. шкала отношений
c. порядковая шкала
d. интервальная шкала

В какой шкале представлен следующий признак?
Затраты на осуществление рекламной кампании (руб.)
Выберите один ответ:
a. порядковой
b. отношений
c. интервальной
d. номинативной

Какое понятие наиболее соответствует термину "измерение"?
Выберите один ответ:
a. объект
b. свойство
c. индикатор

В какой шкале представлен следующий признак?
Доход компании (руб.)
Выберите один ответ:
a. интервальной
b. номинативной
c. порядковой
d. отношений

Для какой шкалы корректно использование операции вычитания?
Выберите один или несколько ответов:
a. интервальная шкала
b. шкала отношений
c. порядковая шкала
d. номинативная шкала

В какой шкале представлен следующий признак? Регионы, в которых расположены офисы компании
Выберите один ответ:
a. интервальной
b. номинативной
c. отношений
d. порядковой

В какой шкале представлен следующий признак?
Профессиональный статус (должность) в анкете
Выберите один ответ:
a. отношений
b. интервальной
c. номинативной
d. порядковой

В какой шкале представлен следующий признак?
Образование (количество классов школы).
Выберите один ответ:
a. отношений
b. номинативной
c. порядковой
d. интервальной

В какой шкале присутствуют атрибуты упорядоченности и интервальности, но нет нулевой точки?
Выберите один ответ:
a. отношений
b. номинативной
c. порядковой
d. интервальной

В какой шкале представлен следующий признак?
Телефонный номер
Выберите один ответ:
a. отношений
b. номинативной
c. интервальной
d. порядковой

В какой шкале представлен следующий признак?
Доход компании (руб.)
Выберите один ответ:
a. интервальной
b. отношений
c. номинативной
d. порядковой

В какой шкале представлено "измерение" оценки за успеваемость (в баллах)?
Выберите один ответ:
a. интервальной
b. порядковой
c. номинативной
d. отношений

Разработана анкета из 20 пунктов. Случайным образом она разделена на 2 анкеты по 10 пунктов и предъявлена к опросу. Это пример оценки надежности измерений в смысле их
Выберите один ответ:
a. устойчивости
b. согласованности
c. эквивалентности

В какой шкале представлен следующий признак?
Количество сотрудников
Выберите один ответ:
a. номинативной
b. интервальной
c. порядковой
d. отношений



ПРИМЕРЫ ЗАДАЧ
(Полный список приведен в ЭУМК по курсу, размещенном на Едином образовательном портале АлтГУ (edu.asu.ru))




1. Вы собираетесь подготовить и издать книгу «100 лучших предприятий города N». Какие характеристики вы будете измерять и по какой шкале? Будете ли вы использовать какой-либо комплексный показатель? Обоснуйте свой ответ.



2. Студенты университета посещают клубы в среднем 3,3 раза в месяц. По результатам случайной выборки, состоящей из 97 студентов экономического факультета, показывает, что они посещают клубы в среднем 3,8 раза в месяц со стандартным отклонением 0,53. Можно ли сделать вывод, что студенты-экономисты отличаются от студентов университета в целом в пристрастиях к посещению клубов?
Если изменить вопрос исследования: «Посещают ли студенты-экономисты большее количество вечеринок, чем студенты университета в целом?», что изменится в процедуре проверки? Изменятся ли результаты?



3. Известно, что производительность труда в среднем по заводу составляет 50 деталей/час. Необходимо установить, отличается ли производительность труда рабочих определенной возрастной группы от этого значения.

Данные, полученные в ходе исследования, представлены в таблице.
Таблица. Данные выборочного исследования
№ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
xi 61 80 40 71 39 20 40 80 80 60 80 29 51 43 47
№ 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
xi 40 41 37 41 60 40 60 31 40 65 61 40 59 60 80



4. Известны результаты измерения производительности труда рабочих двух разных возрастных групп (табл.).
Таблица. Производительность труда в двух возрастных группах
№ Группа1 Группа2 № Группа1 Группа2 № Группа1 Группа2
1 59 61 11 56 80 21 58 40
2 56 80 12 37 29 22 71 60
3 85 40 13 56 51 23 31 31
4 92 71 14 42 43 24 42 40
5 48 39 15 49 47 25 34 65
6 59 20 16 70 40 26 51 61
7 42 40 17 30 41 27 70 40
8 87 80 18 58 37 28 42 59
9 42 80 19 79 41 29 67 60
10 73 60 20 84 60 30 56 80

Существует ли статистически значимое различие производительности труда рабочих в разных возрастных группах?

5. Известны данные по объемам продаж 10 американских компаний, случайно выбранных из списка Forbes Super 500 в 1998 и 1999 гг. (табл.).
Есть ли статистически значимые различия в объемах продаж ведущих компаний за год?
Таблица. Объемы продаж, млн. долл.
Компания Продажи в 1999 г. Продажи в 1998 г.
General Motors 126932 123505
General Electric 54574 49662
Exxon 86656 78944
IBM 62710 59512
Ford 96146 92300
AT&T 36112 35173
Mobil 50220 48111
DuPont 35099 32427
Sears 53794 49975
Amoco 23966 20779



6. Для выполнения упражнения по преобразованию данных предлагается выборка из данных по оценке организационного климата двух компаний (файл "Данные для выполнения заданий по теме 10").
Данные представлены в шкале Лайкерта.
Рассматривая каждый пункт анкеты в качестве индикатора, характеризующего организационный климат, на одном графике постройте и сравните профили организационного климата двух компаний (профиль климата – ломаная линия, состоящая из отрезков, соединяющих точки, координатами которой являются идентификационный номер измеряемого показателя (на оси абсцисс) и измеренное значение этого показателя (на оси ординат)). Использовать исходные данные в шкале Лайкерта.
Цель этого задания – освоение методики конвертирования данных, а не получение содержательного вывода по конкретному исследованию. Поэтому содержательный смысл вопросов (показателей) не приводится, а используются формальные обозначения показателей: «пункт1», «пункт2» и т.д. Рекомендуется выполнить задание в среде Excel с использованием функций СРЗНАЧ (вычисление среднего значения) и стандартных графических инструментов.


7. Конвертируйте исходные данные (файл "Данные для выполнения заданий по теме 10" в стандартную z-шкалу и Т-шкалу. По конвертированным данным постройте и сравните профили организационного климата двух компаний. Объясните сложность использования z-шкалы и Т-шкалы для данного случая.
Рекомендуется выполнить задание, используя стандартные функции Excel СРЗНАЧ и СТАНДОТКЛОН.


8. Конвертируйте исходные данные (файл "Данные для выполнения заданий по теме 10" в шкалу Раша с помощью программы Excel по алгоритму, представленному в эл. книге по теме. По конвертированным данным постройте и сравните профили организационного климата двух компаний.
При преобразовании данных полезным может оказаться использование функции СЧЕТЕСЛИ (диапазон поиска; значение) для расчета частот (количества респондентов, поставивших тот или иной балл).
Сравните с результатами выполнения Задания 1 по данной теме. Предложите возможные объяснения изменения результатов, сделайте выводы.
5.2. Темы письменных работ для проведения текущего контроля (эссе, рефераты, курсовые работы и др.)
не предусмотрено
5.3. Фонд оценочных средств для проведения промежуточной аттестации
Вопросы:

1. Число, оценки, измерение и измерительная шкала
2. Типы измерительных шкал
3. Базовые процедуры обработки данных и проблема выбора измерительной шкалы
4. Метод QIPM
5. Особенности выборочного метода исследования
6. Методы формирования выборки
7. Анализ точности результатов выборочного исследования: доверительный интервал
8. Определение необходимого объема выборки
9. Использование статистических пакетов для определения базовых характеристик выборки. PSPP, R - общая характеристика
10. Определение базовых статистических показателей
11. Проверка нормальности распределения
12. Логика проверки статистических гипотез
13. Статистические ошибки при принятии решений
14. Статистические тесты: общая характеристика
15. Статистическая значимость и практическая важность
16. Параметрические методы проверки статистических гипотез: общая характеристика
17. Критерий z
18. Критерий t Стьюдента для независимых выборок
19. Критерий t Стьюдента для связанных выборок
20. Особенности применения дисперсионного анализа
21. Однофакторный дисперсионный анализ
22. Критерии множественных сравнений
23. Реализация метода однофакторного дисперсионного анализа в статистических пакетах
24. Многофакторный дисперсионный анализ
25. Дисперсионный анализ с повторными измерениями
26. Непараметрические методы проверки статистических гипотез: общая характеристика
27. Критерий χ2 Пирсона
28. Тест Мак-Немара
29. Критерий Манна-Уитни
30. Тест Колмогорова-Смирнова
31. Критерий знаков и Т-критерий Уилкоксона
32. Критерии Краскела-Уоллиса и χ2 Фридмана
33. Показатели качества измерений в социально-экономических исследованиях: общая характеристика
34. Валидность как характеристика измерений
35. Подходы к оценке надежности измерений
36. Использование статистических пакетов для оценки надежности измерений
37. Оценка качества измерительных инструментов
38. Возможности преобразования данных из неметрических шкал в метрические
39. Шкала Лайкерта
40. Модель Раша
41. Реализация модели Раша в программе WINSTEPS
42. Оценка качества измерений на основе модели Раша
Приложения

6. Учебно-методическое и информационное обеспечение дисциплины

6.1. Рекомендуемая литература
6.1.1. Основная литература
Авторы Заглавие Издательство, год Эл. адрес
Л1.1 Румянцева Е.Е. ЭКОНОМИЧЕСКИЙ АНАЛИЗ. Учебник и практикум для академического бакалавриата: Гриф УМО ВО М.:Издательство Юрайт, 2018 biblio-online.ru
6.1.2. Дополнительная литература
Авторы Заглавие Издательство, год Эл. адрес
Л2.1 Горелов, Н.А., Кораблева, О.Н. Развитие информационного общества: цифровая экономика: учебное пособие для вузов. Юрайт, 2020 urait.ru
Л2.2 Николаева И.П. Экономическая теория: учебник для бакалавров М.: Издательско-торговая корпорация "Дашков и К", 2019 biblioclub.ru
6.2. Перечень ресурсов информационно-телекоммуникационной сети "Интернет"
6.3. Перечень программного обеспечения
Программные средства офисного назначения: Операционная система Microsoft Windows 2007; Microsoft Office Prof Plus 2007 Rus; Программа распознавания текста ABBYY FineReader 5.0; Microsoft Office SharePoint 2007 Rus; Программы верстки (печатных публикаций и web-страниц): Настольная издательская система PageMaker; Microsoft Front Page.
7-Zip
AcrobatReaderMicrosoft Office 2010 (Office 2010 Professional, № 4065231 от 08.12.2010), (бессрочно);
Microsoft Windows 7 (Windows 7 Professional, № 61834699 от 22.04.2013), (бессрочно);
Chrome (http://www.chromium.org/chromium-os/licenses), (бессрочно); 7-Zip (http://www.7-zip.org/license.txt), (бессрочно);
AcrobatReader (http://wwwimages.adobe.com/content/dam/Adobe/en/legal/servicetou/Acrobat_com_Additional_TOU-en_US-20140618_1200.pdf), (бессрочно);
ASTRA LINUX SPECIAL EDITION (https://astralinux.ru/products/astra-linux-special-edition/), (бессрочно);
LibreOffice (https://ru.libreoffice.org/), (бессрочно);
Веб-браузер Chromium (https://www.chromium.org/Home/), (бессрочно);
Антивирус Касперский (https://www.kaspersky.ru/), (до 23 июня 2024);
Архиватор Ark (https://apps.kde.org/ark/), (бессрочно);
Okular (https://okular.kde.org/ru/download/), (бессрочно);
Редактор изображений Gimp (https://www.gimp.org/), (бессрочно)
6.4. Перечень информационных справочных систем
http://www.consultant.ru

7. Материально-техническое обеспечение дисциплины

Аудитория Назначение Оборудование
Учебная аудитория для проведения занятий лекционного типа, занятий семинарского типа (лабораторных и(или) практических), групповых и индивидуальных консультаций, текущего контроля и промежуточной аттестации, курсового проектирования (выполнения курсовых работ), проведения практик Стандартное оборудование (учебная мебель для обучающихся, рабочее место преподавателя, доска)
Помещение для самостоятельной работы помещение для самостоятельной работы обучающихся Компьютеры, ноутбуки с подключением к информационно-телекоммуникационной сети «Интернет», доступом в электронную информационно-образовательную среду АлтГУ
Учебная аудитория для проведения занятий лекционного типа, занятий семинарского типа (лабораторных и(или) практических), групповых и индивидуальных консультаций, текущего контроля и промежуточной аттестации, курсового проектирования (выполнения курсовых работ), проведения практик Стандартное оборудование (учебная мебель для обучающихся, рабочее место преподавателя, доска)

8. Методические указания для обучающихся по освоению дисциплины

Для усвоения теоретических и практических основ курса необходимо:
• изучить программу курса;
• подобрать литературу по соответствующим темам и изучить её.

Студент должен изучать дисциплину согласно логической последовательности заявленных тематических разделов.
Изучение каждого тематического раздела студентом должно осуществляться следующим образом:
1. Студент должен четко планировать и организовать время, необходимое на изучение темы дисциплины, в соответствии с графиком учебного процесса своей специальности в АлтГУ.
2. При изучении темы студент должен вначале внимательно ознакомиться с темой дисциплины, в соответствие с ее названием найти тематический раздел в учебной литературе, подробно изучить основные понятия, их взаимосвязи и взаимодействия, закономерности, причины и следствия их развития по каждому выносимому на обсуждение вопросу темы. Эти вопросы рекомендуется использовать студенту для самопроверки знаний по тематическому разделу.
Затем студент должен ознакомиться с методической и справочной литературой по тематическому разделу дисциплины для изучения современной практики применения изложенных в теоретической литературе правил и методов разрешения затронутых проблем.
3. При подготовке по каждому тематическому разделу студент должен использовать рекомендованный ему список основной и дополнительной литературы. Студенту рекомендуется подготовить доклады или рефераты по вопросам темы, не рассмотренным на лекционных занятиях.
4. При подготовке к зачету студент в логической последовательности должен повторить изученный в ходе лекционных, семинарских и самостоятельных занятий материал согласно перечню выносимых на зачет вопросов.
5. Студенту рекомендуется использовать современные информационные технологии при самостоятельном изучении отдельных практических вопросов дисциплины.