Цель изучения дисциплины | Курс "Информационные технологии анализа данных" имеет в основном практическую направленность. Целью его изучения является систематизация и активация знаний, полученных студентами в рамках изучения различных предметов и дисциплин, связанных с обработкой данных практических наблюдений. |
---|---|
Место дисциплины в учебном плане | Б1.В.ДВ.01.01 |
Формируемые компетенции | ПК-1 | Знания, умения и навыки, получаемые в результате освоения дисциплины |
Знать:
Разнообразные методы и приемы первоначальной обработки "сырых" статистических данных, включая их нечисловые и бинарные варианты; Способы исключения грубых ошибок наблюдения; Методы группировки многомерных данных и их визуализации; Приемы предварительной, а затем и количественной оценки степени связи показателей различных типов; Подходы к организации классификации многомерных данных и построения дискриминирующих функций; Понятие информационной и прогностической силы показателя и способы их сортировки и/или исключения: Виды и формы статистически обоснованных заключений о характере представленных данных и возможных методах их обработки. Уметь:
Производить быстрый прикидочный анализ и осмотр структуры имеющихся данных; Цензурировать данные, включая несложные многомерные случаи; Производить группировку визуализацию данных, производя параллельно сокращение их размерности, если это необходимо; Строить статистически обоснованные классификации данных различными методами и предлагать дискриминационные процедуры вплоть до их существенно нелинейной формы; Обосновывать предложенные подходы и писать несложные компьютерные программы для их реализации. Иметь навыки и (или) опыт деятельности (владеть):
Работы с объемными многомерными статистическими данными. Решения задач цензурирования и сокращения размерности; Перевода нечисловых категорированных данных в числовую форму (включая бинарный случай); Изучения силы и вида связей как числовых, так и категорированных показателей. Изучения и обработки четырехпольных таблиц и общих таблиц сопаряженности; Проверки разного рода предположений о структуре изучаемых статистических данных. |
Содержание дисциплины | Общие принципы работы с данными. Работа с "сырыми" данными. Проверка предположений о структуре данных. |
Виды учебной работы | Лекции, практические, самостоятельная работа. |
Используемые информационные, инструментальные и программные средства |
Офисные программы: MS Word, MS Excel или подобные им.
Пакет статистической обработки данных класса IBM SPSS - для самоконтроля Программы для анализа соответствий и поиска главных компонент - собственной разработки, Свидетельство о регистрации программы для ЭВМ № 2015612979 от 27 февраля 2015 г (авторы - Дронов С.В. и Сазонова А.С.)Microsoft Office 2010 (Office 2010 Professional, № 4065231 от 08.12.2010), (бессрочно); Microsoft Windows 7 (Windows 7 Professional, № 61834699 от 22.04.2013), (бессрочно); Chrome (http://www.chromium.org/chromium-os/licenses), (бессрочно); 7-Zip (http://www.7-zip.org/license.txt), (бессрочно); AcrobatReader (http://wwwimages.adobe.com/content/dam/Adobe/en/legal/servicetou/Acrobat_com_Additional_TOU-en_US-20140618_1200.pdf), (бессрочно); ASTRA LINUX SPECIAL EDITION (https://astralinux.ru/products/astra-linux-special-edition/), (бессрочно); LibreOffice (https://ru.libreoffice.org/), (бессрочно); Веб-браузер Chromium (https://www.chromium.org/Home/), (бессрочно); Антивирус Касперский (https://www.kaspersky.ru/), (до 23 июня 2024); Архиватор Ark (https://apps.kde.org/ark/), (бессрочно); Okular (https://okular.kde.org/ru/download/), (бессрочно); Редактор изображений Gimp (https://www.gimp.org/), (бессрочно) Не нужны
|
Форма промежуточной аттестации | Зачет. |