МИНОБРНАУКИ РОССИИ
федеральное государственное бюджетное образовательное учреждение высшего образования
«Алтайский государственный университет»

Интеллектуальный анализ данных в биологии и медицине

рабочая программа дисциплины
Закреплена за кафедройКафедра теоретической кибернетики и прикладной математики
Направление подготовки09.04.03. Прикладная информатика
ПрофильЦифровые технологии анализа данных для устойчивого развития регионов Северной и Центральной Азии
Форма обученияОчная
Общая трудоемкость4 ЗЕТ
Учебный план09_04_03_Прикладная информатика_ЦТАД_ЦА-2023
Часов по учебному плану 144
в том числе:
аудиторные занятия 36
самостоятельная работа 108
Виды контроля по семестрам
зачеты: 4

Распределение часов по семестрам

Курс (семестр) 2 (4) Итого
Недель 13,5
Вид занятий УПРПДУПРПД
Лабораторные 36 36 36 36
Сам. работа 108 108 108 108
Итого 144 144 144 144

Программу составил(и):
преп., Кротова О.С.

Рецензент(ы):
к.ф.-м.н., доцент, Пономарев И.В.

Рабочая программа дисциплины
Интеллектуальный анализ данных в биологии и медицине

разработана в соответствии с ФГОС:
Федеральный государственный образовательный стандарт высшего образования - магистратура по направлению подготовки 09.04.03 Прикладная информатика (приказ Минобрнауки России от 19.09.2017 г. № 916)

составлена на основании учебного плана:
09.04.03 Прикладная информатика
утвержденного учёным советом вуза от 26.06.2023 протокол № 4.

Рабочая программа одобрена на заседании кафедры
Кафедра теоретической кибернетики и прикладной математики

Протокол от 29.06.2022 г. № 11
Срок действия программы: 2022-2023 уч. г.

Заведующий кафедрой
к.т.н., доцент Понькина Е.В.


Визирование РПД для исполнения в очередном учебном году

Рабочая программа пересмотрена, обсуждена и одобрена для
исполнения в 2023-2024 учебном году на заседании кафедры

Кафедра теоретической кибернетики и прикладной математики

Протокол от 29.06.2022 г. № 11
Заведующий кафедрой к.т.н., доцент Понькина Е.В.


1. Цели освоения дисциплины

1.1.Целями освоения дисциплины являются:
- изучение методов и подходов интеллектуального анализа данных различного объема, включая предварительную обработку данных и статистический анализ, освоение различных моделей машинного обучения, предназначенных для решения задач классификации и регрессии;
- применение полученных знаний для решения прикладных задач из областей биологии и медицины.

2. Место дисциплины в структуре ООП

Цикл (раздел) ООП: Б1.О.03

3. Компетенции обучающегося, формируемые в результате освоения дисциплины

ОПК-2Способен разрабатывать оригинальные алгоритмы и программные средства, в том числе с использованием современных интеллектуальных технологий, для решения профессиональных задач;
ОПК-2.1 Знает современные интеллектуальные технологии.
ОПК-2.2 Умеет обосновывать выбор современных интеллектуальных технологий и программной среды при разработке оригинальных программных средств для решения профессиональных задач.
ОПК-2.3 Владеет опытом разработки оригинальных алгоритмов и программных средств, в том числе с использованием современных интеллектуальных технологий, для решения профессиональных задач.
ОПК-4Способен применять на практике новые научные принципы и методы исследований;
ОПК-4.1 Знает новые научные принципы и методы исследований.
ОПК-4.2 Умеет применять новые научные принципы иметоды исследований при решении задач профессиональной деятельности.
ПК-1Способен использовать и разрабатывать методы, модели, алгоритмы и цифровые технологии, а также различные инструментальные средства сбора, анализа и обработки данных различной природы для решения прикладных задач устойчивого развития территорий
ПК-1.1 Знает методы и программный инструментарий технологий анализа данных, методы сравнительного анализа методов, моделей, алгоритмов и информационных технологий, специфику применения и ограничения различных методов. Умеет применять на практике методы научных исследований и инструментарий информационных технологий для выполнения научноисследовательских задач в области устойчивого развития территорий. Владеет навыками проведения научного исследования параметров функционирования и/или развития территориальнораспределенных систем с использованием современных цифровых технологий.
ПК-1.2 Умеет применять на практике методы научных исследований и инструментарий информационных технологий для выполнения научноисследовательских задач в области устойчивого развития территорий.
ПК-1.3 Владеет навыками проведения научного исследования параметров функционирования и/или развития территориальнораспределенных систем с использованием современных цифровых технологий.
В результате освоения дисциплины обучающийся должен
3.1.Знать:
3.1.1.- Основные определения и понятия предметной области;
-
Задачи, методы и подходы интеллектуального анализа данных;
- Технологии интеллектуального анализа данных, применяемые для решения различных задач из областей биологии и медицины.
3.2.Уметь:
3.2.1.- Строить автоматизированные модели анализа данных;
- Выполнять интерпретацию результатов.
3.3.Иметь навыки и (или) опыт деятельности (владеть):
3.3.1.- Методами интеллектуального анализа данных для решения задач кластеризации,классификации, прогнозирования в биологии и медицине.

4. Структура и содержание дисциплины

Код занятия Наименование разделов и тем Вид занятия Семестр Часов Компетенции Литература
Раздел 1. Введение в интеллектуальный анализ данных
1.1. Основные понятия и определения. Этапы анализа данных. Структурированные , неструктурированные и полуструктурированные данные. Лабораторные 4 4 Л2.1, Л1.1, Л2.2, Л1.2, Л1.3
1.2. Актуальные пример ы применения интеллектуального анализа данных в биологии и медицине Лабораторные 4 4 Л2.1, Л1.1, Л2.2, Л1.2, Л1.3
1.3. Основные понятия и определения. Этапы анализа данных. Структурированные , неструктурированные и полуструктурированные данные. Сам. работа 4 6 Л2.1, Л1.1, Л2.2, Л1.2, Л1.3
Раздел 2. Очистка, интеграция и преобразование данных
2.1. Библиотека pandas. Структуры данных в pandas, работа со структурами данных. Операции над данными. Комбинирование данных из разных источников. Обработка пропущенных значений. Лабораторные 4 4 Л2.1, Л1.1, Л2.2, Л1.2, Л1.3
2.2. Работа с данными в pandas. Анализ последовательности ДНК. Сам. работа 4 6 Л2.1, Л1.1, Л2.2, Л1.2, Л1.3
2.3. Визуализация данных. Сам. работа 4 8 Л2.1, Л1.1, Л2.2, Л1.2, Л1.3
2.4. Обработка пропущенных значений в массивах данных. Сам. работа 4 8 Л2.1, Л1.1, Л2.2, Л1.2, Л1.3
Раздел 3. Теория вероятностей и математическая статистика
3.1. Теория вероятностей: условная вероятность, случайные величины, теорема Байеса, распределение вероятностей. Лабораторные 4 2 Л2.1, Л1.1, Л2.2, Л1.2, Л1.3
3.2. Статистика: описание одиночного набора данных, показатели центра распределения, показатели вариации, корреляция и причинная зависимость. Проверка статистических гипотез. Лабораторные 4 4 Л2.1, Л1.1, Л2.2, Л1.2, Л1.3
3.3. Статистический анализ медицинских данных людей, страдающих заболеваниями сердца. Поиск факторов риска. Сам. работа 4 10 Л2.1, Л1.1, Л2.2, Л1.2, Л1.3
Раздел 4. Машинное обучение
4.1. Задачи машинного обучения. Обучение с учителем и без учителя. Библиотека Scikit-Learn. Лабораторные 4 4 Л2.1, Л1.1, Л2.2, Л1.2, Л1.3
4.2. Задачи машинного обучения. Обучение с учителем и без учителя.Библиотека Scikit-Learn. Сам. работа 4 10 Л2.1, Л1.1, Л2.2, Л1.2, Л1.3
4.3. Задача классификации. Постановка задачи. Классификационные модели. Классификация типов лесного покрова по данным окружающей среды. Задача постановки диагноза по набору медицинских данных. Лабораторные 4 4 Л2.1, Л1.1, Л2.2, Л1.2, Л1.3
4.4. Построение модели классификации типов лесного покрова по данным окружающей среды. Сам. работа 4 10 Л2.1, Л1.1, Л2.2, Л1.2, Л1.3
4.5. Построение модели постановки диагноза по набору медицинских данных. Сам. работа 4 10 Л2.1, Л1.1, Л2.2, Л1.2, Л1.3
4.6. Задача регрессии. Постановка задачи. Предсказательные модели. Лабораторные 4 4 Л2.1, Л1.1, Л2.2, Л1.2, Л1.3
4.7. Построение модели прогнозирования темпов роста растений. Сам. работа 4 10 Л2.1, Л1.1, Л2.2, Л1.2, Л1.3
4.8. Построение модели прогнозирования заживления органа по постоперационным показателям. Сам. работа 4 10 Л2.1, Л1.1, Л2.2, Л1.2, Л1.3
4.9. Оценка и улучшение качества моделей машинного обучения: перекрестная проверка, поиск по сетке, метрики качества моделей и их вычисление. Лабораторные 4 4 Л2.1, Л1.1, Л2.2, Л1.2, Л1.3
4.10. Оптимизация гиперпараметров построенных моделей. Оценка качества. Сам. работа 4 10 Л2.1, Л1.1, Л2.2, Л1.2, Л1.3
4.11. Введение в компьютерное зрение. Решение задачи диагностики диабетической ретинопатии с помощью компьютерного зрения. Лабораторные 4 2 Л2.1, Л1.1, Л2.2, Л1.2, Л1.3
4.12. Введение в компьютерное зрение. Решение задачи диагностики диабетической ретинопатии с помощью компьютерного зрения. Сам. работа 4 10 Л2.1, Л1.1, Л2.2, Л1.2, Л1.3

5. Фонд оценочных средств

5.1. Контрольные вопросы и задания для проведения текущего контроля и промежуточной аттестации по итогам освоения дисциплины
Оценочные материалы для текущего контроля по разделам и темам дисциплины в полном объеме размещены в онлайн-курсе на образовательном портале «Цифровой университет АлтГУ» – https://portal.edu.asu.ru/course/view.php?id=3237.
ОЦЕНКА СФОРМИРОВАННОСТИ КОМПЕТЕНЦИИ ПК-1: Способен использовать и разрабатывать методы, модели, алгоритмы и цифровые технологии, а также различные инструментальные средства сбора, анализа и обработки данных различной природы для решения прикладных задач устойчивого развития территорий

ПРИМЕРЫ ЗАДАНИЙ ЗАКРЫТОГО ТИПА - https://disk.yandex.ru/d/jPVUCbTYVaWbZg

ПРИМЕРЫ ЗАДАНИЙ ОТКРЫТОГО ТИПА - https://disk.yandex.ru/i/nROWoEWONOc3fw

ОЦЕНКА СФОРМИРОВАННОСТИ КОМПЕТЕНЦИИ ОПК-4: Способен применять на практике новые научные принципы и методы исследований

ПРИМЕРЫ ЗАДАНИЙ ЗАКРЫТОГО ТИПА - ttps://disk.yandex.ru/i/uoF64AepsRz_-g

ПРИМЕРЫ ЗАДАНИЙ ОТКРЫТОГО ТИПА - https://disk.yandex.ru/i/bB4FoheU0tGMvw

ОЦЕНКА СФОРМИРОВАННОСТИ КОМПЕТЕНЦИИ ОПК-2: Способен разрабатывать оригинальные алгоритмы и программные средства, в том числе с использованием современных интеллектуальных технологий, для решения профессиональных задач

ПРИМЕРЫ ЗАДАНИЙ ЗАКРЫТОГО ТИПА - https://disk.yandex.ru/i/WMCiIvubC7rr3A

ПРИМЕРЫ ЗАДАНИЙ ОТКРЫТОГО ТИПА - https://disk.yandex.ru/i/yAwQC4cuBMD3Mw

КРИТЕРИИ ОЦЕНИВАНИЯ: Каждое задание оценивается 1 баллом. Оценивание КИМ в целом: «отлично» – верно выполнено 85-100% заданий; «хорошо» – верно выполнено 70-84% заданий; «удовлетворительно» – верно выполнено 51-69% заданий; «неудовлетворительно» – верно выполнено 50% или менее 50% заданий.


5.2. Темы письменных работ для проведения текущего контроля (эссе, рефераты, курсовые работы и др.)
Не предусмотрено
5.3. Фонд оценочных средств для проведения промежуточной аттестации
Промежуточная аттестация заключается в проведении в конце семестра зачета. На зачете каждому студенту необходимо решить индивидуальное задание. Защита выполненных заданий обучающимися происходят в виде беседы преподавателя с обучающимся на темы, связанные с изучаемой дисциплиной, с демонстрацией разработанной компьютерной программы.
Пример задания:
Данные доступны по адресу: https://www.kaggle.com/uciml/forest-cover-type-dataset
Задача классификации лесного покрова является задачей многоклассовой классификации.
Задание:
1. Проведите статистический анализ, определите наиболее релевантные признаки.
2. Постройте модель логистической регрессии. Вычислите верность классификации.
3. Постройте модель на основе метода опорных векторов. Используйте ядро RBF. Вычислите верность классификации.
4. Проинтерпретируйте полученный результат. Какой вывод можно сделать?

Критерии оценивания:
85-100 баллов: Задание решено студентом самостоятельно. При этом составлен правильный алгоритм решения задачи, в логических рассуждениях и в выборе алгоритма решения нет ошибок, получен верный ответ.
70-84 баллов: Задание решено с подсказкой преподавателя. При этом составлен правильный алгоритм решения задания, в логическом рассуждении и решении нет существенных ошибок; задание решено нерациональным способом или допущено не более двух несущественных ошибок, получен верный ответ.
50-69 баллов: Студентом задание решено с подсказками преподавателя. При этом задание понято правильно, в логическом рассуждении нет существенных ошибок, но допущены существенные ошибки в выборе алгоритма или в математических расчетах; задание решено не полностью или в общем виде.
0-49 баллов: Задание не решено.
Для получения зачета студенту необходимо набрать более 50 баллов.

6. Учебно-методическое и информационное обеспечение дисциплины

6.1. Рекомендуемая литература
6.1.1. Основная литература
Авторы Заглавие Издательство, год Эл. адрес
Л1.1 Маккинни У. Python и анализ данных: Москва: ДМК Пресс, 2020 https://e.lanbook.com/book/131721
Л1.2 Рашка С. Python и машинное обучение: крайне необходимое пособие по новейшей предсказательной аналитике, обязательное для более глубокого понимания методологии машинного обучения: Самоучители и руководства Издательство "ДМК Пресс", 2017 e.lanbook.com
Л1.3 Шарден Б., Массарон Л., Боскетти А. Крупномасштабное машинное обучение вместе с Python: Учебные пособия Издательство "ДМК Пресс", 2018 //ЭБС издательства «Лань» e.lanbook.com
6.1.2. Дополнительная литература
Авторы Заглавие Издательство, год Эл. адрес
Л2.1 Дронов, Сергей Вадимович Математическая статистика: учеб. пособие Барнаул : Изд-во АлтГУ, 2016 elibrary.asu.ru
Л2.2 С. В. Дронов Теория вероятностей: элементарные методы, случайные величины, предельные теоремы: учеб. пособие для мат. спец. Изд-во АлтГУ, 2014 elibrary.asu.ru
6.2. Перечень ресурсов информационно-телекоммуникационной сети "Интернет"
Название Эл. адрес
Э1 Электронная библиотека АлтГУ. www.lib.asu.ru
Э2 Электронная библиотечная система "Лань" . e.lanbook.com
Э3 Научная электронная библиотека "Elibrary". elibrary.ruhttp
Э4 Электронная библиотечная система издательства "Юрайт". biblio-online.ru
Э5 Издательство МЦНО (свободно-распространяемые книги). www.mccme.ru/free-books
Э6 Цифровой университет АлтГУ: Интеллектуальный анализ данных в биологии и медицине portal.edu.asu.ru
Э7 Единый образовательный портал АлтГУ: Artificial Intelligence and Data Analytics in Biology and Medicine portal.edu.asu.ru
6.3. Перечень программного обеспечения
Microsoft Office 2010 (Office 2010 Professional, № 4065231 от
08.12.2010), (бессрочно);

Microsoft Windows 7 (Windows 7 Professional, № 61834699 от
22.04.2013), (бессрочно);

Chrome (http://www.chromium.org/chromium-os/licenses ), (бессрочно);

7-Zip (http://www.7-zip.org/license.txt ), (бессрочно);

AcrobatReader
(http://wwwimages.adobe.com/content/dam/Adobe/en/legal/servicetou/Acrobat_co
m_Additional_TOU-en_US-20140618_1200.pdf), (бессрочно);

ASTRA LINUX SPECIAL EDITION (https://astralinux.ru/products/astra-
linux-special-edition/), (бессрочно);

LibreOffice (https://ru.libreoffice.org/), (бессрочно);

Веб-браузер Chromium (https://www.chromium.org/Home/),
(бессрочно);

Антивирус Касперский (https://www.kaspersky.ru/), (до 23 июня
2024);

Дистрибутив Anaconda (бессрочно).
6.4. Перечень информационных справочных систем
1. Издательство «Лань» - электронно-библиотечная система [Электронный
ресурс]: http://e.lanbook.com
2. Издательство МЦНМО. Свободно распространяемые книги издательства
Московского центра непрерывного математического образования
[Электронный ресурс]: www.mccme.ru/free-books
3. Электронная библиотечная система Алтайского государственного
университета [Электронный ресурс]: http://elibrary.asu.ru
4. Электронная база данных ZBMATH: https://zbmath.org/

7. Материально-техническое обеспечение дисциплины

Аудитория Назначение Оборудование
408Л лаборатория математического моделирования - учебная аудитория для проведения занятий семинарского типа (лабораторных и(или) практических); проведения групповых и индивидуальных консультаций, текущего контроля и промежуточной аттестации Учебная мебель на 15 посадочных мест; рабочее место преподавателя; доска меловая 1 шт.; компьютер Depo - 10 шт., 5 шт. с мониторами LG и 5 шт. с мониторами Philips; мультимедиа-проектор Sony - 1 шт.; МФУ Canon - 1 шт.; стационарный экран: марка Digis Optima C - 1 шт.
203Л лаборатория информационных технологий - компьютерный класс - учебная аудитория для проведения занятий семинарского типа (лабораторных и(или) практических); проведения групповых и индивидуальных консультаций, текущего контроля и промежуточной аттестации Учебная мебель на 14 посадочных мест; компьютеры: марка ASUS модель i5-6500 - 14 единиц
320Л медиатека, читальный зал – помещение для самостоятельной работы Учебная мебель на 15 посадочных мест; персональные компьютеры с выходом в информационно-телекоммуникационную сеть Интернет и электронную информационно-образовательную среду;

8. Методические указания для обучающихся по освоению дисциплины

Для успешного освоения дисциплины студент должен посещать все занятия, вовремя выполнять задания, пользоваться основной и дополнительной литературой, рекомендованной настоящей программой. Во время занятий рекомендуется вести краткий конспект.
Для выполнения заданий каждому студенту необходимо:
- получить вариант задания у преподавателя;
- скачать документ с описанием задания с портала Цифровой университет;
- внимательно прочитать задание. Вопросы, возникающие в процессе выполнения заданий, необходимо грамотно сформулировать и обратиться за помощью к преподавателю на консультации или ближайшем занятии;
- разработать, отладить и оттестировать программы, решающие поставленные задачи.
Для каждого задания предусмотрена процедура защиты, в ходе которой преподаватель проводит устный опрос студентов для контроля понимания выполненных ими заданий.
При подготовке к зачету в дополнение к изучению конспектов лекций и учебной литературы, рекомендуется посещать консультации и пользоваться свободными Интернет-ресурсами.