Закреплена за кафедрой | Кафедра теоретической кибернетики и прикладной математики |
---|---|
Направление подготовки | 01.04.02. Прикладная математика и информатика |
Профиль | Биокибернетика, биоинформатика и программная инженерия |
Форма обучения | Очная |
Общая трудоемкость | 2 ЗЕТ |
Учебный план | 01_04_02_ББиПИ-1-2020-1 |
|
|
Распределение часов по семестрам
Курс (семестр) | 2 (3) | Итого | ||
---|---|---|---|---|
Недель | 19 | |||
Вид занятий | УП | РПД | УП | РПД |
Практические | 18 | 18 | 18 | 18 |
Сам. работа | 54 | 54 | 54 | 54 |
Итого | 72 | 72 | 72 | 72 |
Визирование РПД для исполнения в очередном учебном году
Рабочая программа пересмотрена, обсуждена и одобрена для
исполнения в 2020-2021 учебном году на заседании
кафедры
Кафедра теоретической кибернетики и прикладной математики
Протокол от 30.06.2020 г. № 6
Заведующий кафедрой к.т.н., доцент Хворова Л.А.
1.1. | Целью освоения дисциплины является освоение методов и подходов компьютерной лингвистики и анализа текстовых данных. Компьютерная лингвистика и анализ текстовых данных востребованное направление в IT. Популярные в современном мире машинные переводчики, чат-боты, системы «вопрос-ответ» и другое прикладное ПО строятся на методах и подходах анализа естественного языка. В процессе освоения дисциплины обучающиеся преобретут все небходимы навыки и умения разработки прикладного ПО для обработки естественного языка. |
---|
Цикл (раздел) ООП: Б1.О.01.03 |
В результате освоения дисциплины обучающийся должен | |
3.1. | Знать: |
---|---|
3.1.1. | Методы и подходы компьютерного анализа и обработки естественного языка. |
3.2. | Уметь: |
3.2.1. | Строить автоматизированные системы анализа и обработки естественного языка. |
3.3. | Иметь навыки и (или) опыт деятельности (владеть): |
3.3.1. | Навыками компьютерной лингвистики и анализа текстов, необходимыми для разработки современного программного обеспечения. |
Код занятия | Наименование разделов и тем | Вид занятия | Семестр | Часов | Компетенции | Литература |
---|---|---|---|---|---|---|
Раздел 1. Введение в компьютерную лингвистику | ||||||
1.1. | Основные понятия компьютерной лингвистики. Лингвистические данные. Сложности обработки и анализа естественного языка | Практические | 3 | 2 | Л2.4, Л1.1, Л1.2, Л2.2, Л2.3, Л1.3, Л2.1 | |
1.2. | Инструменты для анализа текста. Модули и библиотеки для NLP | Практические | 3 | 2 | Л2.4, Л1.1, Л1.2, Л2.2, Л2.3, Л1.3, Л2.1 | |
Раздел 2. Корпусная лингвистика | ||||||
2.1. | Создание и применение корпусов текста | Практические | 3 | 2 | Л2.4, Л1.1, Л1.2, Л2.2, Л2.3, Л1.3, Л2.1 | |
2.2. | Доступ к данным с помощью NLTK: применение инструментов чтения и структурирования корпусов текстов | Сам. работа | 3 | 9 | Л2.4, Л1.1, Л1.2, Л2.2, Л2.3, Л1.3, Л2.1 | |
2.3. | Обработка и преобразования корпуса текста: сегментация, лексемизация, промежуточный анализ корпуса | Практические | 3 | 2 | Л2.4, Л1.1, Л1.2, Л2.2, Л2.3, Л1.3, Л2.1 | |
2.4. | Лемматизация, векторизация, семантический анализ текстов. Распознавание именованных сущностей и извлечение отношений | Практические | 3 | 2 | Л2.4, Л1.1, Л1.2, Л2.2, Л2.3, Л1.3, Л2.1 | |
2.5. | Предварительная обработка и преобразование корпуса | Сам. работа | 3 | 9 | Л2.4, Л1.1, Л1.2, Л2.2, Л2.3, Л1.3, Л2.1 | |
2.6. | Векторизация и преобразование с помощью NLTK и Scikit-learn. Вычисление TF-IDF | Сам. работа | 3 | 9 | Л2.4, Л1.1, Л1.2, Л2.2, Л2.3, Л1.3, Л2.1 | |
Раздел 3. Прикладной анализ текстовых данных | ||||||
3.1. | Классификация в анализе текстовых данных | Практические | 3 | 2 | Л2.4, Л1.1, Л1.2, Л2.2, Л2.3, Л1.3, Л2.1 | |
3.2. | Классификация текстовых медицинских карт пациентов с заболеваниями легких | Сам. работа | 3 | 9 | Л2.4, Л1.1, Л1.2, Л2.2, Л2.3, Л1.3, Л2.1 | |
3.3. | Кластеризация как инструмент выявления сходств в тексте | Практические | 3 | 2 | Л2.4, Л1.1, Л1.2, Л2.2, Л2.3, Л1.3, Л2.1 | |
3.4. | Выявление сходств в текстах научных публикаций с помощью кластеризации | Сам. работа | 3 | 9 | Л2.4, Л1.1, Л1.2, Л2.2, Л2.3, Л1.3, Л2.1 | |
3.5. | Контекстно-зависимый анализ текста | Практические | 3 | 2 | Л2.4, Л1.1, Л1.2, Л2.2, Л2.3, Л1.3, Л2.1 | |
3.6. | Извлечение признаков из медицинского текста на основе N-грамм | Сам. работа | 3 | 9 | Л2.4, Л1.1, Л1.2, Л2.2, Л2.3, Л1.3, Л2.1 | |
3.7. | Визуализация текста. Графовые методы анализа текста | Практические | 3 | 2 | Л2.4, Л1.1, Л1.2, Л2.2, Л2.3, Л1.3, Л2.1 |
5.1. Контрольные вопросы и задания для проведения текущего контроля и промежуточной аттестации по итогам освоения дисциплины |
См. приложение |
5.2. Темы письменных работ для проведения текущего контроля (эссе, рефераты, курсовые работы и др.) |
Не предусмотрено |
5.3. Фонд оценочных средств для проведения промежуточной аттестации |
См. приложение |
6.1. Рекомендуемая литература | ||||
6.1.1. Основная литература | ||||
Авторы | Заглавие | Издательство, год | Эл. адрес | |
Л1.1 | Маккинни У. | Python и анализ данных: | Москва: ДМК Пресс, 2020 | https://e.lanbook.com/book/131721 |
Л1.2 | Коэльо Л.П., Ричарт В. | Построение систем машинного обучения на языке Python: | Издательство "ДМК Пресс", 2016 | e.lanbook.com |
Л1.3 | Бонцанини М. | Анализ социальных медиа на Python. Извлекайте и анализируйте данные из всех уголков социальной паутины на Python: Другое | Издательство "ДМК Пресс", 2018 | e.lanbook.com |
6.1.2. Дополнительная литература | ||||
Авторы | Заглавие | Издательство, год | Эл. адрес | |
Л2.1 | Прохоренок Н., Дронов В. | Python 3. Самое необходимое.: | БХВ-Петербург, 2016 | bhv.ru |
Л2.2 | Златопольский Д.М. | Основы программирования на языке Python: Учебники | Издательство "ДМК Пресс", 2017 | e.lanbook.com |
Л2.3 | Митчелл Р. | Скрапинг веб-сайтов с помощю Python: Самоучители и руководства | Издательство "ДМК Пресс", 2016 | e.lanbook.com |
Л2.4 | А. А. Барсегян, М. С. Куприянов, И. И. Холод, М. Д. Тесс, С. И. Елизаров. | Анализ данных и процессов: учеб. пособие: Учебная литература для вузов | СПб.: БХВ-Петербург, 2009 | kist.ntu.edu.ua |
6.2. Перечень ресурсов информационно-телекоммуникационной сети "Интернет" | ||||
Название | Эл. адрес | |||
Э1 | Компьютерная лингвистика и анализ текста | portal.edu.asu.ru | ||
6.3. Перечень программного обеспечения | ||||
Microsoft Windows Microsoft Office Дистрибутив Anaconda 7-Zip AcrobatReader | ||||
6.4. Перечень информационных справочных систем | ||||
1. Компьютерная лингвистика и анализ текста [Электронный ресурс]: https://portal.edu.asu.ru/course/view.php?id=7794. 2. Издательство «Лань» - электронно-библиотечная система [Электронный ресурс]: http://e.lanbook.com 3. 3. Издательство МЦНМО. Свободно распространяемые книги издательства Московского центра непрерывного математического образования [Электронный ресурс]: www.mccme.ru/free-books 4. 4. Электронная библиотечная система Алтайского государственного университета [Электронный ресурс]: http://elibrary.asu.ru 5. 5. Электронная база данных ZBMATH: https://zbmath.org/ |
Аудитория | Назначение | Оборудование |
---|---|---|
203Л | лаборатория информационных технологий - компьютерный класс - учебная аудитория для проведения занятий семинарского типа (лабораторных и(или) практических); проведения групповых и индивидуальных консультаций, текущего контроля и промежуточной аттестации | Учебная мебель на 14 посадочных мест; компьютеры: марка ASUS модель i5-6500 - 14 единиц |
Учебная аудитория | для проведения занятий лекционного типа, занятий семинарского типа (лабораторных и(или) практических), групповых и индивидуальных консультаций, текущего контроля и промежуточной аттестации, курсового проектирования (выполнения курсовых работ), проведения практик | Стандартное оборудование (учебная мебель для обучающихся, рабочее место преподавателя, доска) |
408Л | лаборатория математического моделирования - учебная аудитория для проведения занятий семинарского типа (лабораторных и(или) практических); проведения групповых и индивидуальных консультаций, текущего контроля и промежуточной аттестации | Учебная мебель на 15 посадочных мест; рабочее место преподавателя; доска меловая 1 шт.; компьютер Depo - 10 шт., 5 шт. с мониторами LG и 5 шт. с мониторами Philips; мультимедиа-проектор Sony - 1 шт.; МФУ Canon - 1 шт.; стационарный экран: марка Digis Optima C - 1 шт. |
Для успешного освоения дисциплины студент должен посещать лекции и лабораторные занятия, вовремя выполнять все задания и тесты, пользоваться основной и дополнительной литературой, рекомендованной настоящей программой. Для выполнения лабораторных заданий каждому студенту необходимо: - получить вариант задания у преподавателя; - скачать документ с описанием задания с образовательного портала; - внимательно прочитать задание. Вопросы, возникающие в процессе выполнения лабораторных работ, необходимо грамотно сформулировать и обратиться за помощью к преподавателю на консультации или ближайшем занятии; - разработать, отладить и оттестировать программы, решающие поставленные задачи. Для каждого лабораторного задания предусмотрена процедура защиты, в ходе которой преподаватель проводит устный опрос студентов для контроля понимания выполненных ими заданий. При подготовке к зачету в дополнение к изучению конспектов и учебной литературы, рекомендуется посещать консультации и пользоваться свободными Интернет-ресурсами. |