Цель изучения дисциплины | формирование у студентов компетенций в области разработки и использования систем обработки и анализа больших массивов данных. |
---|---|
Место дисциплины в учебном плане | Б1.О.1.01.ДВ.01 |
Формируемые компетенции | ОПК-3 | Знания, умения и навыки, получаемые в результате освоения дисциплины |
Знать:
методы анализа и хранения больших объемов данных, этапы жизненного цикла обработки больших данных, языки, наиболее приспособленные для обработки и аналитики больших данных, способы организации хранения и доступа к большим данным. Уметь:
выполнять элементы анализа данных и интерпретировать результаты, различать характеристики SQL и NoSql БД, формулировать алгоритмы в парадигме MapReduce, выбрать подходящий инструмент анализа больших данных, выбрать подходящую технологию хранения больших данных. Иметь навыки и (или) опыт деятельности (владеть):
применения математических методов анализа данных, реализации алгоритмов обработки компьютерными методами. |
Содержание дисциплины | Введение в большие данные.. Технологии анализа данных. Технологии хранения больших данных. |
Виды учебной работы | Практические, самостоятельная работа. |
Используемые информационные, инструментальные и программные средства |
Интерпретатор и библиотеки языка R из дистрибутива Anaconda. Лицензия - cтандартная общественная лицензия the GNU General Public License (https://www.gnu.org/licenses/gpl-3.0.ru.html), the 3-clause BSD license (https://opensource.org/license/bsd-3-clause/)
СУБД MySQL и MongoDB из репозитория ОС Ubintu GNU/Linux Лицензия - cтандартная общественная лицензия the GNU General Public License (https://www.gnu.org/licenses/gpl-3.0.ru.html). |
Форма промежуточной аттестации | Зачет. |