Это прикладной модуль, который аккуратно снимает страх перед машинным обучением и показывает, что классические алгоритмы — не абстрактная математика, а рабочий инструмент для анализа биологических и медицинских данных.
Мы начинаем с фундаментальных методов обучения без учителя: понижения размерности, кластеризации и анализа структуры данных. Далее рассматриваем практическое применение этих подходов на примере single-cell RNA-Seq. После этого переходим к алгоритмам обучения с учителем — задачам классификации и регрессии, вопросам подготовки данных, интерпретации результатов и оценки качества моделей. Завершающий этап посвящён AutoML: автоматизированным подходам к выбору и настройке моделей на базе PyCaret, позволяющим ускорить аналитический процесс и повысить его воспроизводимость.
Для кого этот модуль- Студенты и аспиранты биологических, медицинских и биотехнологических специальностей.
- Научные сотрудники, которым нужно анализировать экспериментальные данные, находить закономерности и строить предсказательные модели.
- Специалисты лабораторий, клиник, биофармы и биотеха, желающие повысить квалификацию и применять ML в прикладных задачах.
- Те, кто освоил базовый Python и pandas и хочет перейти на следующий уровень — к реальному машинному обучению.
Что вы получите после прохождения модуля:- Понимание задач обучения без учителя: кластеризация, понижение размерности, визуализация структуры данных.
- Навык применения этих методов на реальных биологических данных, включая single-cell RNA-Seq.
- Уверенную работу с алгоритмами обучения с учителем: классификация, регрессия, метрики качества, интерпретация.
- Умение подготавливать данные: масштабирование, кодирование категорий, обработка пропусков.
- Практический навык обучения моделей с помощью scikit-learn.
- Знакомство с AutoML через PyCaret: ускорение подбора моделей и гиперпараметров.
- Уверенность в том, что ML — это не «чужая территория», а доступный инструмент для вашей работы.