Основы Python для анализа данных в биологии и медицине

9000,00
р.
Этот модуль создан для биологов, медиков, исследователей и всех, кто ежедневно сталкивается с данными, но устал полагаться на Excel и чьи эксперименты упираются в невозможность быстро и качественно обработать массивы информации. За 24 академических часа вы освоите Python с нуля и пройдёте путь от освоения ключевых конструкций Python до реализации алгоритма глобального выравнивания последовательностей и первичного знакомства с подходами к анализу больших наборов данных, включая single-cell RNA-Seq. Это ударная программа, которая превращает «я боюсь кода» в "я контролирую свои данные".

Входит в состав образовательной траектории
«Машинное обучение и нейронные сети в биологии и медицине»

Сложность: базовый уровень

Трудоёмкость: 24 ак. ч.

Уровень сложности: Базовый

Направление: Анализ данных

Инструменты: Python

Инструменты: Pandas

Инструменты: NumPy

Инструменты: RNA-seq

Инструменты: GitHub

Преподаватель: Укладов Егор

Преподаватель: Бобровских Александр

Подробная информация о блоке
Программа обучения
Характеристики образовательного блока

Подробная информация о блоке

Модуль объединяет основы Python, биологические задачи и практическую работу с реальными наборами данных. Мы начинаем с фундаментальных конструкций языка — переменных, условий, циклов и функций — и последовательно выстраиваем навык, необходимый для решения прикладных задач анализа данных. Уже к середине модуля вы уверенно работаете с ключевыми библиотеками, а затем переходите к биоинформатическим задачам: от реализации алгоритма Нидлмана-Вунша до знакомства с методами анализа больших массивов данных и первичных шагов в single-cell RNA-Seq.
Материал подаётся структурированно и без воды: только то, что действительно нужно в реальной лабораторной и исследовательской работе.

Для кого этот модуль
  • Студенты и аспиранты биофаков, медфаков, биотеха, которым для учёбы и исследований нужен реальный навык анализа данных.
  • Научные сотрудники, уставшие ждать помощи от биоинформатиков и желающие наконец взять обработку данных в свои руки.
  • Практикующие медики, генетики, биотехнологи, которым необходимо понимать современные методы анализа и визуализации.
  • Все, кто хочет уверенно войти в биоинформатику или аналитическую работу с биоданными.

Что вы получите после прохождения модуля:
  • Уверенное владение основами Python и понимание принципов программирования.
  • Навыки работы с библиотеками NumPy, pandas.
  • Уверенная работа с matplotlib и seaborn для визуализации результатов анализа.
  • Реализацию собственными руками алгоритма глобального выравнивания последовательностей (Нидлмана-Вунша).
  • Понимание принципов работы с большими массивами данных.
  • Первичное знакомство с подходами анализа крупных биологических датасетов, включая single-cell RNA-Seq.
  • Готовность применять всё это в своих исследованиях, проектах и научной работе.

Программа обучения

Тема 1. Особенности языка программирования Питон. Типы переменных. Динамическая типизация. Условный оператор. Циклы for и while.
Содержание
Компилируемые и интерпретируемые языки программирования. Динамическая типизация переменных. Преимущества динамической типизации. Типы переменных в Python. Изменяемые и неизменяемые переменные. Условный оператор if. Цикл итеративного перебора for. Цикл с предусловием while. Работа со строками и методы строк.
Практическая работа
Написание программ на Python с использованием условных операторов, циклов и строковых методов"
(работа с типами данных, циклами for/while, строками, модулем random)

Тема 2. Решение задач по работе со строками, условным операторам и циклам. Написание функций.
Содержание
Работа со строковыми переменными. Функции в Python. Написание функции на примере алгоритма поиска открытой рамки считывания в нуклеотидной последовательности и трансляция белка.
Практическая работа
Поиск открытой рамки считывания и трансляция нуклеотидной последовательности в последовательность аминокислот

Тема 3. Написание функции для выравнивания последовательностей ДНК алгоритмом Нидлмана-Вунша
Содержание
Работа со строковыми переменными. Функции в Python. Написание функции на примере алгоритма глобального парного выравнивания алгоритмом Нидлмана-Вунша. Использование готовой реализации алгоритма в библиотеке BioPython.
Практическая работа
Реализация алгоритма Нидлмана-Вунша для глобального выравнивания ДНК-последовательностей

Тема 4. GitHub - инструмент для совместных проектов
Содержание
Создание репозитория на GitHub для проекта анализа single-cell RNA-seq. Реализация оформления README, добавление кода и данных.

Тема 5. Основы анализа и визуализации данных. Основные библиотеки для анализа и визуализации (pandas, matplotlib, seaborn).
Содержание
Библиотека numpy для работы с высшей математикой и матрицами. Библиотека pandas для работы с таблицами. Методы работы с таблицами и анализа табличных данных. Библиотека matplotlob. pyplot для построения базовых и настраиваемых графиков. Библиотека seaborn для построения различных типов графиков.

Тема 6. Решение задач по основам визуализации и анализа данных
Содержание
Seaborn barplot, Pandas, сводная таблица.
Практическая работа
Понижение размерности данных с помощью PCA и визуализация главных компонент

Тема 7. Анализ и визуализация больших данных
Содержание
Типы графиков и настройка графиков для визуализации больших наборов данных: kdeplot, scatterplot, histplot и д.р. Снижение размерности как средство визуализации данных высокой размерности.
Практическая работа
Анализ больших данных и визуализация распределений признаков: исследование плотности, выбросов и взаимосвязей с использованием больших выборок

Тема 8. Анализ больших данных на примере single-cell RNA-Seq
Содержание
Задача снижения размерности и кластеризации, single-cell RNASeq. Инструменты из библиотеки scanpy.

Итоговая аттестация

Характеристики образовательного блока

Характеристики образовательного блока:

  • Продолжительность: 24 ак. ч.
  • Сложность: базовый уровень
  • Направление: Анализ данных
  • Навыки: владение NumPy, pandas, matplotlib, seaborn, random
  • Инструменты: Python, Pandas, NumPy, RNA-seq, GitHub
  • Документ об образовании: удостоверении о повышении квалификации НГУ

Эксперты образовательного модуля:

  • Егор Олегович Укладов, преподаватель НГУ, преподаватель кафедры биологии СУНЦ НГУ, сотрудник центра коллективного пользования «Сибирский кольцевой источник фотонов»
  • Бобровских Александр Владимирович, старший преподаватель ФЕН НГУ, м.н.с. ИЦИГ СО РАН