Биоинформатика в NGS

18000,00
р.
Этот модуль предназначен для биоинформатиков и научных сотрудников, начинающих работу с данными секвенирования нового поколения (NGS) и нуждающихся в целостном понимании процесса анализа. Программа ориентирована на тех, кто хочет не просто запускать готовые пайплайны, а понимать логику каждого этапа и уметь оценивать достоверность полученных результатов. Модуль последовательно охватывает полный классический цикл анализа NGS-данных — от оценки качества сырых прочтений до поиска и аннотации генетических вариантов — с использованием ключевых инструментов, применяемых в современной научной и прикладной практике.

Входит в состав образовательной траектории
"Разработчик биоинформатических пайплайнов"

Сложность: продвинутый уровень

Направление: Биоинформатика

Направление: Геномный анализ

Преподаватель: Вихорев Александр

Уровень сложности: Продвинутый

Инструменты: FastQC

Инструменты: Mutect2

Инструменты: DeepVariant

Инструменты: Ensembl VEP

Инструменты: BWA

Инструменты: GATK

Инструменты: Fastp

Инструменты: Picard

Инструменты: Mosdepth

Инструменты: Strelka

Инструменты: CNVkit

Инструменты: MultiQC

Подробная информация о блоке
Программа обучения
Характеристики образовательного модуля

Подробная информация о блоке

Анализ данных NGS представляет собой многоэтапный процесс, в котором ошибки на ранних стадиях могут существенно повлиять на итоговые результаты. Отсутствие понимания принципов контроля качества, выбора параметров и интерпретации выходных файлов приводит к тому, что анализ становится «чёрным ящиком», а достоверность найденных вариантов вызывает сомнения.

В рамках модуля слушатели поэтапно изучают классический пайплайн анализа данных секвенирования. Сначала рассматриваются методы оценки качества исходных данных, фильтрации и очистки прочтений. Далее разбираются принципы картирования прочтений на референсный геном и поиска генетических вариантов различных типов. Завершающие этапы посвящены аннотации найденных вариантов и проверке точности работы пайплайнов.
Модуль делает акцент на понимании того, что именно происходит на каждом шаге анализа, какие параметры влияют на результат и как интерпретировать полученные данные с точки зрения биологического смысла.

Для кого этот модуль:
  • Биоинформатики, начинающие работать с данными NGS.
  • Научные сотрудники и аспиранты, анализирующие данные секвенирования.
  • Специалисты, которым необходимо понимать логику и ограничения стандартных NGS-пайплайнов.
  • Пользователи, желающие научиться оценивать качество и достоверность результатов анализа.

Что вы получите после прохождения модуля:
  • Понимание полного цикла анализа данных секвенирования нового поколения.
  • Навык оценки качества сырых NGS-данных и их очистки.
  • Умение выполнять картирование прочтений на референсный геном.
  • Практический опыт поиска генетических вариантов (SNP, indel, CNV).
  • Навыки функциональной аннотации вариантов и интерпретации результатов.
  • Способность оценивать корректность работы пайплайнов и достоверность полученных данных.

Программа обучения

Тема 1. Оценка качества данных, фильтрация и тримминг прочтения
Содержание
Оценка качества данных. Метрики качества секвенирования Запуск программ для оценки качества. Фильтрация и тримминг.
Практическая работа
Запустить программы для оценки качества и фильтрации прочтений. Изучить отчет с метриками качества образца
Самостоятельная работа
Изучение учебно-методических материалов (памятки, статьи).

Тема 2. Картирование на референсный геном
Содержание
Картирование на геном. Оценка качества картирования. Постобработка картирования (маркирование дупликатов, BQSR).
Практическая работа
Картирование на геном и оценка качества. Написать скрипт для запуска программы для картирования прочтений на геном, а также запустить программу для маркирования дупликатов в прочтениях
Самостоятельная работа
Изучение учебно-методических материалов (памятки, статьи).

Тема 3. Поиск мутаций: SNP, indel, CNV
Содержание
Поиск герминальных и соматический мутаций (SNP, Indel). Поиск вариантов числа копий (CNV).
Практическая работа
Поиск мутаций различного типа в данных.
Написать скрипт для запуска программы для поиска мутаций (DeepVariant, CNVkit)
Самостоятельная работа
Изучение учебно-методических материалов (памятки, статьи).

Тема 4. Аннотация
Содержание
Аннотация вариантов. Проверка точности пайплайнов.
Практическая работа
Аннотация вариантов. Написать скрипт для запуска программы для аннотации вариантов (Ensembl VEP)
Самостоятельная работа
Изучение учебно-методических материалов (памятки, статьи).

Тема 5. Проверка точности пайплайнов
Содержание
Специфика и примеры использования каждой технологии. Общее начало (тримминг, картирование), специфичные ответвления, сборка транскриптома/генома/метагенома.
Самостоятельная работа
Изучение учебно-методических материалов (памятки, статьи).

Итоговая аттестация

Характеристики образовательного модуля

Характеристики образовательного модуля:

  • Продолжительность: 36 ак. ч.
  • Сложность: продвинутый уровень
  • Направление: Биоинформатика / Геномный анализ
  • Навыки: Анализ NGS-данных, контроль качества, поиск генетических вариантов, интерпретация результатов
  • Инструменты: FastQC, Mutect2, DeepVariant, Ensembl VEP, BWA, GATK, Fastp, Picard, Mosdepth, Strelka, CNVkit, MultiQC
  • Документ об образовании: удостоверении о повышении квалификации НГУ

Эксперт образовательного модуля:

  • Александр Викторович Вихорев, заведующий лабораторией бионформатики, разработчик цикла видеокурсов по биоинформатике и молекулярной биологии