Анализ данных NGS представляет собой многоэтапный процесс, в котором ошибки на ранних стадиях могут существенно повлиять на итоговые результаты. Отсутствие понимания принципов контроля качества, выбора параметров и интерпретации выходных файлов приводит к тому, что анализ становится «чёрным ящиком», а достоверность найденных вариантов вызывает сомнения.
В рамках модуля слушатели поэтапно изучают классический пайплайн анализа данных секвенирования. Сначала рассматриваются методы оценки качества исходных данных, фильтрации и очистки прочтений. Далее разбираются принципы картирования прочтений на референсный геном и поиска генетических вариантов различных типов. Завершающие этапы посвящены аннотации найденных вариантов и проверке точности работы пайплайнов.
Модуль делает акцент на понимании того, что именно происходит на каждом шаге анализа, какие параметры влияют на результат и как интерпретировать полученные данные с точки зрения биологического смысла.
Для кого этот модуль:- Биоинформатики, начинающие работать с данными NGS.
- Научные сотрудники и аспиранты, анализирующие данные секвенирования.
- Специалисты, которым необходимо понимать логику и ограничения стандартных NGS-пайплайнов.
- Пользователи, желающие научиться оценивать качество и достоверность результатов анализа.
Что вы получите после прохождения модуля:- Понимание полного цикла анализа данных секвенирования нового поколения.
- Навык оценки качества сырых NGS-данных и их очистки.
- Умение выполнять картирование прочтений на референсный геном.
- Практический опыт поиска генетических вариантов (SNP, indel, CNV).
- Навыки функциональной аннотации вариантов и интерпретации результатов.
- Способность оценивать корректность работы пайплайнов и достоверность полученных данных.