Сценарий "Эпигеномное секвенирование" предназначен для идентификации гипер- и гипометилированных CpG-островков для исследования генной экспрессии и регуляции на основе данных мономолекулярного секвенирования (рисунок 1).
Рисунок 1 – Схема сценария "Эпигеномное секвенирование эукариот" на платформе BioUML
Рассматриваемый сценарий состоит из 8 основных шагов (см. Таблица 1). Краткое описание используемых программ, их входных и выходных данных приведено в таблице 2.1.
Таблица 1 – Список входных данных и результатов использования сценария "Эпигеномное секвенирование эукариот"
№ | Описание шага | Используемые программы |
---|---|---|
1 | Выравнивнивание консенсусных прочтений на референсный геном | pbmm2 |
2 | Вычисление химико-кинетических параметров полимеразы для каждого прочитанного нуклеотида, поиск сайтов модификации (метилирования) | primrose |
3 | Идентификация однонуклеотидных полиморфизмов | deepvariant |
4 | Фазирование идентифицированных полиморфизмов | whatshap phase |
5 | Анализ структурного контекста сайтов модификации. Внесение информации о принадлежности к гаплогруппе в bam-файл с выравниванием CCS ридов на референсный геном | whatshap haplotag |
6 | Идентификация метилированных оснований | pb-CpG-tools |
В таблице 2 приведены типы входных и выходных данных рассматриваемого сценария. Интерфейс пользователя, а также параметры запуска сценария приведены в примере ниже.
Таблица 2 – Список входных данных и результатов использования сценария "Эпигеномное секвенирование эукариот"
Тип данных | Формат данных |
---|---|
Входные данные | |
Данные одномолекулярного секвенирования: консенсусные прочтения | BAM |
Референсный геном | FASTA |
Результаты | |
Результаты выравнивания консенсусных прочтений на референсный геном с дополнительной информацией о принадлежности прочтений к гаплогруппам | BAM |
Однонуклеотидные полиморфизмы | VCF |
Координаты метилированных CpG островков | BED |
Координаты метилированных CpG островков, соответствующие различным гаплотипам | BED |
Профили метилирования цитозина в формате bigWig для отображения в геномном браузере и ассоциации их с геномными мотивами и структурным контекстом | bigWig |
Отчёт о результатах идентификации гипер- и гипометилированных CpG-островков | HTML |
Отчёты о результатах поиска однонуклеотидных полиморфизмов | HTML |
Используемые референсные базы данных: см. пункт 2.1
Сценарий предназначен для идентификации гипер- и гипометилированных CpG-островков для исследования генной экспрессии и регуляции на основе данных мономолекулярного секвенирования (рисунок 2). Данный сценарий решает задачи сценария, описанного в пункте 2.6 приложения №2 ТЗ.
Рисунок 2 – Интерфейс запуска сценария "Эпигеномное секвенирование эукариот"
В проекте "Sequencer examples" перейдите в директорию "Epigenetics Analysis". Для просмотра структуры сценария в графическом виде кликните правой кнопкой мыши на WDL-сценарий "Epigenetics_analysis_workflow.wdl". В открывшемся меню выберите пункт "Open image". Результат представлен на рисунке 3.
Рисунок 3 – Графическое представление структуры сценария "Эпигеномное секвенирование эукариот"
Заполните параметры запуска сценария, используя значения из таблицы 3. В результате работы сценария будут получены выходные данные, также указанные в таблице 3 (Выходные данные).
Таблица 3 – Параметры сценария "Эпигеномное секвенирование эукариот"
Параметр | Формат | Значение* | Краткое описание |
---|---|---|---|
Входные данные и параметры | |||
epigenetics_analysis.ref_fasta | BAM | Input/chr20_demo.fa | Данные одномолекулярного секвенирования (CCS subreads) |
epigenetics_analysis.bam | FASTA | Input/hg002.chr20_demo.hifi.bam | Референсный геном |
outFolder | Папка | Results/Eukaryote | Путь до директории с результатами |
| | Выходные данные | | | BAM | Results/Eukaryote/primrose.bam | Результаты выравнивания консенсусных прочтений на референсный геном с дополнительной информацией о принадлежности прочтений к гаплогруппам | | | VCF | Results/Eukaryote/deepvariant_snp.vcf | Однонуклеотидные полиморфизмы | | | HTML | Results/Eukaryote/deepvariant_snp.visual_report.html | Отчёты о результатах поиска однонуклеотидных полиморфизмов | | | BED | Results/Eukaryote/out.combined.denovo.bed | Координаты метилированных CpG островков | | | BED | Results/Eukaryote/out.hap1.denovo.bed Results/Eukaryote/out.hap2.denovo.bed | Координаты метилированных CpG островков, соответствующие различным гаплотипам | | | bigWig | Results/Eukaryote/out.combined.denovo.bw | Профили метилирования цитозина | | | bigWig | Results/Eukaryote/out.hap1.denovo.bw Results/Eukaryote/out.hap2.denovo.bw | Профили метилирования цитозина, соответствующие различным гаплотипам | | | HTML | Results/Eukaryote/report.html | Отчёт о результатах идентификации гипер- и гипометилированных CpG-островков |
* - указан путь относительно директории data/Collaboration/Sequencer examples/Epigenetics Analysis/