Skip to content

Biosoft-ru/Epigenetics-Analysis

Repository files navigation

Сценарий "Эпигеномное секвенирование эукариот"

Сценарий "Эпигеномное секвенирование" предназначен для идентификации гипер- и гипометилированных CpG-островков для исследования генной экспрессии и регуляции на основе данных мономолекулярного секвенирования (рисунок 1).

Рисунок 1 – Схема сценария "Эпигеномное секвенирование эукариот" на платформе BioUML

Рассматриваемый сценарий состоит из 8 основных шагов (см. Таблица 1). Краткое описание используемых программ, их входных и выходных данных приведено в таблице 2.1.

Таблица 1 – Список входных данных и результатов использования сценария "Эпигеномное секвенирование эукариот"

Описание шага Используемые программы
1 Выравнивнивание консенсусных прочтений на референсный геном pbmm2
2 Вычисление химико-кинетических параметров полимеразы для каждого прочитанного нуклеотида, поиск сайтов модификации (метилирования) primrose
3 Идентификация однонуклеотидных полиморфизмов deepvariant
4 Фазирование идентифицированных полиморфизмов whatshap phase
5 Анализ структурного контекста сайтов модификации. Внесение информации о принадлежности к гаплогруппе в bam-файл с выравниванием CCS ридов на референсный геном whatshap haplotag
6 Идентификация метилированных оснований pb-CpG-tools

В таблице 2 приведены типы входных и выходных данных рассматриваемого сценария. Интерфейс пользователя, а также параметры запуска сценария приведены в примере ниже.

Таблица 2 – Список входных данных и результатов использования сценария "Эпигеномное секвенирование эукариот"

Тип данных Формат данных
Входные данные
Данные одномолекулярного секвенирования: консенсусные прочтения BAM
Референсный геном FASTA
Результаты
Результаты выравнивания консенсусных прочтений на референсный геном с дополнительной информацией о принадлежности прочтений к гаплогруппам BAM
Однонуклеотидные полиморфизмы VCF
Координаты метилированных CpG островков BED
Координаты метилированных CpG островков, соответствующие различным гаплотипам BED
Профили метилирования цитозина в формате bigWig для отображения в геномном браузере и ассоциации их с геномными мотивами и структурным контекстом bigWig
Отчёт о результатах идентификации гипер- и гипометилированных CpG-островков HTML
Отчёты о результатах поиска однонуклеотидных полиморфизмов HTML

Используемые референсные базы данных: см. пункт 2.1

Пример использования сценария "Эпигеномное секвенирование эукариот"

Сценарий предназначен для идентификации гипер- и гипометилированных CpG-островков для исследования генной экспрессии и регуляции на основе данных мономолекулярного секвенирования (рисунок 2). Данный сценарий решает задачи сценария, описанного в пункте 2.6 приложения №2 ТЗ.

Рисунок 2 – Интерфейс запуска сценария "Эпигеномное секвенирование эукариот"

В проекте "Sequencer examples" перейдите в директорию "Epigenetics Analysis". Для просмотра структуры сценария в графическом виде кликните правой кнопкой мыши на WDL-сценарий "Epigenetics_analysis_workflow.wdl". В открывшемся меню выберите пункт "Open image". Результат представлен на рисунке 3.

Рисунок 3 – Графическое представление структуры сценария "Эпигеномное секвенирование эукариот"

Заполните параметры запуска сценария, используя значения из таблицы 3. В результате работы сценария будут получены выходные данные, также указанные в таблице 3 (Выходные данные).

Таблица 3 – Параметры сценария "Эпигеномное секвенирование эукариот"

Параметр Формат Значение* Краткое описание
Входные данные и параметры
epigenetics_analysis.ref_fasta BAM Input/chr20_demo.fa Данные одномолекулярного секвенирования (CCS subreads)
epigenetics_analysis.bam FASTA Input/hg002.chr20_demo.hifi.bam Референсный геном
outFolder Папка Results/Eukaryote Путь до директории с результатами

| | Выходные данные | | | BAM | Results/Eukaryote/primrose.bam | Результаты выравнивания консенсусных прочтений на референсный геном с дополнительной информацией о принадлежности прочтений к гаплогруппам | | | VCF | Results/Eukaryote/deepvariant_snp.vcf | Однонуклеотидные полиморфизмы | | | HTML | Results/Eukaryote/deepvariant_snp.visual_report.html | Отчёты о результатах поиска однонуклеотидных полиморфизмов | | | BED | Results/Eukaryote/out.combined.denovo.bed | Координаты метилированных CpG островков | | | BED | Results/Eukaryote/out.hap1.denovo.bed Results/Eukaryote/out.hap2.denovo.bed | Координаты метилированных CpG островков, соответствующие различным гаплотипам | | | bigWig | Results/Eukaryote/out.combined.denovo.bw | Профили метилирования цитозина | | | bigWig | Results/Eukaryote/out.hap1.denovo.bw Results/Eukaryote/out.hap2.denovo.bw | Профили метилирования цитозина, соответствующие различным гаплотипам | | | HTML | Results/Eukaryote/report.html | Отчёт о результатах идентификации гипер- и гипометилированных CpG-островков |

* - указан путь относительно директории data/Collaboration/Sequencer examples/Epigenetics Analysis/

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages