Skip to content

Разработка модели биологических часов

Notifications You must be signed in to change notification settings

DrXlor/ML_BioAge

Repository files navigation

Общий смысл задачи

Определить Хронологический возраст человека по характеристикам (метилированию) днк. (регрессия)

Описание входных данных

Входные данные представляют собой два файла, первый - SSV файл, содержащий некоторую второстепенную информацию о людях, их биологический возраст и отметку о наличии синдрома дауна у самого человека, брата/сестры, матери. На данном этапе, из этого датасета, нам понадобится лишь признак возраста как таргет. Остальная информация будет опущена. Общее количество людей представленных в выборке - 87.

Второй файл представляет собой многомерный NPZ файл, из которого нам понадобится лишь файл содержащий метилирование ДНК для разных людей, где объект - человек, признаки - CPG его днк (метилирование). Значения признаков (???). Общее количество признаков - 450к.

Описание области работы

Область данного исследования - машинное обучение в задачах биомедицины и эпигенетики. Данная область подразумевает совместную работу специалистов из данных областей, где машинное обучение позволит получить вещественные результаты в ходе совместной работы. Поскольку эпигенетические данные о метилировании имеют такие особенности как однородность и имеет формат HDLSS, требуются особые подходы в разработке модели. Дополнительно, выдвигаются требования по объяснимости модели, машинное обучение в данной области должно оставаться прозрачным, для подтверждения качества результатов. Так же стоит отметить, что специфика области подразумевает требования к устойчивости модели, поскольку ошибки во время решения вещественной задачи могут иметь критический характер.

About

Разработка модели биологических часов

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published