Skip to content

Commit

Permalink
Update README.ko.md
Browse files Browse the repository at this point in the history
2020/02/29
  • Loading branch information
Bue-von-hon committed Feb 29, 2020
1 parent ca6bd02 commit d09af23
Showing 1 changed file with 9 additions and 0 deletions.
9 changes: 9 additions & 0 deletions README.ko.md
Original file line number Diff line number Diff line change
Expand Up @@ -23,6 +23,15 @@ CASP는 이미 알고는 있지만 공개되지 않은, 단백질 구조에 대
CASP 대회는 2년에 한번 열립니다. 이 대회에서는 최근에 밣혀 졌지만, 아직 공개되지 않은 단백질 서열에 대한 구조를 전세계 참가자들이 해결하게 됩니다.
대회 참가자들은 이런 구조들에 대해 블라인드 예측을 하고 정확성을 평가받게 됍니다. 따라서 CASP 구조는 특정 시점에서 얼마나 예측이 잘 되었는가에 대한 표준화된 기준점을 제공합니다. ProteinNet의 기본적인 생각은 CASP 테스트 셋을 사용하여 CASP에 편승하는 것 입니다. Proteinnet은 훈련, 평가용 데이터를 CASP 실험 이전의 조건을 재설정 함으로써 테스트 셋을 보완합니다. 특히 Proteinnet은 사용 가능한 서열과 구조를 시작 전에 제한합니다. 이건 [BLAST](https://blast.ncbi.nlm.nih.gov/Blast.cgi)와 같은 표준 데이터베이스는 히스토리 버전을 유지하지 않으므로 중요합니다.
우리는 [UniParc](http:https://www.uniprot.org/uniparc/)의 타임리셋 버전과 [JGI](https://img.jgi.doe.gov/)에서 metagenomic 시퀀스를 사용하는데, MSA를 도출하는 시퀀스 데이터베이스 구축을 위해 이 두가지를 사용합니다.
더 나아가 Proteinnet은 쉬운것부터 어려운 것까지 세분화된 평가 데이터를 제공합니다.
쉬운 난이도에서는 모델이 단백질 구조의 마이너한 변화(이를테면 돌연변이)를 예측하는 능력이 어느정도 되는지 평가하는데 유용합니다.
어려운 난이도에서는 모델이 완전히 새로운 단백질 접힘(CASP Free Modeling)을 예측하는데 도움이 됩니다.
이런 평가 데이터는 모델이 데이터셋의 분포 변화를 얼마나 잘 커버하는지 테스트하기 위한 가반성 문제를 제공합니다.
우리는 이런 점을 Proteinnet의 가장 어려운 평가 셋이 CASP FM보다 어렵다는 점에서 알 수 있었습니다.

## 다운로드

Proteinnet의 기록은 두가지 형태로 제공됩니다.

# 하루 한줄 번역

Expand Down

0 comments on commit d09af23

Please sign in to comment.