Skip to content

Commit

Permalink
Update README.ko.md
Browse files Browse the repository at this point in the history
2020/02/28
  • Loading branch information
Bue-von-hon authored Feb 28, 2020
1 parent 87b97b5 commit ca6bd02
Showing 1 changed file with 4 additions and 3 deletions.
7 changes: 4 additions & 3 deletions README.ko.md
Original file line number Diff line number Diff line change
Expand Up @@ -15,13 +15,14 @@ CASP는 이미 알고는 있지만 공개되지 않은, 단백질 구조에 대

단백질 구조 예측은 생화학 분야에서 가장 어려운 문제 중 하나 입니다. 이 문제는 생물학과 화학분야에서 중요한 주제이지만 머신러닝 커뮤니티에서는 생소한 분야입니다.
이는 두가지 이유때문이라고 추측됩니다. 1. 높은 진입 장벽 2. 표준화의 부재 이 두가지 문제가 해결된다면 단백질 구조 예측은 비전인식, 음성인식과 더불어 머신러닝의 주요 분야가 될 수 있습니다.
ImageNet이 컴퓨터 비전 기술 발전의 원동력이 되었듯이 ProteinNet은 머신 러닝 분야의 단백질 구조 부분에서 누구든 쉽게 시작 할 수 있도록 표준화된 데이터셋과 트레이닝, 평가, 테스트를 제공 할 것입니다.
[ImageNet](https://www.image-net.org) 컴퓨터 비전 기술 발전의 원동력이 되었듯이 ProteinNet은 머신 러닝 분야의 단백질 구조 부분에서 누구든 쉽게 시작 할 수 있도록 표준화된 데이터셋과 트레이닝, 평가, 테스트를 제공 할 것입니다.


## 접근법

CASP 대회는 2년에 한번 열립니다. 이 대회는 최근에 밣혀 졌지만, 아직 공개되지 않은 단백질 서열에 대한 구조를 전세계에 걸쳐 해결하게 됩니다.
대회 참가자들은 이런 구조들에 대해 블라인드 예측을 하고 정확성을 평가받게 됍니다.
CASP 대회는 2년에 한번 열립니다. 이 대회에서는 최근에 밣혀 졌지만, 아직 공개되지 않은 단백질 서열에 대한 구조를 전세계 참가자들이 해결하게 됩니다.
대회 참가자들은 이런 구조들에 대해 블라인드 예측을 하고 정확성을 평가받게 됍니다. 따라서 CASP 구조는 특정 시점에서 얼마나 예측이 잘 되었는가에 대한 표준화된 기준점을 제공합니다. ProteinNet의 기본적인 생각은 CASP 테스트 셋을 사용하여 CASP에 편승하는 것 입니다. Proteinnet은 훈련, 평가용 데이터를 CASP 실험 이전의 조건을 재설정 함으로써 테스트 셋을 보완합니다. 특히 Proteinnet은 사용 가능한 서열과 구조를 시작 전에 제한합니다. 이건 [BLAST](https://blast.ncbi.nlm.nih.gov/Blast.cgi)와 같은 표준 데이터베이스는 히스토리 버전을 유지하지 않으므로 중요합니다.
우리는 [UniParc](https://www.uniprot.org/uniparc/)의 타임리셋 버전과 [JGI](https://img.jgi.doe.gov/)에서 metagenomic 시퀀스를 사용하는데, MSA를 도출하는 시퀀스 데이터베이스 구축을 위해 이 두가지를 사용합니다.

# 하루 한줄 번역

Expand Down

0 comments on commit ca6bd02

Please sign in to comment.