유전자족

Gene family
쥐유전자과 계통수

유전자 패밀리는 하나의 원래 유전자의 복제에 의해 형성되고 일반적으로 유사한 생화학적 기능을 가진 여러 개의 유사한 유전자의 집합이다.그러한 가족 중 하나는 인간 헤모글로빈 서브유닛의 유전자이다; 10개의 유전자는 α-글로빈β-글로빈 위치라고 불리는 다른 염색체 위의 두 개의 클러스터에 있다.이 두 개의 유전자 클러스터는 약 5억 년 [1]전에 복제된 전구 유전자의 결과로 생겨난 것으로 생각된다.

유전자는 공유된 뉴클레오티드 또는 단백질 배열에 따라 가족으로 분류된다.계통 발생 기술은 보다 엄격한 테스트로 사용될 수 있습니다.부호화 시퀀스 내의 엑손의 위치는 공통 조상을 추론하는 데 사용될 수 있다.유전자에 의해 암호화된 단백질의 서열을 아는 것은 연구자들이 DNA 서열의 유사성이나 차이점보다 더 많은 정보를 제공하는 단백질 서열의 유사성을 찾는 방법을 적용할 수 있게 한다.

유전자 패밀리의 유전자가 단백질을 부호화하면 단백질 패밀리라는 용어는 유전자 패밀리와 유사한 방식으로 사용되는 경우가 많다.

특정 혈통을 따라 유전자 패밀리가 확장 또는 수축하는 것은 우연에 의한 것일 수도 있고 자연선택의 [2]결과일 수도 있다.이 두 경우를 구별하는 것은 종종 실제로 어렵다.최근 연구는 자연선택의 [3]영향을 받는 유전자 패밀리를 검출하기 위해 통계 모델과 알고리즘 기술의 조합을 사용한다.

Hugo Gene Nomenclature Committee(HGNC)는 개별 [4][5]구성원을 구별하기 위한 계층적 번호 체계와 함께 유전자 패밀리 구성원에 대한 "줄기"(또는 "뿌리") 기호를 사용하여 명명 체계를 작성한다.예를 들어 페르옥시레독신 패밀리의 경우 PRDX가 루트 기호이며, 패밀리는 PRDX1, PRDX2, PRDX3, PRDX4, PRDX5PRDX6이다.

기본구조

유전자 계통 발생은 회색종 계통 발생의 선이다.Top: 조상 유전자 복제는 두 개의 패럴로그를 생성한다(히스톤 H1.1과 1.2).종분화 이벤트는 두 딸 종(인간과 침팬지)에서 맞춤법을 생산합니다.바닥: 다른 종(대장균)에서, 유전자는 유사한 기능(히스톤과 같은 핵구조를 이루는 단백질)을 가지고 있지만, 별개의 진화적 기원을 가지고 있고, 유사체도 마찬가지이다.

게놈 구성의 한 단계는 유전자를 여러 개의 유전자 [6][7]패밀리로 묶는 것이다.유전자 패밀리는 공통의 조상을 공유하는 연관된 유전자 그룹이다.유전자 패밀리의 구성원들은 마비 또는 정형외과일 수 있다.유전자 패럴로그는 같은 종 내에서 유사한 서열을 가진 유전자이고, 유전자 오솔로그는 다른 종에서 유사한 서열을 가진 유전자이다.유전자 패밀리는 크기, 배열 다양성, 배열이 매우 다양합니다.가족 내 유전자의 다양성과 기능에 따라, 가족은 다인종 가족 또는 슈퍼 [6][8]패밀리로 분류될 수 있다.

다중 유전자군은 일반적으로 유사한 염기서열과 기능을 가진 구성원으로 구성되지만 높은 수준의 발산(순서 및/또는 기능 수준에서)이 유전자 제품군에서 유전자를 제거하지 않는다.가족 내 개별 유전자는 동일한 염색체 상에 서로 가까이 배치되거나 다른 염색체 상의 게놈 전체에 분산될 수 있다.이들의 배열과 기능의 유사성으로 인해 가족 내 개별 유전자는 종종 조절 제어 [6][8]요소를 공유한다.어떤 경우에, 유전자 구성원들은 동일한 (또는 거의 동일한) 염기서열을 가지고 있다.이러한 가족들은 필요에 따라 많은 양의 유전자 생성물이 단시간에 발현되도록 한다.다른 패밀리는 유사하지만 특정한 생산물이 다른 세포 유형이나 유기체 [6]발달의 다른 단계에서 발현되는 것을 허용한다.

슈퍼패밀리는 단일 다세대 가족보다 훨씬 더 크다.슈퍼패밀리는 다중 유전자 패밀리뿐만 아니라 단일 개별 유전자 멤버를 포함한 최대 수백 개의 유전자를 포함합니다.많은 수의 구성원은 슈퍼패밀리가 어떤 유전자는 뭉쳐있고 어떤 유전자는 멀리 떨어져 있는 상태로 널리 분산될 수 있도록 한다.그 유전자들은 다양한 수준의 발현과 분리된 조절 [6][8]조절을 나타내는 배열과 기능에서 다양합니다.

몇몇 유전자 패밀리는 또한 확립된 유전자 배열과 매우 유사하지만 [9]기능하지 않는 DNA 배열인 의사유전자를 포함한다.다양한 종류의 의사유전자가 존재합니다.미처리 의사유전자는 시간이 지남에 따라 획득된 돌연변이가 기능하지 않게 된 유전자이다.가공된 가성유전자는 [8][9]역이식에 의해 게놈 주위를 이동하면서 기능을 상실한 유전자다.그들이 유래한 유전자 패밀리에서 분리된 의사 유전자는 [6]고아라고 불린다.

형성

유전자 패밀리는 조상 유전자의 여러 복제로부터 발생했고, 그 뒤 돌연변이와 [6]발산이 뒤따랐다.중복은 계통 내에서 발생할 수 있다(예를 들어, 인간은 침팬지에서 단 한 번만 발견되는 두 개의 유전자 복사본을 가질 수 있다). 또는 그들은 분화의 결과이다.예를 들어, 인간과 침팬지의 조상에 있는 단일 유전자는 현재 두 종 모두에서 발생하며 분화를 통해 '복제'되었다고 생각할 수 있다.종분화에 의한 복제의 결과로, 하나의 유전자 패밀리는 15개의 다른 종에 각각 하나의 복제인 15개의 유전자를 포함할 수 있다.

복제

유전자 패밀리의 형성에는, 1)외전 복제 및 셔플링, 2)전체 유전자 복제, 3)다이지엔 패밀리 복제, 4)전체 게놈 복제의 4개의 레벨이 존재한다.엑손의 복제와 교환은 변형과 새로운 유전자를 낳는다.그 후 유전자는 복제되어 다염색체를 포함하는 슈퍼패밀리를 형성한다.전체 게놈 복제는 모든 유전자와 유전자 [6]패밀리의 복제 수를 두 배로 늘린다.전체 게놈 복제 또는 다배체화는 자동중합 또는 동종다배체화가 될 수 있다.자기다중배체는 같은 게놈을 복제하는 것이고, 다중배체는 서로 밀접하게 관련된 두 게놈 또는 다른 [8]종에서 교배된 게놈을 복제하는 것이다.

복제는 주로 생식세포의 감수분열에서 일어나는 사건들에 대한 불균일한 교차를 통해 일어난다. (1,2) 두 염색체가 어긋나면, 교차 - 유전자 대립 유전자의 교환 - 하나의 염색체는 유전자 수를 증가시키거나 증가시키고 다른 염색체는 유전자 수를 감소시키거나 증가시킨다.유전자 클러스터의 확대는 더 큰 유전자 [6][8]패밀리로 이어지는 유전자의 복제이다.

재배치

슈퍼패밀리 내 다인자 패밀리 또는 다인자 패밀리의 유전자 구성원은 조상 유전자의 복제 후 이들 유전자의 재배치로 인해 다른 염색체 상에 존재한다.전이성 요소는 유전자의 이동에 역할을 한다.전이성 요소는 5'와 3' 끝에서 역반복으로 인식된다.두 개의 전이성 원소가 염색체 상의 같은 영역에 충분히 가까울 때, 그들은 복합 트랜스포존을 형성할 수 있다.단백질 전달효소는 가장 바깥쪽의 역반복반응을 인식하여 DNA 세그먼트를 절단합니다.두 트랜스포저블 요소 사이의 유전자는 복합 트랜스포존이 [6]게놈의 새로운 영역으로 점프함에 따라 재배치된다.

역전사는 유전자 이동의 또 다른 방법이다.유전자의 mRNA 전사는 역전사되거나 DNA로 복사된다.이 mRNA의 새로운 DNA 복사는 게놈의 다른 부분에 통합되어 유전자 패밀리가 [8]흩어지는 결과를 초래한다.

특별한 유형의 다인자가족은 유전자 패밀리와 유전자 패밀리의 이동에 관여한다.LINE(Long Interspended Elements) SINE(Short Interspended Elements) 패밀리는 게놈 전체에 퍼져 있는 매우 반복적인 DNA 배열입니다.LINEs는 역전사효소 단백질을 코드하는 배열을 포함한다.이 단백질은 LINE과 SINE의 RNA 전사물을 DNA로 다시 복사하는 것을 돕고 그것들을 게놈의 다른 영역으로 통합합니다.이를 통해 LINE 및 SINE 제품군의 성장을 스스로 확인할 수 있습니다.이러한 요소의 매우 반복적인 특성 때문에 LINE과 SINE은 서로 가까이 있을 때 단일 유전자 복제와 유전자 패밀리 [6][8]형성을 야기하는 사건에 대한 불평등한 교차를 유발한다.

발산

아미노산의 치환을 초래하는 비동명 돌연변이는 중복 유전자 복사를 증가시킨다.복제는 같은 유전자의 여러 복제를 발생시켜 돌연변이가 허용되는 수준의 중복성을 제공한다.그 유전자의 기능하는 복사본 한 개로, 다른 복사본들은 유기체에 매우 해롭지 않게 돌연변이를 획득할 수 있다.돌연변이는 중복 유전자가 새로운 기능이나 다른 기능을 [8]획득하도록 한다.

조화로운 진화

몇몇 다인종들은 개별 유전자 구성원들이 동일하거나 거의 동일한 염기서열을 공유하며 매우 동질적이다.유전자 패밀리가 높은 균질성을 유지하는 과정은 조합된 진화이다.일치된 진화는 사건에 대한 불평등한 교차의 반복된 사이클과 유전자 이동과 전환의 반복된 사이클을 통해 일어난다.불균등한 교배는 유전자 패밀리의 확장과 축소로 이어진다.유전자 패밀리는 자연선택이 작용하는 최적의 크기 범위를 가지고 있다.수축은 다른 유전자 복제를 삭제하고 유전자 패밀리가 너무 커지는 것을 막는다.팽창은 잃어버린 유전자 복제를 대체하고 유전자 패밀리가 너무 작아지는 것을 막는다.유전자 이동과 전환의 반복 주기는 유전자 가족 구성원을 점점 [6]더 비슷하게 만든다.

유전자 이동 과정에서 대립 유전자 변환이 편향된다.유전자 패밀리에서 균질성을 향해 퍼지는 돌연변이 대립 유전자는 모집단에서 고정성을 향해 퍼지는 유리한 대립 유전자와 동일한 과정이다.유전자 변환은 또한 경우에 [10]따라서는 유전자 변이를 만드는 데 도움을 준다.

진화

게놈의 정보 저장 계층의 일부인 유전자 패밀리는 다세포 유기체의 진화와 다양성에 큰 역할을 한다.유전자 패밀리는 정보와 유전적 [6]다양성의 큰 단위이다.진화하면서, 유전자 패밀리는 새로운 유전자 패밀리가 형성되고 일부 유전자 패밀리가 없어지면서 확장되고 수축되었다.몇몇 진화적 계통에서 유전자는 비교적 같은 속도로 획득되고 손실된다.유전자 패밀리의 적응적 확장은 자연 선택이 추가적인 유전자 복제를 선호할 때 일어난다.이것은 환경 스트레스 요인이 생물에게 작용하는 경우이다.유전자 증폭은 박테리아에서 더 흔하고 가역적인 과정이다.유전자 패밀리의 적응성 수축은 일반적으로 기능 돌연변이의 축적에서 비롯된다.유전자 전사를 조기에 정지시키는 난센스 돌연변이가 모집단에서 고정되면서 유전자 손실을 초래한다.이 과정은 환경의 변화가 유전자를 [7]중복시킬 때 발생한다.

새로운 유전자 패밀리는 고아 유전자(고립된 유사 유전자)에서 유래한다.이 고립된 유전자들은 다른 방법으로 발생한다.유전자 복제는 원래의 유전자 패밀리의 일부로서 더 이상 인식되지 않을 정도로 충분히 분산되거나 게놈에 대한 새로운 유전자의 수평 이동 또는 비부호화 배열로부터의 새로운 유전자에 기인하는 충분한 돌연변이를 축적한다.이 고아 유전자들은 가족을 형성하기 위해 복제, 재배치, 분리의 과정을 거친다.유전자 패밀리 사망은 유전자의 손실이 유전자 패밀리 전체의 손실로 이어질 때 발생한다.유전자의 지속적인 손실은 결국 유전자 패밀리의 멸종을 초래한다.유전자 손실은 유전자의 소실 또는 의사유전자가 [7]되는 완전한 기능 상실일 수 있다.

기능 패밀리

HGNC는 진화에 의한 분류(구조 유전자 패밀리) 외에도 줄기 명명법에 [11]기능별로 유전자 패밀리를 만든다.결과적으로, 줄기는 또한 같은 기능을 가진, 종종 같은 단백질 복합체의 일부인 유전자를 언급할 수 있다.예를 들어, BRCA1과 BRCA2는 모두 유방암에서의 역할로 명명된 관련 없는 유전자이며, RPS2RPS3는 동일한 작은 서브유닛에서 발견되는 관련 없는 리보솜 단백질이다.

HGNC는 또한 "제네 그룹"(이전 "제네 패밀리") 분류를 유지합니다.유전자는 여러 그룹의 구성원이 될 수 있으며, 모든 그룹은 계층을 형성합니다.줄기 분류와 마찬가지로 구조 그룹과 기능 그룹이 모두 존재합니다.[4][5]

「 」를 참조해 주세요.

레퍼런스

  1. ^ Nussbaum, Robert L.; McInnes, Roderick R.; Willard, ikksiiskHuntington F. (2016). Thompson & Thompson Genetics in Medicine (8th ed.). Philadelphia, PA: Elsevier. p. 25. ISBN 978-1-4377-0696-3.
  2. ^ 하틀, D.L., 클라크 A.G. 2007년집단 유전학의 원리.7장, 372쪽.
  3. ^ Demuth, Jeffery P.; Bie, Tijl De; Stajich, Jason E.; Cristianini, Nello; Hahn, Matthew W.; Borevitz, Justin (20 December 2006). "The Evolution of Mammalian Gene Families". PLOS ONE. 1 (1): e85. Bibcode:2006PLoSO...1...85D. doi:10.1371/journal.pone.0000085. PMC 1762380. PMID 17183716.
  4. ^ a b Daugherty, LC; Seal, RL; Wright, MW; Bruford, EA (Jul 5, 2012). "Gene family matters: expanding the HGNC resource". Human Genomics. 6 (1): 4. doi:10.1186/1479-7364-6-4. PMC 3437568. PMID 23245209.
  5. ^ a b HGNC. "Gene group help". Retrieved 2020-10-13.
  6. ^ a b c d e f g h i j k l m Hartwell, Leland H.; et al. (2011). Genetics : from genes to genomes (4th ed.). New York: McGraw-Hill. ISBN 978-0073525266.
  7. ^ a b c Demuth, JP; Hahn, MW (January 2009). "The life and death of gene families". BioEssays. 31 (1): 29–39. doi:10.1002/bies.080085. PMID 19153999. S2CID 9528185.
  8. ^ a b c d e f g h i Ohta, Tomoka (2008). "Gene families: multigene families and superfamilies". eLS. doi:10.1038/npg.els.0005126. ISBN 978-0470015902.
  9. ^ a b Nussbaum, Robert L; et al. (2015). Genetics in Medicine (8 ed.). Philadelphia: Elsevier. ISBN 9781437706963.
  10. ^ Ohta, T (30 September 2010). "Gene conversion and evolution of gene families: an overview". Genes. 1 (3): 349–56. doi:10.3390/genes1030349. PMC 3966226. PMID 24710091.
  11. ^ "What is a stem symbol?". HGNC FAQ.