Evo 2는 Arc Institute의 연구진이 NVIDIA와 협력하여 개발한 대규모 AI 모델로, 2025년 2월 19일에 발표되었습니다. 이 모델은 100,000종 이상의 생물의 DNA 데이터를 학습하여, 생명체의 유전자 서열에서 패턴을 식별하고 새로운 유전체를 설계하는 데 활용됩니다. Evo 2는 9.3조 개의 뉴클레오타이드 데이터를 기반으로 훈련되었으며, 인간, 식물, 단세포 및 다세포 생물을 포함한 다양한 생물의 유전체 정보를 포함하고 있습니다. 이 모델은 질병을 유발하는 돌연변이를 정확하게 식별하고, 새로운 생물학적 도구나 치료법 개발에 기여할 수 있습니다.
https://arcinstitute.org/news/blog/evo2
AI can now model and design the genetic code for all domains of life with Evo 2 | Arc Institute
Arc Institute develops the largest AI model for biology to date in collaboration with NVIDIA, bringing together Stanford University, UC Berkeley, and UC San Francisco researchers
arcinstitute.org
Evo 2는 유전자 서열에서 질병을 유발하는 돌연변이를 식별하기 위해 대규모 유전체 데이터 학습, 진화적 정보 분석, 그리고 생물학적 기능 예측 모델링을 결합합니다. 아래에서 Evo 2가 질병 유발 돌연변이를 식별하는 과정을 단계별로 설명합니다.
🧬 Evo 2의 질병 유발 돌연변이 식별 과정
1️⃣ 대규모 유전체 데이터 학습
- Evo 2는 100,000종 이상의 생물에서 수집된 9.3조 개의 뉴클레오타이드 데이터를 기반으로 학습합니다.
- 이 데이터에는 인간 유전체와 함께 다양한 생물종의 유전자 변이 및 기능 정보가 포함됩니다.
✅ 효과:
- 다양한 종의 유전자 서열을 비교함으로써, 진화적으로 보존된 중요한 유전자 부위를 식별할 수 있습니다.
- 중요한 부위에 돌연변이가 발생하면 기능 장애나 질병을 유발할 가능성이 높습니다.
2️⃣ 진화적 패턴 분석 (진화적 보존성 평가)
- 진화적으로 보존된 서열은 생물의 생존과 직결되기 때문에 변화에 민감합니다.
- Evo 2는 다수 종의 유전체를 비교하여 어떤 부위가 오랜 기간 동안 변하지 않았는지 파악합니다.
✅ 왜 중요한가?
- 보존된 부위 + 돌연변이 발생 → 해당 변이는 질병이나 기능 장애를 유발할 확률이 높습니다.
- 변이가 자주 발생하는 부위 → 기능적으로 덜 중요한 영역일 수 있습니다.
3️⃣ 단백질 구조 및 기능 예측
- DNA 서열 변이가 단백질 아미노산 서열 변화를 초래할 경우, Evo 2는 이를 단백질 구조 변화로 연결하여 예측합니다.
- 구조 변화가 단백질의 기능적 영역(예: 활성 부위, 결합 부위)에 영향을 미치면 질병을 유발할 가능성이 높습니다.
✅ 방법:
- AlphaFold와 유사한 예측 기법을 활용하여 돌연변이 전후 단백질 구조 차이를 평가합니다.
- 구조적 안정성 저하나 활성 부위 손상 여부를 분석합니다.
4️⃣ 임상 및 유전적 변이 데이터 통합
- Evo 2는 ClinVar, HGMD와 같은 유전 질환 데이터베이스와의 연계를 통해 기존에 알려진 질병 연관 변이를 학습합니다.
- 새로 발견된 변이가 이전에 알려진 질병 유발 변이와 유사한 패턴을 보이면, 질병 연관 가능성이 높다고 평가합니다.
✅ 결과:
- 새로운 변이에 대한 질병 연관성 확률 점수를 제공합니다.
- 이를 통해 연구자나 임상의가 잠재적 위험도를 파악할 수 있습니다.
5️⃣ 시뮬레이션 및 기능적 영향 예측
- Evo 2는 변이가 유전체 내에서 조절 영역(프로모터, 인핸서) 또는 스플라이싱 부위에 미치는 영향을 시뮬레이션합니다.
- 조절 부위의 변이는 유전자 발현량 변화로 이어져 질병을 유발할 수 있습니다.
✅ 예시:
- 스플라이싱 오류 → 비정상 단백질 생성 → 유전 질환 발생
- 인핸서 변이 → 특정 유전자 발현 저하 → 대사 질환 발생
🚀 Evo 2의 식별 방식 요약
단계 설명 결과
유전체 데이터 학습 | 수많은 종의 유전체 비교 및 변이 패턴 학습 | 중요한 유전자 부위 파악 |
진화적 보존성 평가 | 변이가 발생한 위치의 진화적 중요성 분석 | 고위험 변이 식별 |
단백질 구조 예측 | 변이가 단백질 구조와 기능에 미치는 영향 예측 | 기능 손상 여부 파악 |
임상 데이터 통합 | 알려진 질병 유발 변이와 유사성 비교 | 질병 연관성 확률 제공 |
기능적 영향 시뮬레이션 | 유전자 발현 및 스플라이싱 변화 예측 | 유전적 질환 위험 예측 |
🩺 실생활 적용 예시
- BRCA1 유전자 변이 탐지: Evo 2는 BRCA1 유전자에서 암 관련 변이를 식별하고, 암 발생 위험도를 예측할 수 있습니다.
- 희귀 유전 질환 진단 지원: 알려지지 않은 돌연변이가 발견되었을 때, Evo 2의 예측 결과로 진단 및 치료 방향 결정에 도움을 줍니다.
🧾 결론
Evo 2는 진화적 정보, 구조 및 기능 예측, 임상 데이터 통합을 통해 질병 유발 가능성이 높은 변이를 식별합니다.
이는 조기 질병 진단, 맞춤형 치료 개발, 그리고 유전 질환 예방에 큰 기여를 할 수 있습니다.
'Articles' 카테고리의 다른 글
人は所詮、なるようにしかならない。不幸とは夢中になれることから目を逸らせて自分を不自然にたわめていくことの中にある (1) | 2025.02.23 |
---|---|
안개 수집의 원리 (0) | 2025.02.23 |
2025년, 애플은 영국에서 아이클라우드의 고급 데이터 보호(Advanced Data Protection, ADP) 기능 제공 중단 (0) | 2025.02.22 |
東京都医師会 副会長葛西中央病院院長、整形外科医土谷明男 先生 (2) | 2025.02.17 |
医師・医療ジャーナリスト森田豊先生 (免疫力アップの方法 ) (0) | 2025.02.11 |