DeepMind, 생물학을 변革할 수 있는 단백질 접힘 문제 해결에 임해 있다 - Unite.AI

[AI] deepmind | | 🔬 연구
#deepmind #단백질 접힘 #생물학 #인공지능 #혁신 #ai #google #review
원문 출처: [AI] deepmind · Genesis Park에서 요약 및 분석

요약

구글 딥마인드(DeepMind)는 수년이 걸리던 단백질 구조 파악 시간을 획기적으로 단축하는 '알파폴드(AlphaFold)' AI 모델을 개발했습니다. 이 알고리즘은 약 17만 개의 단백질 데이터로 훈련되었으며, 100점 만점의 CASP 평가에서 92점의 중위수를 기록하며 기존 실험실 기반 연구 방법과 맞먹는 수준의 정확도를 입증했습니다. 이에 따라 전 세계 과학자들은 알파폴드를 활용해 난치병 치료제 개발 등을 위한 인간의 수많은 미지의 단백질 기능과 구조를 빠르게 규명할 수 있게 되었습니다.

본문

Google의 AI 부문인 DeepMind는 최근에 생물학 연구에서 가장 오래된 도전 중 하나를 해결하기 위한 의미 있는 진전을 이루었다, 즉 아미노산 서열에서 단백질의 모양을 계산하는 것에 관한 것이다. Nature에 따르면, 이 획기적인 성과는 생물학과 화학 분야를 변혁시키는 잠재력을 가지고 있으며, 과학자들이 현재 신비한 많은 단백질의 기능을 결정할 수 있도록 할 것이다. 단백질의 모양은 그 기능을 정의하며, 대부분의 생물학적 기능은 단백질에 의존한다. “단백질 접힘”은 아미노산 사슬을 단백질이 그 기능을 수행하기 위해 필요한 3차원 구조로 변환하는 과정에 대한 이름이다. 과학자들이 아미노산 서열과 생성되는 단백질의 모양 사이의 관계를 결정할 수 있다면, 과학자들은 어떤 단백질이 다른 생물학적 과정에 영향을 미치는지 결정할 수 있다. 과학자들은 인간 프로테옴 내에 최소 80,000개의 단백질이 존재한다고 가정하지만, 이 중 단백질의 작은 부분만이 알려진 구조를 가지고 있다. 단백질의 모양을 결정하는 전통적인 방법은 실험실 실험을 수년간 수행해야 하며, 컴퓨터 과학 알고리즘과 모델의 힘을借りても vậy이다. DeepMind의 연구는 단백질 구조를 발견하는 과정을 크게 가속화할 수 있다. 과학자들은 단백질 구조를 신뢰성 있게 결정하기 위해 정상적인 시간의 일부만이 필요하다. DeepMind의 연구자들은 약 170,000개의 단백질 서열과 해당 서열에 대한 모양이 포함된 데이터베이스에서 알고리즘을 훈련시켰다. 연구자들이 개발한 알고리즘은 100~200개의 GPU에서 훈련되었으며, 훈련 과정은 몇 주가 걸렸다. 연구자들이 개발한 모델은 “AlphaFold”로 명명되었다. AlphaFold는 “긴장 알고리즘”을 통해 작동하며, 단백질의 작은 조각을 연결한 다음 더 큰 섹션으로 확장한다. 처음에는 아미노산 클러스터가 연결되었으며, 알고리즘은 이러한 클러스터를 연결하는 방법을 찾으려고 했다. AlphaFold 연구자들은 처음에 유전적 및 구조적 데이터에 대한 예측을 위해 전통적인 深層 학습 알고리즘을 사용하려고 시도했다. AlphaFold는 тогда 단백질의 스타일에 대한 일致성 모델을 생성했다. 이 기술이 너무 많은 제한을 가졌음이 증명되자, 연구자들은 새로운 전략을 시도했다. AlphaFold 연구 팀은 더 많은 특징에 대한 모델을 생성했으며, 이때 모델은 단백질 서열의 최종 구조에 대한 예측을 반환했다. 엔지니어링 팀은 AlphaFold를 테스트하기 위해 CASP(단백질 구조 예측의 임계 평가)라는 경쟁에 참가시켰다. 경쟁에서 컴퓨터 알고리즘은 아미노산 서열에서 단백질의 구조를 평가하기 위해 경쟁한다. 참가자들은 100개의 아미노산 서열이 주어지며, 모델은 단백질의 구조를 작업해야 한다. AlphaFold는 다른 컴퓨터 모델보다 정확성에서 우위를 점했을 뿐만 아니라 전통적인 실험실 기반 모델링 기술과도 비교할 수 있었다. AlphaFold의 최종 중위 수는 약 92/100으로, 실험실 기반 실험 방법은 90점을 받았다. 가장 어려운 단백질에서 AlphaFold의 중위 수는 87%로 떨어졌다. DeepMind의 최고 경영자이자 공동 창립자인 Demis Hassabis에 따르면, 회사는 이미 AlphaFold에 대한 연구자 접근을 계획 중이며, Max Planck Institute for Development Biology의 과학자들은 이미 10년 이상 작업한 단백질 구조를 발견하기 위해 모델을 사용하고 있다. Janet Thornton, European Bioinformatics Institute의 이사, ScienceMag를 통해 인용된 바와 같이, DeepMind의 성과는 “구조 생물학과 단백질 연구의 미래를 바꿀 것이다”라고 말했다. 한편, University of Maryland, Shady Grove의 생물학자인 John Moult는 단백질 접힘 문제가 이 평생에 해결되지 않을 것으로 생각했다고 말했다. AlphaFold는 전통적인 실험 방법을 완전히 대체하지는 않겠지만, 단백질 구조를 발견하는 속도를 크게 높일 수 있다. 연구자들은 단백질 구조를 결정하기 위해 더 적은 양의 높은 품질의 실험 데이터가 필요할 수 있으며, 이미大量의 게놈 데이터에 접근할 수 있으며 AlphaFold의 솔루션을 사용하여 구조로 변환할 수 있다.

Genesis Park 편집팀이 AI를 활용하여 작성한 분석입니다. 원문은 출처 링크를 통해 확인할 수 있습니다.

공유

관련 저널 읽기

전체 보기 →