상세 컨텐츠

본문 제목

[2024 노벨 화학상] 인공지능을 이용한 단백질 구조 예측

학술

2024. 11. 19. 21:14

본문

2024 10 9(현지 시간), 노벨 화학상 수상자로 데이비드 베이커 미국 워싱턴대 교수(이하 베이커 교수)와 구글 딥마인드의 데미스 허사비스 최고경영자(이하 허사비스), 존 점퍼 디렉터(이하 점퍼)가 선정됐다.

2024년 노벨화학상 수상자. 왼쪽부터 데이비드 베이커, 데미스 허사비스, 존 점퍼. <사진 = 노벨상 위원회>

베이커 교수는 단백질 설계 모델을 만들었고, 구글 딥마인드 (허사비스, 점퍼) 단백질 구조 예측 인공지능(AI) 개발했다. 이들은 오랜 시간이 걸리는 단백질 구조 예측을 시간으로 줄인알파폴드(AlphaFold2)개발의 기여를 인정받으며 수상자 자리에 올랐다.

단백질은 수십 개의 아미노산부터 수천 개까지 모든 것으로 구성. <사진 = 노벨상 위원회>

단백질은 생명체를 구성하며 모든 생명 활동에 관여하는 기본적인 요소로, 20가지의 아미노산이 3차원 구조로 복잡하게 얽히며 형성된다. 1972단백질의 3차원 구조가 아미노산의 서열에 의해 결정된다는 사실이 크리스찬 안핀센에 의해 발견된 이후, 과학자들은 아미노산 서열로 단백질의 구조를 예측하고자 하였다. 그러나 이 단백질 사슬들은 3차원 공간에서 복잡한 패턴으로 암호화되어 존재하기 때문에 지금까지는 단백질 구조를 예측하더라도 낮은 정확도를 보일 수 밖에 없었다. 이러한 이유로 지금껏 과학자들은 단백질 구조를 일일이 확인할 수 없었는데, 이를 AI 예측하는 방법을 구글 딥마인드 팀이 찾아낸 것이다.

 

알파폴드(AlphaFold2)를 이용한 단백질 구조 <사진 = 노벨상 위원회>

이렇게 만들어진 알파폴드(AlphaFold2)는 전처리 과정에서 입력 시퀀스와 시퀀스의 정보, 입력(템플릿) 정보와 일치하는 [1]MSA(Multiple Sequence Alignment, 다중서열정렬) 정보를 MSA representation pair representation(단백질 서열 내에 아미노산의 잔여물(residues) 사이의 관계에 대한 정보를 코딩하는 방식)변환(임베딩)한다. 전처리 과정 이후 Evoformer라고 불리는 두 개의 트랜스포머로 이루어진 딥러닝 네트워크를 사용하여 MSA pair representation을 업데이트한다. 이 결과물을 3차원 구조로 변환하는 과정을 반복하여 단백질 구조 예측의 정확성을 향상시킨다.

 올해의 노벨상 수상에서 주목할 점은 노벨화학상과 노벨물리학상 모두 인공지능을 이용한 연구가 각광받았다는 점이다. 이렇게 인공지능을 이용하여 노벨상을 수상한 사례는 처음이기에 많은 과학자와 과학도가 주목하고 있다.



[1] 단백질, DNA, RNA의 서열을 이용하여 3개 이상의 생물 종 서열을 정렬하는 방법

 

김예은 기자 yeeun05@dgist.ac.kr

관련글 더보기

댓글 영역