alphafold 2 by 바죠

alphafold 2

구글이 또 다시 단백질 구조 예측 대회에서 역대 최고의 성적으로 세상을 놀라게 하고 있다.
여기서, 역대 최고의 성적이라는 표현은 매우 부족해 보인다. 혁신중의 혁신으로 평가해도 손색이 없다.
압도적인 성적으로 일등이다. 일등의 성적을 넘어서 진정으로 혁신을 이루어낸 것이다.
정확히 이야기하면 단백질 구조예측의 신기원을 이룬 것이다. 
50년만에 인류가 얻어낸 상당한 진보이다.  이 과학적 과제에 대한 해답은 인공지능 기술을 활용하는 것이다.
구글이 인공지능 기술로 바둑을 정복했던 것처럼 말이다.
기존의 물리학적, 화학적, 생화학적 접근법에 바탕을 둔 문제 풀이 방식으로는 결코 얻어내지 못한 것이다.
단백질 구조예측 문제 풀이는 소위 연역적 문제 풀이 방법으로는 해결이 불가능 하다. 
이것은 잘 알려진 사실이다. 
구글은 인공지능의 초귀납적 풀이방식을 도입하여 성공한 것이다. 

단백질 구조예측 대회(CASP)는 2년마다 열리는 대회이다. 
짝수년도에만 열린다, 올림픽, 월드컵이 있는 해에만 진행된다.
아미노산 서열(sequence) 정보를 문제로 출제하면 세계의 많은 연구자들이 해당 단백질의 3차원 구조를 답안으로 제출하는 방식으로 대회가 진행된다. 
한가지 계산 방법에 한가지 아이디를 부여한다. 
좋은 성적을 내는 그룹 아이디는 학회에서 호명되고 실제적인 프로토콜을 발표할 기회를 부여받는다.

제출된 답안에 대해서 실험적으로 결정된 단백질 3차원 구조와 비교하여 점수를 부여하게 된다. 
컴퓨터를 이용해서 채점한다.
단백질 구조 하나당 100점 만점으로 단백질 3차원 구조 예측의 성과를 평가하는 것이다.

공정한 경쟁을 위해서 3차원 단백질 구조, 즉, 정답이 알려져 있지 않은 아미노산 서열에 대해서만 문제로 출제한다.
실험적으로 3차원 구조가 알려지는 것은 연말이 다 되어서야 가능하다. 
이 때, 모든 출제된 단백질들에 대해서 점수를 부여한다.
실험이 완료되지 못하여 정답 구조가 알려지지 않은 경우에는 해당 문제에 대한 평가는 보류된다. 
[종종 일어나는 일이다. 또한 정보가 유출된 경우에도 해당 문제는 취소된다.]
결국, 블라인드 테스트로 대회를 진행하게 된 것이다. 
인터넷으로 문제 제출, 답안 제출을 수행한다.
진정한 단백질 구조예측 능력을 얻어내기 위하여 뜻있는 과학자들이 설계한 대회이다. [조직위 대장: 존 몰트 교수] 
연구 논문들에서 발표된 그리고 부풀려진 성과를 믿을 수 없기 때문이다. 

많은 연구 논문들에서, 단백질 접힘 구조예측이 가능하다고, 사람들이 떠들고 있기 때문이다. 
실제로는 전혀 그렇지 않다. 
가능하다고 하지만, 실제로는 절망 수준에 가깝다. 
뜻있는 과학자들의 자아성찰은 결국 이러한 대회를 기획하게 하는 원동력이 되었다.

이러한 대회가 의미가 있는가에 대한 회의론도 많이 있다. 
특히, 대회에 참가하지 않는 사람들이 오히려 이 대회를 아주 우스운 대회라고 말하기도 한다. 
마치, 자신이 참가하면 곧바로 일등할 수 있을것처럼 말이다.

반대로, 실제 대회에 참가하는 사람들 모두 힘들어 한다. 
이것은 과학이 아니야 라고 투덜거리기도 한다. 
학술적 논의보다는 경쟁에 치우쳐 있기 때문이다. 
일리가 있다. 
하지만, 논문으로 과대포장해서 발표하는 것, 그것은 더더욱 과학이 아니다. 
자명한 것이다.
의미를 찾을 수 있다. 
특히, 시간이 지날 수록 더욱더 그렇다. 
그 동안에 축적된 데이터들만으로도 특정 계산 방법을 검증할 수 있는 기출 문제집이 되기 때문이다. 
문제와 정답이 모두 공개되어 있다.

구글은 평균 90점에 가까운 정밀도를 얻어냈다. 이것은 과거 그 누구도 이루어내지 못한 결과이다.
단백질 접힘 연구 50년된 문제가 거의 풀렸다고 볼 수도 있다.
곧바로 질병극복 그리고 신약설계에 응용될 수 있다. 
2등이 기록한 단백질 구조예측의 정밀도는 크게 도움이 되지 못한다.
주지하는데로 단백질은 자신의 고유 모양으로 접혔을 때에만 정상 기능을 수행할 수 있다.

아무튼, 알파고, 알파고 제로, 알파폴드, 그리고 알파폴드 2로 이어지는 구글의 성과는 진실로 놀랍다!
어쩌면 우리 모두 기업이 해내는 과학적 돌파구를 마련한 학술적 성과에 너무 인색했었던 것은 아닌지 다시 생각하게 된다.
구글은 어떠한 기보도없이 5000년 역사를 자랑하는 바둑이라는 게임을 정복했다. 
바둑의 신이 백지상태(tabula rasa)로부터 만들어질 수 있음을 보였다.
지금, 어떠한 프로기사도 인공지능 바둑에게 이기지 못한다. 

어떠한 전문가도 해내지 못한 아미노산 서열 정보로부터 3차원 단백질 접힘 구조를 예측할 수 있는 방법을 최초로 개발했다. 
인류가 문제를 풀기 시작한 지난 50년만에 이룩한 엄청난 과학적 성과이다. 
내로라하는 세상의 전문가 그 누구도 해내지 못했던 것을 이루어낸것이다. 

구글의 과학적 성과에 경의를 표한다!

우리는 혁신이 무엇인지 알고는 있는 것일까? 
우리는 혁신을 사랑하기는 한 것일까?
아무튼, 우리 모두 자아성찰을 해야할 시기이다.

물론, 학문적 관점에서의 대학교의 기능을 무시하고 하는 것은 절대 아니다.
하지만, 소위 혁신을 이야기하는 연구기관에서의 실질적 성취도를 다시 한 번 따져 볼 필요가 있다. 
우리는 모든 것을 다시 돌아볼 필요가 있다. 
결국, 연구를 제일 잘 하는 곳은 기업이 되고 마는 시대에 이르고 있다.

구글의 결과들은 확실히 혁신적이다. 확실한 실증을 통해서 검증이 되고 있다. 
알파고 그리고 알파고 제로가 나왔을 때, 구글은 단백질 접힘과 신물질 설계에 관심이 있다고 했었다. 
구글은 자신들의 향후 연구 방향을 제시한 바 있다. 
지금, 단백질 접힘과 관련된 단백질 구조 예측에서 역대 최고 성적을 넘어서 진정한 혁신을 이루어내고 말았다.
거짓 홍보가 아니었다는 점에서 다시 한 번 놀라지 않을 수 없다.

구글 딥마인드는 수익모델이 아직 없는것으로 알려져 있다. 
돈을 벌지 않고 돈을 쓰고 있다.
돈을 벌려고 만든 기업이 돈을 쓰고 있다.
그런데 구글의 가치는 더욱더 높아지고 있다.
왜 그런가?
구글은 혁신과 신뢰도를 먹고 살고 있다. 
그런데 더 중요한 것은 어디로 가야하는지를 알려주고 있다는 사실이다.
잘 알려진 것처럼 구글은 텐서플로우를 무료로 제공하고 있다. 
구글은 CPU/GPU/TPU 계산 시간도 제한적이지만 무료로 제공하고 있다.

대학교와 연구소는 정반대로 가고 있다.
하지만, 하고 있는 일은 정말로 대단한 것들이다.
구글은 대학교와 기업이 무엇을 해야할 지를 미리 알려주는 선구자적 위치에 있으며, 직접 행동하고 있다.
이러한 의미에서 구글은 진정한 리더이다.
구글은 이미 대학교와 연구소를 뛰어넘었다고 본다.








 

핑백

덧글

  • 2020/12/05 12:49 # 삭제 답글 비공개

    비공개 덧글입니다.
  • 바죠 2020/12/06 17:51 #

    허 박사님, 안녕하세요!
    오랬만입니다. 그 동안 오랬동안 만나지 못했습니다.
    저는 단순히 결과만 보고 있을 뿐입니다.
    허 박사님께서 훨씬더 가까운곳에서 관찰하신 감상평을 제가 볼 수 있어서 다행입니다.
    잘 알아 듣겠습니다.

    아무튼, 그야말로 대단하군요!

    허 박사님, 항후 일정이 어떻게 되시는지요?
  • 2020/12/18 12:09 # 삭제

    저는 내년부터 미국에서 faculty position에 지원해보려고 합니다. 잘 될까 걱정도 되지만, 최선을 다해보려구요. 박사님도 건강하게 잘 계시죠?
  • 바죠 2021/02/24 09:23 # 답글

    https://news.naver.com/main/read.nhn?mode=LS2D&mid=shm&sid1=105&sid2=228&oid=584&aid=0000012943

댓글 입력 영역

최근 포토로그



MathJax