Drug/Computer-Aided Drug Discovery

AlphaFold Protein Structure Database

Novelism 2021. 7. 24. 13:34

 

 예전에 단백질 구조예측하던 시기에, 동료들 사이에서 CASP에 대해서 회의적인 의견들이 있었습니다. 

 참가 그룹들이 CASP에서 구조예측을 잘했지만, 정작 공개된 메서드 롤 돌려서 그 정도 결과가 나오지 않는다는 것,

기술 개발만 하는데, 정작 그 기술을 사용해서 정말로 다른 연구자들에게 도움이 되는가,

그리고 당시(co-evoluation 기반 예측이 나오면서 성능이 향상되기 전)에 기술 향상이 지지부진해서 대회를 지속하는 의미가 있는지 같은 이야기였습니다. 

 그때 나온 이야기 중 하나는, 실험 구조를 protein data bank에서 공유하는 것처럼, 차라리 구조 예측을 하는 사람들이 미리 인간 단백질이나 기타 주요 단백질들 대한 구조를 예측해서 data bank를 만든다면 도움이 많이 될 것이라는 이야기였습니다. 

 (아무래도 툴을 공개해도, 그 툴을 개발한 사람이 (많은 자원을 사용해서) 돌리는 것과 그냥 다운로드하여서 돌리는 것은 성능 차이가 많이 납니다. 손으로 조절해야 하는 면도 있습니다.)

 

 그런데, 딥마인드가 너무 많은것을 해버렸습니다.

 압도적인 단백질 구조 예측 메소드를 개발하고, 그것을 공개하고, 심지어 그 메서드로 인간 단백질에 대한 구조를 전부 예측해서 공개했습니다. CASP13 때는 메서드 공개가 불완전하다는 이야기가 있었는데, 아직 살펴보진 못했지만 CASP14의 알파폴드는 아마도 완전히 공개한 모양입니다. 

 

https://www.alphafold.ebi.ac.uk/?fbclid=IwAR0NkFiQWtsvROgq_9KtoYlTybMfzRdI7cGyIyjw0HGAroHNVws6qlkjzHQ 

 

AlphaFold Protein Structure Database

 

www.alphafold.ebi.ac.uk

 

 저는 예전에 같이 일하던 분께, 단백질 전체 구조예측 자체에 대해선 더이상 하지 마시고 차라리 이것을 활용하는 연구를 하시는 게 좋을 것 같다고 이야기하고 있습니다. 단백질-분자 결합에서의 구조 변화, mutation에 따른 정밀 모델링 같은 세부적인 문제들은 많이 있고, 실제로 예측한 구조를 사용하려면 이런 문제들도 해결해야 합니다. 단백질 디자인, 신약개발 분야에서도 큰 진전이 있겠지만, 거기에도 추가로 연구해야 할 일들이 있습니다. 지금까지 하지 못했던 일들을 할 수 있게 되긴 했지만, 그렇다고 단백질 구조가 있다고 신약이 쉽게 만들어지는 것은 아닙니다. 답 마인드의 위업은 많은 연구들이 시작될 수 있는 계기가 될 것입니다. 

 

당분간 단백질 구조가 신약개발 분야에서 왜 필요한가, 딥마인드의  어떤 도움을 줄 수 있는가에 대해 몇개의 글을 포스팅하려 합니다. 

 

에휴... 그냥 한탄할 수밖에 없네요.

 지금 신약개발분야에서 인공지능은 세상을 크게 바꿔가고 있지만, 정작 저는 이미 이런 흐름을 타고 뭔가 해낼 수 있는 여건이 안됩니다. 저뿐만이 아니라 옛 동료분들도 마찬가지입니다. 회사에선 당장 일할 사람도 뽑기 어려운데, 신약개발 인력도 부족한데, 단백질 구조 예측은 손도 못 대고, 정작 다른 회사들은 단백질 구조 예측을 한다고 하지만, 전문성이 있는 회사는 없습니다. 서로 다 흩어져서 할 수 있는 일이 없습니다. 구심점이 돼서 사람들을 모을 수 있는 사람도 없고, 서로 다른 직장에 흩어져있으니 아무런 시너지도 없네요. 인공지능 신약개발 회사의 난립이 오히려 해가 되고 있습니다. 

 각 분야별로 능력있는 사람이 여러 명 모여야 제대로 일이 되는데, 죄다 흩어져있습니다. 

 드림팀 같은 것은 말 그대로 꿈일 뿐입니다.