제가 단백질 구조 예측 분야를 연구하던 시절엔 구조 예측에 만에 집중했고, 단백질 하나 하나에 대한 연구를 별로 하지 않았습니다. 그러다보니 단백질 구조 예측을 해도 그것을 어디에 어떻게 사용할지에 대해서 깊히 생각해보지 않았습니다.
신약개발 분야로 넘어오면서 여러 단백질에 대해서 구조를 분석하다보니 여러 재미있는 점들을 알 수 있었습니다.
인간 단백질들 중에서 패밀리 단백질끼리는 서열이 매우 (50% 이상?) 유사합니다. 구조 또한 거의 유사합니다.
약물의 단백질에 대한 결합 여부를 실험해보면 패밀리에 속한 단백질 끼리는 상관성이 매우 높게 나올 것입니다.
슈퍼 패밀리라 할 수 있는 단백질들은 서열 유사성이 20% 정도로 떨어지지만, 전체적인 구조는 유사합니다.
그런데, 슈퍼 패밀리에 속하는 포켓 구조가 상당히 다릅니다.
EGFR과 VGFR를 예로 들자면, 둘은 모두 티록신 카이네이즈 리셉터 (TKR)에 속하며 서열 유사성은 20% 정도이고, 구조 정렬을 해보면 구조적인 유사성 또한 높음을 볼 수 있습니다. 그런데, 포켓 구조만을 본다면 구조가 상당히 다름을 볼 수 있습니다. uniprot 에서 두 단백질들을 타겟으로 개발된 약물들을 살펴보면 두 단백질에 공통으로 작용하는 약물이 거의 없음을 알 수 있습니다.
구조 예측한 단백질을 구조 기반 신약 개발에 사용한다면, 전체 구조를 잘 맞추는 것보다 포켓 구조의 정확도가 더 중요합니다. 보통 단백질 구조예측은 서열만 주어진채로 문제를 푸는 경우가 많습니다. 템플릿으로 사용할 단백질들도 서열 유사성으로부터 선택합니다. 만약 활용할 수 있는 데이터가 있다면, 타겟 단백질에 대한 결합 분자 정보와 템플릿으로 사용할 단백질에 대한 결합 분자 정보를 비교해서 활성 정보가 유사한 템플릿을 선택할 수 있습니다. 템플릿이 인간 단백질이 아닌 경우는 데이터 자체가 없을 가능성이 높겠지만...
반대로 구조예측이 얼마나 신뢰할만한가를 간접적으로 판단할 때도 이런 정보를 사용할 수 있을 것입니다.
또한 같은 패밀리에 속하는 단백질들 사이의 포켓 구조가 유사하기 때문에, 만약 두 단백질 사이의 selectivity를 고려해야하는 경우라면, 포켓 주변 residue들을 비교하고 분석해야 합니다.
아쉽게도 제가 단백질 구조 예측 연구를 하던 시절엔 서로 같은 기능을 하는 단백질들 (kinase receptor, 면역 단백질 같은...)이 서로 구조 유사성이 매우 높다는 것을 몰랐습니다. 구조 예측을 하면서 최종적으로 답을 제출하기 전에 단백질들을 눈으로 봤지만, 애석하게도 그때는 구조를 봐도 뭐가 맞는지에 대한 감이 전혀 없었습니다. 서열뿐만이 아니라 다른 정보들을 사용해서 구조 예측을 시도해볼 수 있었을 것 같은데 아쉽네요.
'Drug > Computer-Aided Drug Discovery' 카테고리의 다른 글
의약화학 (5) | 2021.04.29 |
---|---|
pharmacophore model (0) | 2021.04.21 |
합성 가능한 분자 생성 (0) | 2021.03.27 |
AutoDock Vina 및 변종 사용법 (21) | 2021.02.28 |
인공지능 신약개발에 대한 이야기 (0) | 2021.02.25 |