PLATFORM TECHNOLOGY

최근 인공지능 (Artificial Intelligence, AI)은 신약연구개발의 패러다임에 혁신적 변화를 일으키고 있는 중입니다. 예를 들면 표적단백질의 발굴, 가상스크리닝, 선도물질 최적화, 물성 및 독성 예측, 약물 제형 연구, 약물재창출 등 전임상 단계에서의 응용 뿐만 아니라 PK/PD 시뮬레이션, 임상 대상자 선별 및 임상 데이터의 분석 등 임상 단계에서도 인공지능이 광범위하게 활용되고 있습니다. 일반적인 저분자 신약연구 과정은 (1) 표적단백질 선정 (2) 초고속 약물 탐색(HTS, High-Throughput. Screening)을 이용한 히트 화합물들의 발굴 (3) 초기 히트들의 개선을 통한 선도물질 창출 (4) 선도물질의 최적화 (5) 신약 후보물질 선정 등의 순서로 진행되며 이 과정에만 최소한 3년의 기간 및 50여억원의 연구비가 소요됩니다. 전임상이나 임상시험의 기간 및 비용은 약물의 복잡성이나 질환분야에 차이가 나기는 하지만 정해진 프로토콜에 따라 진행되는 것으로 획기적 개선을 기대하기는 어렵습니다. 그러므로 전임상 이전의 연구단계에서 혁신을 꾀하는 것은 전체 신약연구개발 주기를 단축시키고 효율성을 제고할 수 있는 매우 좋은 전략이라고 할 수 있습니다.

DeepZema®는 이와 같은 전략을 달성하기 위한 방법의 일환으로 개발되었습니다. DeepZema®는 바이오마커 발굴이나 신약재창출 (Drug repositioning) 등을 위한 도구라기 보다는, 히트발굴, 리드최적화, 타겟동정 및 ADME/Toxicity 예측과 같은 일상적인 합성신약 연구를 보다 효율적으로 수행할 수 있도록 도와주는 종합 소프트웨어 솔루션이라고 할 수 있습니다. 이와 유사한 솔루션들이 있기는 하지만 일부 분야 만을 다루거나, 사용이 쉽지 않거나, 실시간으로 해답을 제공하지 못하는 등의 단점이 있습니다. DeepZema®는 상호활동적 (interactive)일 뿐만 아니라 대부분의 문제에 대하여 실시간으로 해답을 제시하며 따로 학습을 하지 않더라도 쉽게 사용할 수 있습니다. 또한 전통적인 인실리코 신약디자인 기술에 더하여 이런 기술이 잘 다루지 못하는 부분, 즉 인과관계가 불분명한 데이터에 기계학습이나 딥러닝을 적용하여 문제를 해결할 수 있습니다.

DeepZema®는 아래와 같이 크게 6개의 카테고리로 구성되어 있습니다.

  • 미지의 화합물에 대한 표적단백질의 예측 (리간드 및 구조기반 타겟 프로파일링)
  • 생명과학분야 빅데이터의 활용 (PubChem, ChEMBL, PDB, 화합물은행 등에 대한 데이터 마이닝)
  • 가상스크리닝 (표적단백질에 결합하는 히트 화합물의 발굴) 
  • 히트 검증 (어세이 간섭물질 배제, 약물유사성 계산, 오프타겟 바인딩)
  • 선도물질 최적화 (QSAR, de novo design, 딥러닝 기반 docking, ADME/Toxicity)
  • 약물후보 선정 (활성, 물성, 독성, 합성 등의 종합적 평가)

타겟동정

DeepZema®를 이용하면 미지의 화합물에 대하여 리간드 또는 구조기반 타겟 단백질 예측이 가능합니다. 또한 GPCR, kinase 수퍼패밀리 내에서의 selectivity profiling 도 가능합니다. 예를 들면 아래와 같이 미지의 화합물 X에 대하여 실시간으로 kinome selectivity profiling 을 할 수 있습니다.

PROTEIN-LIGAND DOCKING

단백질-리간드 결합에 대한 binding mode를 예측하는 것은 선도물질 최적화 과정에 매우 큰 도움을 줄 수 있습니다. DeepZema®는 웹인터페이스에서 (1) 단백질의 PDB ID 또는 파일 (2) 리간드의 구조를 입력하면 불과 1분내에 binding mode를 예측해 줍니다. 각각의 binding mode는 DeepZema®에 구현된 다양한 웹 애플리케이션을 이용하여 분석해볼 수 있습니다.

ADME/Toxicity 예측

ADME/Toxicity 예측은 선도물질 최적화 및 후보물질 선정에 매우 중요한 과제입니다. OPERA, Vega, SwissADME 등 많은 웹서비스를 찾아볼 수 있으며 기계학습이나 딥러닝을 이용하여 예측의 정확도를 높이기 위한 시도들이 이어지고 있습니다. DeepZema®는 이러한 트렌드를 반영하여 항상 최신의 기술을 활용할 수 있도록 빠르게 업데이트하고 있습니다. 예를 들면 약물의 흡수, 분포, 대사, 배설 등의 ADME end-point 뿐만 아니라 acute toxicity, DILI, cardiotoxicity, carcinogenecity, mutagenecity 등의 toxicity end-point 에 대해서도 여러가지 알고리즘을 이용한 예측이 가능합니다. 예를 들면 아래와 같이 미지의 화합물 X에 대하여 ADME 예측이 가능할 것입니다.

실제로 19종의 새로 합성된 화합물에 대하여 DeepZema®의 ADME/Toxicity 모듈을 사용하여 low/high absorption 으로 분류하는 한편으로 외부기관에 의뢰하여 AUC 를 측정한 값들을 비교해 본 결과, production work에 사용하기에 충분히 신뢰할 만한 결과를 보여주었습니다.