Creating innovative bio-convergent technologies for better human life

과학산책_220801.png

<구조생물학과 AI〉

 

바이오및뇌공학과의 다양한 연구 분야를 교수님과의 인터뷰를 통해 알아보는 ‘과학 산책’ 시리즈입니다. 이번에는 우리 학과에서 AI를 이용하여 구조생물학을 연구 중이신 김동섭 교수님으로부터 “구조생물학과 AI”를 주제로 이야기를 나눠보았습니다.

 

1. 안녕하세요 교수님, 오늘은 “구조생물학과 AI”라는 주제로 말씀 나눠보고자 합니다. 그 전에 구조생물학이란 어떤 분야인가요?

네 반갑습니다. 구조생물학은 전통적인 생물학의 한 갈래로, 엑스레이나 핵자기공명, 초저온전자현미경 등을 이용하여 단백질이나 단백질 복합체의 구조를 밝히고, 그로부터 분자적인 수준에서 생물학적 현상들을 설명하려고 하는 학문입니다. 

 

2. 그렇군요. 제 생각에 생명체가 아닌 컴퓨터를 이용하여 생물학을 연구한다는 게 아이러니하게 들립니다. 구조생물학 분야에서 교수님께서는 컴퓨터를 이용하여 어떤 연구를 하고 계신가요? 

단백질은 다양한 종류의 아미노산의 중합체로서, 어떤 아미노산 서열을 갖느냐에 따라 생체 내에서 다양한 구조를 갖도록 접힙니다. 단백질이 접혀 만들어진 독특한 구조는 단백질의 기능과도 깊은 관련이 있는데요, 단백질의 구조를 알기 위해서는 위에서 언급한 엑스레이나 핵자기공명 등 실험적인 방법을 사용할 수도 있지만, 인공지능을 이용하여 아미노산 서열을 토대로 단백질의 구조를 예측할 수도 있습니다. 과거에는 인공지능을 통해 예측한 단백질의 구조가 실제 구조와 얼마나 비슷할지에 대한 의심이 있었으나 인공지능의 기술이 발달하면서 현재는 인공지능의 예측이 거의 실제 단백질 구조와 비슷한 수준에 이르렀습니다.

제 관심 분야는 단순히 인공지능을 이용하여 단백질의 구조를 예측하는 것을 넘어서, 특정 단백질이 다른 물질이나 분자와 결합할 수 있는지, 결합한다면 얼마나 강하게 결합하는지 등에도 관심이 있습니다. 다른 말로 하면, 단순히 단백질의 아미노산 서열로부터 구조를 밝혀내는 것을 넘어서 그 단백질의 기능을 이해하는 것에도 관심이 있다는 뜻입니다.

 

3. 자세한 설명 감사드립니다. 4차 산업혁명 시대에 접어들어 구글 딥마인드에서 ‘알파 폴드 (AlphaFold)’라는 단백질 구조 예측 인공지능을 개발할 정도로 많은 사람들이 단백질의 구조와 기능을 밝혀내는데 관심이 많은데요, 단백질의 구조와 기능을 알게 되었을 때 우리가 어떻게 그 정보를 활용할 수 있을까요?

생물학에 여러 갈래가 있지만, 그것들의 궁극적인 목표 중 하나는 신약을 개발하는 것입니다. 여기서 신약이란 대부분 우리 몸에서 특정 질환을 일으키는 단백질에 강하게 결합하여 그 단백질을 억제하는 방식으로 작동합니다. 따라서 단백질의 구조와 기능을 연구하는 구조생물학이라는 분야는 생물학의 여러 분야 중에서도 신약 개발에 아주 근접한 분야라고 이야기할 수 있겠습니다.

인공지능을 이용하여 수행할 수 있는 또 다른 일은, 특정 질병을 일으키는 단백질과 강하게 결합하여 그 단백질을 억제할 수 있는 저분자 화합물이나, 자연계에 없는 전혀 새로운 단백질을 디자인하는 것입니다. 기존의 ‘알파 폴드’와 같은 인공지능이 하는 일이 단백질의 아미노산 서열로부터 단백질의 구조를 알아내고, 그 구조로부터 단백질의 기능을 알아내는 것이었다면, 반대로 원하는 기능을 수행하는 단백질이 어떤 구조를 가져야 하는지, 그 구조를 가지려면 어떤 아미노산 서열을 가져야 하는지를 계산하는 인공지능 모델을 만들 수도 있겠죠. 이와 같은 일을 단백질 디자인이라고 하고, 자연계에 없는, 말하자면 ‘인공적인 유전자’를 설계한다는 점에서 큰 임팩트가 있는 연구 분야입니다.

 

4. 자연계에 없었던 신약을 디자인한다는 점이 굉장히 인상 깊습니다. 말씀하신 대로 정말 영향력이 큰 연구 분야라고 생각되는데요, 혹시 인공지능을 이용한 구조생물학 연구에도 어려운 점이 있다면 어떤 점이 있을까요?

단백질 단량체(monomer)의 구조를 예측하는 건 이미 구글의 딥마인드와 같은 막강한 계산력 자원을 가진 회사에서 예측 모델을 만들었기 때문에 실험실에서 연구할 만한 가치가 있지는 않습니다. 현재 연구할 만한 가치가 있는 분야는 여러 단백질들이 모여 이뤄진 단백질 중합체(protein complex)의 구조를 예측한다든지, 단백질과 다른 분자 간의 결합 세기를 예측하는 분야입니다.

여기에 크게 두 가지 애로사항이 있습니다. 첫째로 이러한 분야는 실험적으로 구조를 밝히기 힘들고 시간이 많이 들기 때문에 인공지능의 힘을 빌려 구조를 밝히고자 하는 것인데, 알려진 바가 많이 없다는 말은 즉슨 인공지능 모델을 개발하는 데 필요한 데이터가 부족하다는 이야기입니다. 이 때문에 인공지능 모델을 개발하는 데 어려운 점이 있지만, 실험실에서는 단백질 서열과 같은 다른 다양한 소스로부터 데이터를 가져와서 모델을 개발하고 테스트하는 일을 합니다.

두번째는 인공지능을 가동하는데 많은 계산력 (컴퓨팅 파워)이 요구됩니다. 딥마인드와 같이 큰 회사나 전 세계에 한두 개 정도의 거대한 규모를 자랑하는 실험실은 그만한 계산력을 가지고 있지만, 그런 곳이 아닌 랩실에서 인공지능을 가동하려면 제약이 많습니다.

 

5. 그렇군요. 마지막으로 이 분야에 관심이 있는 학생들에게 해주고 싶은 말씀이 있다면 해주시죠.

이 분야에 관심이 있는 학생이 있다면 일단 저에게 찾아오셔서 관심을 보이면, 제가 이 분야의 흥미로운 문제들을 던져 드릴 수 있습니다. (웃음) 이 분야는 학문적으로도 많은 사람들이 재미를 느낄 뿐더러, 생물학의 궁극적인 목표인 신약 개발과 직결된다는 점에서 많은 보람을 느낄 수도 있습니다. 또한 인공지능 알고리즘을 짜면 단순히 그게 어떤 예측값을 준다는 것으로 끝나지 않고, 그 결과를 실험적으로 검증하는 랩들과 협업연구를 진행함으로써 자신의 인공지능 모델이 얼마나 잘 작동하는지를 직접 볼 수 있다는 점에서 보람을 느끼기도 합니다.

 

김세훈 기자 (sehun6215@kaist.ac.kr)