Creating innovative bio-convergent technologies for better human life

그림1.png

<임수린, 김관수, 김유태, 한만영 학생의 Heart Disease AI Datathon 2021 대회 수상 장면>

 

바이오및뇌공학과 이도헌 교수님 연구실의 임수린, 김관수, 김유태, 한만영 학생이 Heart Disease AI Datathon 2021 대회에서 “심전도 데이터셋을 활용한 부정맥 진단 AI 모델 개발”을 주제로 우수상을 수상하였습니다. 

 

1. 바쁘실 텐데 인터뷰에 참여해 주셔서 감사합니다. 먼저 대회에 참여하신 분들의 소개 간단히 부탁드립니다.

안녕하세요 이도헌 교수님이 계시는 바이오 정보 시스템 연구실 박사과정 임수린, 김관수, 김유태 그리고 석사과정 한만영입니다. 팀장 임수린 학생을 중심으로 임수린, 김관수 학생이 데이터 전처리를 행하였고, 임수린, 김유태, 한만영 학생이 딥러닝 모델을 구축하였습니다.

 

2. HEART DISEASE AI DATATHON 2021은 어떤 대회인가요? 어떻게 참여하게 되었는지도 궁금합니다.

이 경진대회는 한국지능정보사회진흥원에서 주관한 "2021 인공지능 학습용 데이터 구축사업"의 일환으로 추진된 인공지능 학습용 심장질환 심초음파 및 심전도 데이터셋을 이용하여 심초음파/심전도 질환을 판별하는 AI 진단 모델링 경진대회입니다. 두 가지 주제 중 “심전도 데이터셋을 활용한 부정맥 진단 AI 모델 개발”이라는 주제로 대회에 나가게 되었습니다. 그동안 공부한 AI 모델 개발 기술을 실제 의료 데이터에 활용하면 좋겠다는 생각이 있었고, 이 대회의 주제가 저희의 목표와 같았기 때문에 참여하게 되었습니다.

 

3. 부정맥 진단 AI 모델의 개발 전략을 공유해 주실 수 있나요?

 저희는 인공지능 알고리즘 계획을 구체적으로 정하고 시작했습니다. 이를 위해서는 사전 조사가 필요했는데, 심전도 데이터가 어떻게 이루어져 있는지, 노이즈 제거 등 해당 데이터의 전처리는 어떻게 진행하는지, 실제 심전도 데이터를 이용한 부정맥 진단에는 어떤 인공지능 알고리즘들이 사용되고 있는지, 마지막으로 대회에서 제공하는 데이터 이외에도 부정맥 관련 심전도 데이터가 존재하는지 등을 조사했습니다. 

사전 조사를 통해 얻은 지식을 바탕으로 데이터 전처리를 진행하였습니다. 대회에서 주어지는 데이터가 잘 정리되어 있지 않아서 저희 나름의 방식대로 해결해 나갔습니다. Base64로 인코딩 되어 있는 심전도 데이터를 디코딩하여 인공지능 모델에 사용할 수 있는 형식으로 바꾸었고, 측정하는 방법에 따라 8 leads 만으로 측정된 데이터의 경우에는 나머지 4 leads의 값을 예측하여 12 leads로 변환하였습니다. 마지막으로 shifting, scaling을 통한 데이터 증강, 비교적 짧은 시간 동안 측정된 데이터 제거 그리고 노이즈 제거를 위한 다양한 필터 적용 등 이전에 조사한 전처리 방법과 주어진 데이터를 비교해 가며 데이터 전처리 과정을 거쳤습니다. 

 사전 조사를 통해 부정맥 진단에는 어떤 딥러닝 모델들이 주로 쓰이는지 확인했습니다. 합성곱 신경망이 포함된 모델이 70% 가까이 되었고, 그 중에서도 ResNet이 실제 연구에서 가장 많이 사용되고 있음을 확인했습니다. 저희는 좀 더 나은 성능을 얻기 위해 각자 다른 ResNet을 이용한 심전도 진단 모델들을 조사해 구현하였습니다. 대회에서 주어진 데이터셋을 이용해 성능을 비교하였을 때 가장 좋은 성능을 가지는 모델을 학습하였고, 다양한 모델의 성능 비교 뿐만 아니라 노이즈 제거를 위해 어떤 필터를 사용하였는지, 혹은 데이터 증강 유무 등등 다양한 경우의 성능을 비교하였습니다. 성능 비교를 바탕으로 가장 좋은 진단 정확도를 보이는 모델을 최종 모델로 선정해 제출하였습니다.

 

4. 연구실 구성원들과 함께 성과를 이룬 것이 뜻 깊을 것 같습니다. 함께 대회에 참여하며 느낀 소감을 공유 부탁드립니다.

(수린) 그동안 이론적으로 배운 모델들이 실제 환자 데이터에서 잘 동작하는 모습을 보니 신기하기도 하고 뿌듯했습니다. 또한, 작성한 코드를 패키징하여 하나의 프로젝트를 완성하는 소중한 경험을 할 수 있었습니다. 

(만영) AI를 이용한 진단에는 딥러닝 모델을 구축하는 것뿐만 아니라 데이터의 전처리도 상당히 중요하고 어렵다는 것을 경험하며 배웠습니다. 대회 기간이 생각보다 짧아 시간에 쫓기듯 급하게 진행된 것이 아쉬웠습니다.

(유태) 다른 참가팀에서 어떻게 모델을 만들었는지 발표하는 시간을 가졌는데, 이를 통해 다른 연구실의 연구 내용을 배울 수 있었습니다. 

(관수) 데이터에 익숙하지 않아, 데이터 자체에 적응하고 전처리를 진행하는 데에 대부분의 시간을 쏟게 되어 막상 모델에는 시간을 많이 쓰지 못해 아쉬웠습니다. 다만, 수상식 발표 때 다른 연구실 팀들은 어떻게 접근하였는지 확인하고 비교해 볼 수 있어 유익했습니다.

 

5. 마지막으로 다양한 공모전에 관심이 있는 학생들에게 한 말씀 부탁드립니다.

만약에 대회에 관심이 있으면 국제적이거나 긴 역사를 가진 유명한 대회에 나가는 것을 추천 드립니다. 공모전에 대해 학생들이 내가 나가도 괜찮을까 하는 부담감이 있을 수도 있는데, 학과에서 배운 지식들을 통해서 충분히 좋은 결과를 낼 수 있습니다. 주저하지 말고 도전하세요!

 

권재명 기자 (kwon_jae_myeong@kaist.ac.kr)