Creating innovative bio-convergent technologies for better human life

bioeng_admin 2003-01-22 16:45:50
0 120
뇌정보처리와 인공두뇌
-기계에게 지능을! 인간에게 자유를!-
글 : 이수영(KAIST 바이오시스템학과 교수, 뇌과학연구센터 소장)

뇌정보처리와 미래 인류사회

산업혁명과 컴퓨터혁명에 이은 “제3의 혁명”, 즉 뇌정보처리 혁명이 다가오고 있다. 이는 현 인류사회를 크게 발전시킨 산업혁명이나 컴퓨터혁명보다 인류 사회를 더욱 크게 바꿀것으로 널리 인식되고 있다. 인간의 두뇌작용을 모방한 중앙처리장치(CPU), 즉 인공두뇌를 장착한 인간기능 로봇의 지원으로 윤택하게 사는 인류! 이것이 뇌신경정보학 연구자가 보는 21세기의 인류 사회이다.
과학기술의 발전은 인류의 복지 증진에 기여하여 왔다. 특히 1733년 영국의 케이(Kay)가 방적기를 발명함으로써 시작된 산업혁명은, 대량생산에 의한 값싸고 좋은 품질의 공산품을 사용하는 형태로 인류의 생활 방식을 크게 바꾸어 놓았다. 산업혁명은 증기기관에 의해 인간의 물리적(物理的) 능력을 뛰어넘는 기계를 가동함으로서 힘든 일을 보다 빨리 수행할 수 있으므로 해서 가능했으나, 20세기 후반의 컴퓨터혁명은 인간의 고속정밀 계산 및 저장 능력의 극복에 기반을 두고 있다. 오늘날 인류 사회의 곳곳에는 어떤 형태로든지 컴퓨터가 관여하고 있으며, 컴퓨터가 없는 하루도 생각할 수 없다.
컴퓨터의 발전과 더불어 새로운 문제점이 나타나기 시작하였다. 컴퓨터를 사용하기 위해서는 컴퓨터가 이해할 수 있는 낮은 수준의 언어, 즉 컴퓨터 언어로 프로그램 피요하다. 이를 ‘제1차 컴퓨터 위기’라고 하는데, 1980년 일본에서는 이를 극복하기 위하여 컴퓨터 프로그램을 쉽게 하기 위한 ‘제5세대 컴퓨터’ 연구를 시작하였다. 이를 통해 프로그램은 매우 쉬워졌으나, 1990년에 이르러 진정 중요한 것은 프로그램이 아니라 프로그램의 기반이 되는 알고리즘이라는 현실을 이해하게 되었다. 즉, 인간과 유사하게 음성을 알아듣고(음성인식), 물체를 알아보고(영상인식), 스스로 생각하고(인지 및 추론), 팔다리를 움직이는(행동) 기능이 어떻게 가능한지를 모르고서는 이러한 기능의 프로그램을 작성할 수 없다. 이를 ‘제2차 컴퓨터 위기’라고 한다.
현재 진행되고 있는 ‘제3의 혁명’은 ‘인간 능력의 한계를 극복’하기 보다는, ‘인간의 지적(知的) 능력을 대신’하는 기계에 의한 인간의 자유를 목표로 하고 있다. 기계에게 인간다운 기능을 부여하여, 지금까지 인간만이 해온 일의 일부를 기계에게 맡기고, 인간은 보다 창조적인 일에 몰두할 수 있게 하자는 것이다. 21세기 초에는 ‘인간기능 로봇’이 5각(覺)으로부터 들어오는 정보를 처리하여 스스로 생각하고, 걷고, 말하고, 복잡한 작업을 수행하게 될 것이다. 아침에는 인공 가정부가 준비한 식사를 하고, 인공 운전사가 운전하는 차를 타고 사무실로 가서, 인공 비서의 도움을 받으면서 일을 처리하고, 집에서는 인공 가정교사가 아이들을 가르치며, 인공 간호사가 노인과 병자를 돌보는 사회! 보다 창조적이고 지적인 생활은 역시 인간만의 몫으로 남을 것이다.

인간기능과 인공두뇌

이러한 “제3의 혁명”을 위해 인간기능을 대신하는 지능시스템의 두뇌, 즉 인공두뇌가 연구되고 있다. 이를 제일 잘하는 것은 인간이므로, 인간 두뇌의 정보처리 기능을 이해하고 모방하여 인공두뇌를 만들어야 한다. (<그림1>)
<그림1> 인간 두뇌와 이를 모방한 인공두뇌


인간의 뇌기능은 “5각으로부터 정보를 받아, 스스로 생각하고, 행동하는” 것으로 정의할 수 있으므로, 인공두뇌는 결국 이러한 기능을 담당하게 된다. 5각 중에서 촉각, 후각 및 미각은 정보량이 많지 않은 센서의 문제이나(1초에 10번 이상 냄새를 맡는 사람이 있는가?), 시각과 청각은 많은 정보를 처리하므로 이에 대한 이해가 매우 중요하다, 따라서, <그림1>과 같이, 인간의 뇌근을 시각, 청각, 추론 및 행동의 4가지로 대별할 수 있다. 이는 공자님의 “예의가 아니면 보지 말고, 듣지 말고, 말하지 말고, 행동하지 말라”는 말씀과 일치한다. ‘말’은 단순한 음파가 아니라, 사람이 생각한 결과가 밖으로 표현되는 것으로, ‘말’ 대신에 추론을 뇌기능으로 보는 것이 더욱 적절하다.
<그림2> 인간 두뇌의 4가지 기능과 응용시스템


시각은 인간이 가장 많은 정보를 얻는 부분으로, 정지영상 및 비디오로부터 특정한 패턴을 추출하여 인식하고, 필요한 경우 패턴추적까지 수행하게 된다. 기존의 패턴인식 시스템은 패턴의 크기, 방향, 위치, 조명 등에 민감하여 실세계 응용이 제한되고 있으나 인간은 이를 매우 잘 하므로, 뇌정보처리 메카니즘을 이용한 주요 연구분야가 된다. 입력 패턴의 위치나 크기가 바뀌고 방향이 어긋나 있어도 제대로 인식하여야 한다. 또한, 복잡한 배경 하에서 작은 목표물을 인식하고 추적하는 기능이 필요하다.
인간에게 있어서 청각은 시각에 이은 제2의 정보원으로, 음성인식은 키보드나 마우스에 의한 정보입력의 비효율성을 극복할 수 있는 좋은 대안이다. 시각이 다루는 영상 정보가 훨씬 많지만, 인간이 만들 수 있는 영상 정보가 제스처나 얼굴표정 등 극히 제한됨에 비해, 인간이 말하는 것과 듣는 것은 같은 정보이므로, 기계와 인간이 상호 정보를 교환하는 제일 자연스런 방식이 된다. 음성은 사람에 따라, 같은 사람이라도 상황에 따라 많은 변화를 갖는 특성을 갖고 있으므로, 이를 해결하는 일반화 특성이 특히 강조된다. 특히, 실세계 잡음 또는 무제한 대화체 연속음성 인식이 중요하다.
시청각 시스템으로부터 들어오는 정보는 뇌에서 최종 신호처리 되는데, 주로 판단과 추론 기능으로 볼 수 있다. 추론은 학습된 정보로부터 새로운 정보를 예측하는 기능으로 볼 수 있으며, 신경회로망의 일반화 기능이 이에 해당한다. 현재까지의 기능은 주로 이미 배운 자료에 의한 판단 수준을 크게 벗어나지 못하고 있으나, 인지과학의 발전과 더불어 사람의 사고, 감정, 창의성 등의 메카니즘이 밝혀지면, 인간과 유사한 기능을 구현하는 인공두뇌의 핵심기능이 구현될 수 있을 것으로 기대된다.
판단과 추론을 거친 뇌는 팔다리와 입을 움직이는 제어기능을 수행한다. 제어 대상인 신체는 성장에 따라 시스템 특성이 바뀌므로, 시스템에 대한 특성을 모르면서도 학습에 의해 제어가 이루어져야 한다. 인간의 신체와 같은 복잡한 로봇의 제어 등에서는 뇌과학에 기반한 신경회로망이 매우 유리할 것으로 기대된다.

청각모델을 이용한 음성인식

뇌정보처리 메카니즘에 기반한 청각모델을 통한 특징추출, 일반화 성능이 뛰어난 신경회로망 모델, 선택적 주의집중 모델, 다중채널을 이용한 잡음의 제거기술 등이 음성인식의 실용화의 길을 열것으로 믿어진다.
달팽이관에서 음성특징이 추출되고, 이후 좌우 귀의 신호가 접합되며, 주의집중에 의해 불필요한 신호가 걸러지는 것을 모방하여, 인간처럼 시끄러운 파티장에서도 관심 있는 사람의 목소리나 단어를 잘 인지하는 시스템의 개발되고 있다. 인공시각, 인지추론 및 인간행동 분야에서도 유사한 연구가 수행되고 있다. 2001년부터 3년간 과학기술부에서 지원하는 뇌신경정보학연구사업에서 이러한 4개 인간기능 모듈별로 연구를 수행한 후, 2004년부터 4년간 이를 통합하여 “인공두뇌”를 개발하려고 한다. 이 연구는 생명기술(BT)과 정보기술(IT)이 융합됨으로서 인류사회를 위한 “제3의 혁명”을 주도하는 좋은 예가 될 것이다.

기계에게 지능을! 인간에게 자유를!