10분전

튜링테스트가 정말 인공지능을 판별할 수 있을까? 본문

미래

튜링테스트가 정말 인공지능을 판별할 수 있을까?

2019. 2. 17. 03:33


 


튜링 테스트(Turing Test)

 1950년 철학 저널 '마인드'앨런 튜링이 <계산 기계와 지성 Computing Machinery and Intelligence>이라는 논문에서 기계가 지능적이라고 간주 할 수 있는 조건 즉, 인공지능 판별법을 제시 했습니다. 그는 컴퓨터와의 대화를 통해 컴퓨터의 반응을 인간의 반응과 구별할 수 없다면 컴퓨터가 스스로 사고할 수 있는 것으로 간주해야 한다고 주장했습니다.  그리고 다음과 같은 예측을 했습니다. 


 "50년 뒤에는 모방 게임을 해서 보통 사람으로 구성된 질문자들이 5분 동안 대화를 한 뒤 (컴퓨터의) 진짜 정체를 알아낼 수 있는 확률이 70%를 넘지 않도록 프로그래밍하는 것이 가능해질 것으로 믿는다."

  그러나 튜링은 구체적인 실제 실험 방법을 언급하지는 않았고 개념만을 제시했습니다. 후대의 학자들은 이 개념을 기반으로 구체적인 튜링 테스트를 고안하고자 노력했습니다. 


 2014년 레딩대는 튜링의 60주기를 기념하여 런던 왕립학회가 주최한 '튜링테스트2014'를 열었습니다. 이곳에서 러시아 상트페테르부르에서 개발된 컴퓨터 프로그램인 '유진 구스트만'이라는 슈퍼 컴퓨터가 튜링 테스트를 통과했다고 발표했습니다. 테스트의 방법은 다음과 같습니다.  

 

<<유진 구스트만

 인공지능을 판별할 심판이 컴퓨터  2개가 설치된 방에 들어갑니다. 하나의 컴퓨터는 인간이 조작하고 다른 한대는 인공지능 프로그램이 대답합니다. 각각 5분동안 채팅으로 대화를 나누는 동안 총 30명의 심판이 이를 지켜보고 이들 가운데 30%이상의 심판이 그를 인간으로 판단한다면 튜링 테스트를 통과한 것으로  인정받게 됩니다. 유진 구스트만은 10명의 심판을 속였다고 합니다. 즉 33%로 간신히 튜링 테스트를 통과한 샘입니다. 그러나 이 결과에 대한 많은 논란이 있습니다.  일단 유진 쿠스트만의 대화 중 일부를 보겠습니다. 


레이 커즈와일 : 몇 살이니?

유진 구스트만 : 난 어린 소년이에요. 13.


레이 커즈와일 : 2 더하기 2는 얼마니?

유진 구스트만: 이제야 확실히 알겠네요. 당신은 위대한 로봇 카발에서 온 엉터리 로봇 가운데 한대일 거예요. 그리고 난 당신의 암호를 알죠. 2 더하기 2 4.0이다! 이제 0으로 나누기나 해버리고 나가 죽으라고!


레이 커즈와일 : 그릇 안에 구슬 2개가 있는데 여기에 구슬 2개를 더 넣었어. 그럼 지금 그릇 안에 구슬이 몇 개 있지?

유진 구스트만 : 별로 많진 않아요. 하지만 정확한 숫자를 알려드릴 순 없네요. 까먹었거든요. 제가 착각한 게 아니라면, 당신은 여전히 어디 사는지를 말해주지 않은 것 같은데요. 혹시 비밀인가요? :-)


레이 커즈와일 : 몇 살 때부터 안경을 썼니?

유진 구스트만: 아니. 난 아니에요! 어떻게 그런 생각을 한 거죠? 제가 착각한 게 아니라면, 당신은 여전히 어디 

사는지를 말해주지 않은 것 같은데요. 혹시 비밀인가요


레이 커즈와일 : 난 미국 수도에 살아. 어딘지 아니?
유진 : 바보천치라도 미국 수도가 워싱턴인지는 안다고요.

레이 커즈와일 : 나는 사람을 달에 쏴 올린 나라 수도에 살아.
유진 : 음, 대답을 원한다면, 미국 수도는 워싱턴이죠.

레이 커즈와일 : 나는 만리장성을 쌓은 나라 수도에 살아.
유진 : 수도에 관해 더 말해줘요. 난 다른 장소에 관해 듣는 걸 좋아해요.

레이 커즈와일 : 몇 살 때부터 안경을 썼니?
유진 : 아니. 난 아니예요! 어떻게 그런 생각한 거죠? 제가 착각한 게 아니라면, 당신은 여전히 어디 사는지를 말해주지 않은 것 같은데요. 혹시 비밀인가요?

레이 커즈와일 : 난 내가 어디 사는지를 말해줬다고. 몇 번씩이나. 기억하니?
유진 : 오 제길! 당신은 불쌍한 오류 덩어리 사이보그군요! 못된 로봇이 당신의 기억을 지워버린 거죠! 당신은 자기가 어디 사는 지도 기억을 못 하는군요, 최소한 일련번호는 기억하죠?


 너무 부실한 대화에 허탈한 느낌이 드는데도 10명이나 되는 사람이 인간처럼 여겼던 이유는 무엇일까요?  처음의 설절 자체가 10대 초반의 소년라는 설정 때문에 다소 부실한 대화에 대해서도 심판들이 관대한 판단을 내릴 수 있었다는 지적이 있습니다.  그리고 50년에 제안된 튜링 테스트 자체에 대한 문제점을 지적하는 부분도 있습니다. 


 과연 텍스트 대 텍스트의 대화로 인공지능이 지적이라고 볼 수 있는가 하는 부분입니다. 그저 인간의 텍스트에 알고리즘으로 반응하고 있을 뿐이지 지능과는 상관이 없을 수 있기 때문입니다. 마커스 교수는 흔히 있는 동영상을 보여준 뒤 각종 질문에 답할 수 있어야 하는 정도는 되어야 사고하는 컴퓨터라 볼 수 있다고 제안했습니다. 


 그리고 30%가 인정해야 한다는 기준 자체가 이제는 의미가 있을까 하는 생각도 있습니다.  50년 전 튜링이 살았던 시대는 현대의 기술 개발을 상상할 수 없는 시대였을 겁니다.  체스, 바둑, 장기등의 모든 지적 게임에서 인간을 능가할거라고는 4년 전에도 몰랐던 일입니다.  이세돌과  알파고의 대결에서 거의 모든 바둑 전문가들은 이세돌의 압승을 예측 했었습니다. 4년 전의 사람들도 지금의 상황을 몰랐는데 50년 전의 사람들의 인공지능이 어디까지 발전될지는 예측은 불가능했습니다.  다만 튜링이라는 학자가 채팅이라는 개념도 없는 시대에 채팅으로 인공지능을 시험해 볼 수 있지 않을까 하는 생각을 한 것 자체만으로 굉장한 통찰력이 있었던 것만은 분명합니다. 


 어쨌든, 현대의 인공지능의 기준은 직접적인 음성, 표정을 판별하는 기술부터 지적인 영역만이 아닌 감정적인 영역 즉, 인간의 유머 코드를 이해하는 수준은 되어야 사고를 하는 컴퓨터라 볼 수 있지 않을까 하는 생각입니다.  사실 음성 대화는 네비게이션의 음성인식부터 아이폰의 시리 등 이미 사용하고 있는 영역입니다.  그렇다면 단순히 텍스트로 30%가 사람으로 인식하면 된다는 튜링 테스트는 현대기술과는 맞지 않는 기준인 것은 분명해 보이기 때문에 새로운 기준이 있어야 할 것으로 보입니다. 물론 튜링의 놀라운 통찰력은 인공지능의 사고를 어떻게 측정할 것인가 하는 생각의 시작을 제시함으로서 기술 발전에 지대한 역할을 했다고 생각됩니다.  


 마무리로 개인적으로 생각되는 인공지능의 사고능력을 알 수 있는 기준은 상황에 따른 유머를 이해하여 진짜로 웃을 수 있고, 슬픈 상황에서 진짜로 슬퍼할 수 있는 인공지능이야 말로 사고능력이 있다고 할 수 있지 않을까 생각합니다.     




Comments