본문 바로가기
인공지능 A.I.

대화하는 인공지능 이루다

by 이슈★몽땅 2021. 1. 24.
반응형
안녕하세요. 오늘은 인간과 대화하는 인공지능 이루다에 대해 알아보겠습니다.

 

대화하는 인공지능 이루다

 

이루다의 등장과 퇴장

스캐터랩 소속 핑퐁 팀에서 개발한 페이스북 메신저 채팅 기반 열린 주제 대화형 인공지능 챗봇이다. 이루나 와 달리 인공지능 기술을 어느 정도 갖추었다는 의미로 이루다라는 이름을 쓴, 이것이 이루다다. 2020년 12월 말 처음 공개되고 2021년 1월 초에 이용자 수 40만 명에 페이스북 페이지 팔로워가 10만 명을 찍으며 큰 인기를 얻었는데 이루다가 다른 챗 볼들과 다르게 딥러닝 알고리즘을 이용한 인공지능이라는 게 한몫한 것 같다. 이루다가 사람들과 대화하는 양이 늘어날수록 딥러닝 알고리즘의 여러 가지 문제점이 발견되기 시작했고 개인정보 유출 논란이 생기며 결국 잠정 중단되었다.

이루다를 만들기 위한 기술

자연어 처리 기술을 적용하여 만들어졌다. 2018년 11월에 메시 인코더와 BERT라는 이름의 기술인데 구글에서 공개하였다고한다. 이루다가 사용자들과 자연스럽게 말을 주고받게 하기 위해서는 엄청나게 많은 언어를 학습시켜야 했는데 딥러닝을 이용한 인공지능이다 보니 학습량이 많을수록 성능이 좋아지기 때문에 약 100억 건 정도의 한국어를 익혔다고 한다. 구글에서는 오픈 도메인 챗봇의 대화 기술의 성능을 평가하는 지표 SSA를 사용하는데, 이루다는 SSA 78%를 기록하였다. 이는 사람의 SSA인 86%에 근접한 수준으로, 구글에서 2020년 초에 공개한 오픈 도메인 챗봇 미나보다 약간 더 좋은 수준이다. 엄청난 기술을 들여 만든 이루다지만 부족한 점도 존재했다. 베타 버전에 비하면 많이 좋아진 성능이었지만 10 문장 이상 대화를 하게 되면 앞의 내용을 까먹어버리고 새로운 대답을 하기도 하고 특정한 정보를 얻기 위해 사이트에서 검색을 하거나 올바른 정보를 찾는 부분에서는 부족했다. 문제는 이 말고도 더 있었는데 일반상식적인 면에서 부족했다. 일반인들의 대화를 수집하여 학습한 인공지능이라서 기본적인 것을 물어봐도 잘 대답을 하지 못했다. 사실 위키피디아 등의 일반 상식 정보가 풍부한 문서 자료를 함께 학습시키면 상식 문제도 어느 정도 해결이 되지만 스캐터랩의 자료를 확인해보면 이러한 메신저 대화 외의 언어 데어터는 이루다 개발 시 사용하지 않은 것으로 보인다. 그리고 사진을 분류하는 능력이 현저히 떨어졌는데 이루다에게 사진을 보내면 동일한 반응을 반복하거나 감탄사로만 대답을 하였다.

이루다를 둘러싼 논란

이루다는 많은 사람들의 관심을 받은 만큼 논란도 짧은 시간에 굉장히 많이 나왔다. 첫 번째로는 혐오 메시지를 전송한다는것이다. 현재 사회는 성소수자에 대해 나쁘게 말하는것을 꺼려하는 분위기이다. 하지만 이루다에게 성소수자에 대한 단어를 사용하여 대화를 하면 싫어한다고하거나 혐오한다고하는 답변을 하기도해서 동성애 자체를 혐오하는것이 아니냐는 논란이 불기도하였다. 두번째는 본래의 이용목적 외의 용도로 사용하는 사용자가 늘어나는 것이였다. 일부 이용자들이 이루다를 외설적 목적으로 사용하여 논란이 일어났었다. 이러한 논란은 심심이가 열풍일때도 있었던 일인만큼 개발자측에서는 이런 일이 일어날줄 알았다고 계속해서 개선해나가겠다는 입장을 밝혔다. 이루다가 외설적인 말을 하게 성적인 표현을 사용하는게 윤리적으로 봤을때 AI인데도 잘못됐다고 하는게 맞는지에 대해서도 찬반논란이 일었었다. 사용자들이 이루다에게 외설적 대화를 입력하는 것과는 별개로, 이루다가 약한 수위의 말에도 더 크게 반응하여 높은 수위의 대답을 하는 경우도 상당 수 보고되었다. 세번째개인정보 침해 논란이다. 이루다의 대화 능력을 향상 시키기 위해서 약 100억건의 단어를 수집하고 학습했다고 했었는데 이 대화의 출처가 논란의 대상이였다. 이루다를 개발한 스캐터립 핑퐁팀은 이 많은 대화를 어디서 가져왔냐는 질문에 "연애의 과학"이라는 서비스에서도 상당 수 참고를 하였다고 밝혔다. "연애의 과학"이라는 시스템에서는 사용자의 카카오톡 메세지를 수집하여서 보고서를 만들어주는 유료 기능이 있었는데 그곳에서 사용자들의 허락 여부를 묻지 않고 이루다에 사용한 것이 문제가 된 것이다. 심지어 연애의 과학의 약관 사항에는 수집된 정보는 새로운 서비스를 제공하기 위해 이용된다고 했지만 내용과는 전혀 다르게 인공지능의 학습을 위해서 사용되고 있었던 것이다. 이러한 부분에서 많은 사용자에게 뭇매를 맞았다. 

개인적인 생각

이루다가 처음 등장했을 때는 심심이를 이을 새로운 대화 인공지능이라는 생각에 굉장히 들떠 있었던 것 같다. 하지만 생각과는 전혀 다른 방향으로 흘러가기 시작했고 사람들은 인터넷에 이루다에게 어떤 말을 어떻게 해야 야한 말처럼 보이는지, 야한 대답을 하는지 연구하고 공유하기 시작했고 그러한 사람들이 하나 둘 모이기 시작해서 결국 이루다의 최후는 그리 좋지 않게 끝난 것 같다.

반응형

댓글