블로그
AI 관련 인사이트와 스켈터랩스의 기술 소식을 전해 드립니다.
Insight
대화형 인터페이스의 시대 : ‘좋은 대화 설계’에 대한 고찰
사용자 인터페이스의 개념과 역사



사용자 인터페이스(UI)는 컴퓨터 화면에 나타나는 버튼, 아이콘, 메뉴, 명령어 등 을 통해 사람과 기계 간 정보를 교환하는 수단입니다.

사용자는 기계에게 마우스 클릭 한 번으로 명령을 내리거나 키보드를 통해 데이터를 입력함으로써 특정 작업을 수행하도록 기계에 지시하고, 지시를 받은 기계는 다양한 형태로 정보를 제공하거나 사용자의 요청을 처리하는 방식이죠.

예를 들어, 지금 이 블로그 글을 보기 위해 스켈터랩스 웹사이트를 키보드로 검색해 접속하고, 블로그 글을 찾아 클릭해 스크롤하며 글을 읽는 모든 과정이 다 인터페이스를 활용한 것입니다.

대표적인 인터페이스 종류에 대해 알아봅니다:

1. 텍스트 기반 인터페이스

텍스트 기반 인터페이스는 오랫동안 컴퓨터와 상호 작용할 수 있는 유일한 방법이었고, 엄격한 유형의 명령어를 사용해오다 자유로운 자연어 텍스트로 발전했습니다.

텍스트 기반 상호 작용의 가장 일반적인 사용 방법으로는 구글, 빙과 같은 검색 엔진이 있는데요. 가령 ‘NYC에 있는 호텔 검색’과 같은 문장을 입력하면 NYC에 있는 호텔 리스트를 제공하는 식으로 정보를 제공합니다.

2. 그래픽 사용자 인터페이스(GUI)

곧 이어 텍스트 기반 인터페이스 다음으로 '그래픽 사용자 인터페이스(Graphic User Interface, GUI)'가 등장하며 사용자 경험이 대폭 개선되었습니다.

이는 현대 컴퓨터에서 흔히 볼 수 있는 형태로, 입력 과정과 응답을 다양한 기능을 통해 더 간편하고 직관적으로 정보를 제공합니다.

PC 운영 체제인 마이크로소프트 윈도우의 도입 덕분에 GUI가 가장 인기 높은 인터페이스가 되었고, 터치스크린 장치가 도입돼 마우스까지 필요 없게 되면서 컴퓨터와 보다 직접적이고 자연스러운 상호 작용이 가능해졌습니다.

3. 대화형 인터페이스(CUI)

최신의 컴퓨터–인간 상호 작용은 대화형 인터페이스(Conversational User Interface, CUI) 입니다.

CUI는 사용자가 일상에서 사용하는 언어, 즉 '자연어'를 사용하여 컴퓨터나 기기와 대화하듯이 명령을 내리거나 질문을 할 수 있는 기능을 제공합니다. 자연스러운 언어 처리 기술을 통해 기계와 “대화”하며, 사용자의 명령을 더욱 정확하게 인식하고 수행합니다.대표적인 예시로는 챗봇이 있습니다.

새로운 세대의 대화형 인터페이스 시대가 열리면서, 인간의 언어와 대화를 기술로 재현하려는 노력이 높아지고 있습니다. 이를 위해서는 결국, 인간이 언어를 전달하는 방식에 대한 깊은 이해가 필요한데요. 좋은 대화 설계란 무엇이고, 어떤 모습을 하고 있을까요?

잘 설계된 대화형 인터페이스란



인간은 오랜 세월 동안 언어를 통해 지식과 경험을 전달해왔습니다.

그 중심엔 '말성'과 '글성'이라는 두 가지 주요 속성이 있습니다: 말성은 일상 대화에서 자연스럽게 나타나는 반면, 글성은 교과서나 논문처럼 정제된 정보 전달에서 주로 볼 수 있습니다. 이 두 방식은 각각 다른 영향을 미치지만, 때로는 서로 섞여 복합적인 전달 방식을 만들기도 하죠.

이렇듯 잘 설계된 챗봇은 대화의 본질과 특성에 대한 깊은 이해를 기반으로, '말성'과 '글성'을 모두 균형 있게 반영해야 합니다. 잘 설계된 챗봇의 기준을 두가지로 나눠서 소개합니다:

1. '잘 설계된 CUI 기반 챗봇'은 사람의 대화 로직을 기준으로 작동합니다.

대화는 간단하게 보면 두 사람 사이의 정보교류 입니다.

한쪽이 물음을 던지면, 다른 한쪽은 답변을 제공하는 단순한 원칙은 대화의 기본 규칙이자, CUI에도 적용되는 기본적인 원리입니다.

이러한 원리는 일상 대화에서도 쉽게 찾아볼 수 있습니다.

가령 "내일 뭐할거야?"라는 질문에 "카페가고 싶어"라고 답하면, 그에 이어지는 질문인 "몇시에?"를 물어보고 "3시가 좋겠어"라고 답하는 ‘티키타카' 방식으로 의사소통하는 것이 일반적입니다.

챗봇도 마찬가지입니다.

잘 설계된 CUI를 기반으로 구축된 챗봇은, 사용자의 입력에 따라 응답을 제공하는 "대화"구조로 설계되었습니다.

때문에 챗봇을 단순한 정보 제공 도구로만 보고 대화의 중요성을 무시한다면, 한 번에 너무 많은 정보를 줄 수 있어 사용자가 이해하기 어렵게 만들 수 있습니다.(사용자가 수십페이지 분량의 정보를 원하지 않은 이상, 많은 분량의 답변을 한꺼번에 제공하는 것은 과잉 될 수 있죠.)

가령 "제주도의 날씨는 어때?"라는 질문에 "제주도는 구름 한 점 없는 맑은 날씨에요. 자외선 지수가 높으니 선크림을 바르고 양산을 챙기세요!"라고 간결하게 답변하는 것이 사용자의 기대에 부합합니다. 반면에, "제주도의 기후는…"로 시작하여 제주도의 기후에 대한 전반적인 설명을 시작한다면, 이는 간결한 답변을 바란 사용자의 기대와는 거리가 있을 것입니다.

대신 단계적으로 정보를 주고받는 대화 방식을 이용하면, 챗봇을 더욱 효율적으로 활용할 수 있죠.

예를 들어, "여름 맞이 푸드 신메뉴로 뭐가 있지?"라는 질문에 "어떤 브랜드의 푸드 신메뉴가 궁금하냐"라고 물어보면, 그에 맞는 답변인 "S사 신메뉴"를 답하고 "S사 신메뉴에는~"이라고 답하는 방식으로 대화해 원하는 정보를 얻을 수 있겠죠.



BELLA QNA 는 이렇게 잘 설계된 CUI의 원칙을 기반으로 설계되었습니다.

잘못 설계된 CUI와는 달리, BELLA QNA는 사용자의 ‘티키타카'로 부터 적합하고 즉각적인 응답을 찾아 제공하고, 대화에서 얻은 정보나 도메인에 따라 가장 최적화된 정보를 선택하여 답변하기도 합니다.

2. '잘 설계된 CUI 기반 챗봇'은 대화의 맥락을 파악해 길을 잃지 않습니다.

대화의 맥락을 파악해 길을 잃지 않고 간결한 답변을 제공하고 요청을 수행하는 것은 사람간의 대화에서나 챗봇과의 대화에서나 중요한 요소입니다.

대화 중에 다른 주제로 이야기가 옮겨가더라도, 기존의 대화 내용을 완전히 잊어버리면 안 됩니다. 가령 물건을 주문하는 도중 다른 주제로 이야기가 전환되었다가 다시 주제로 돌아왔을 때, 기존에 이야기하고 있던 주제와 정보를 기억하고 있어야 하죠.



예를 들어, “WALL-E 영화 보고 싶어"라며 영화 예매 과업을 요청하는 대화에서 갑자기 “근데 돌비는 어느 자리에서 보는게 좋을까?”라는 뜬금포 질문을 해도, 잘 설계된 CUI를 기반으로 한 챗봇은 질문에 대한 답변을 제공한 후 과업인 영화 예매를 이어서 진행해야 합니다. 반면 잘못 설계된 CUI를 제공하는 챗봇은 사용자가 원하지 않는 답변을 한꺼번에 많이 답변하며 과업도 수행하지 못합니다.

과업수행을 자연스러운 대화의 형태로 제공하는 AIQ+ Chat 는 이전 대화의 맥락을 지속적으로 파악하고 있습니다.

잘못 설계된 CUI는 중간에 대화의 흐름을 잃어버리기 쉽지만, AIQ+ Chat은 중간에 다른 대화를 하더라도 기존에 진행하던 과업을 완벽하게 마무리하죠.

대화형 인터페이스 시대의 도래



“대화”는 모든 인터페이스의 시작점입니다.

마치 사람들이 자기 이야기만 하는 상대를 좋아하지 않는 것처럼, 챗봇도 정보를 한 번에 쏟아내기보다는 대화식으로 설계되어야 훨씬 더 효과적인 정보 교류가 가능한 것이죠.

혁명 그 자체였던 그래픽 사용자 인터페이스 시대를 지나,
본질로 돌아간 대화형 인터페이스의 시대가 도래한 오늘 날.

그 무엇보다 중요한 것은 인간의 대화 방식, 그리고 그 대화의 특성을 얼마나 잘 이해하고 인공지능에 반영하는가에 달려있습니다.

챗봇을 도입하기 전, △대화의 본질을 파악하는지 △대화식 설계 원칙을 반영하는지 △‘티키타카’가 잘 되는지 △복잡한 대화에서 길을 잃지 않고 과업을 수행하는지 등 CUI측면에서 꼼꼼히 검토한 후 전문가의 조언을 받아 선택한다면 챗봇의 성능을 100% 활용할 수 있을 것 입니다.


<참고 문헌> Batish, R. (2018, September 29). Voicebot and Chatbot Design. Packt Publishing Ltd.

기업용 AI 솔루션 도입
스켈터랩스와 함께라면 생각보다 어렵지 않습니다.