“배달 앱에서 도시락 주문해줘”라고 명령만 하면, AI가 직접 앱에 접속하여 도시락을 장바구니에 담아 결제까지 스스로 완료합니다.
미래에나 가능한 일 처럼 들리겠지만, AI가 사용자 대신 스스로 판단하여 행동하는 것은 더 이상 미래의 이야기가 아닙니다.
실제로, 스스로 햄버거를 주문하고, 트윗까지 작성해 날리는 등 사람의 개입 없이 문제 해결을 위한 의사결정을 자율적으로 판단하고 수행하는 인공지능 'Autonomous AI Agent (이하 자율 AI 에이전트)'가 등장하며 사람들의 관심은 자연스레 ChatGPT에서 자율 AI 에이전트로 이동하고 있는데요.
ChatGPT 출범 이후 큰 관심을 받고 있는 일명 자율 AI 에이전트가 무엇이고, 어떤 기능들이 있는지, 어떻게 동작하는지, 그리고 자율 AI 에이전트를 서비스화 한 실제 사례들과 자율 AI 에이전트의 미래에 대하여 알아보겠습니다.
💡AI 에이전트와 챗GPT의 차이점이 궁금하다면?
자율 AI 에이전트란?
자율 AI 에이전트는 사용자가 명령을 내리면 AI 에이전트가 ▲스스로 문제를 분석하여 ▲쉽게 해결 가능한 작은 단위의 문제로 분리하고 ▲외부 툴을 활용해 처리한 뒤 ▲반복적으로 결과물을 검토하고 ▲메모리에 저장해둔 사용자의 페르소나와 정보를 활용해 ▲답을 내어주는 기술입니다.
능동적을 넘어 자율적으로 태스크를 설계하고 검토하는, 즉 스스로 프롬프팅을 하는 과정을 반복해 결과물을 제시한다는 면에서 챗GPT 보다 한층 발전된 형태인데요. 가령 기존 챗봇은 답변에 도달하기 위해 사용자에게 끊임없이 질문하는 반면, 자율 AI 에이전트 챗봇 솔루션은 사람이 목표만 명령하면 사용자의 니즈를 스스로 파악하고 판단하여 답변을 제공하거나 과업을 수행할 수 있습니다.
자율 AI 에이전트는 크게 네가지 특징으로 나눌 수 있습니다:
📍 Planning - 사용자로부터 요청받은 복잡한 태스크를 수행하기 위한 계획을 세우고
📍 Tool Use - 어떤 도구를 이용하여 그 계획을 실행할 것인지를 자체적으로 결정해
📍 Memory - 중간중간 액션을 수행하고 관찰한 결과를 메모리에 저장하며 다음 태스크 수행에 반영해나가고
📍 Action - 마침내 과업을 수행합니다.
위 특징을 프로세스별로 더 자세히 살펴보면, 주로 6단계로 구분되어 사용자의 목표를 달성하기 위해 실행됩니다: ① 목표 정의 → ② 과업 분석‧분해 → ③ 과업 순서 설정 → ④ 과업 실행 → ⑤ 결과평가 → ⑥ 반복
예를 들어, 특정 주제에 대한 최신 뉴스의 요약을 원한다고 가정해봅시다.
1. 사용자가 에이전트에게 “너의 목표는 스켈터랩스에 대한 최신 뉴스를 수집하고 요약하여 제공하는거야"라고 지시합니다.
2. 에이전트는 구글에서 스켈터랩스 뉴스를 검색하여 상위에 노출된 기사 목록을 리스트업합니다.
3. 주된 목표(스켈터랩스 최신 뉴스 수집 및 요약 제공)로 다시 돌아가서 완료된 작업(스켈터랩스 최신 뉴스 리스트업)의 결과를 평가합니다. 이를 기반으로 다음 작업을 결정합니다.
4. 에이전트는 두 가지 새로운 작업을 생성합니다 :
1) 뉴스를 요약하고,
2) 구글에서 찾은 뉴스를 읽습니다
이 과정에서 에이전트는 중요도에 따른 우선순위를 스스로 고민합니다.
5. 뉴스를 먼저 읽는 게 중요하다고 생각한 에이전트는 우선순위를 재정렬합니다 :
1) 구글에서 찾은 뉴스를 읽고,
2) 뉴스를 요약합니다.
6. 에이전트는 구글에서 찾은 스켈터랩스의 최신 뉴스를 읽습니다.
7. 에이전트는 할 일 목록을 검토하고, 남아 있는 유일한 작업이 ‘뉴스를 요약'하는 것 이라는 것을 인지합니다.
8. 에이전트는 구글에서 찾은 스켈터랩스의 최신 뉴스를 요약합니다.
9. 사용자가 요청한 대로 “스켈터랩스에 대한 최근 뉴스를 수집하고 요약해 제공”하는 작업을 완료합니다.
이렇듯 자율 AI 에이전트 챗봇 솔루션은 단순한 지시만으로도 사람의 개입을 전혀 필요로 하지 않고 목표를 자동으로 달성한다는 점에서 편리합니다.
자율 AI 에이전트의 서비스화
AGI와 가장 근접하다고 평가되는 자율 AI 에이전트. 그러나 아직 ChatGPT만큼 대중적인 화제가 되지는 않았습니다.
이는 일반 사용자들에게는 다소 어려운 설치 방식과 낯선 인터페이스, 기대 이하의 성능, 그리고 비용으로 인한 한계점에 봉착하였기 때문인데요. 앞서 설명드린 햄버거 주문 사례는 재미있지만, 이를 설계하기 위한 과정은 쉽지 않고 쉽사리 포기를 하기 일쑤입니다.
이에 최근에는 별도의 설치 과정 없이 웹페이지를 통해 자율 AI 에이전트를 사용해볼 수 있게 하는 Auto-GPT와 같은 서비스들이 등장하며, 자율 AI 에이전트가 더 이상 실험이 아닌 서비스로서 거듭나고 있는데요. 여러 서비스들이 속속들이 탄생하고 있지만, 그 중 가장 큰 관심을 받은 에이전트 세가지를 소개합니다:
① Auto-GPT
자율 AI 에이전트의 개념은 올 초 Significant Gravitas라는 개발자가 GitHub에 'Auto-GPT'라는 이름으로 공유하며 개발자 커뮤니티에서 주목받기 시작했습니다. Auto-GPT 또한 자율 AI 에이전트답게, 사용자가 목표를 설정하면 자동으로 방법을 터득해 결과물을 내놓습니다. 사람의 개입없이 AI가 스스로 문제 해결 방식을 바꿔가며 목표를 달성합니다.
Auto-GPT는 크게 두가지 특징을 가지고 있는데요:
1. 스스로 외부 툴을 활용하는 기능
사람 개입 없이 문제 해결을 위한 의사결정을 자율적으로 판단하고 수행하기 위해, 다양한 외부 소프트웨어와 서비스와 스스로 소통하여 사용자 요청 없이도 자율적으로 반복을 거쳐 목표에 도달합니다.
2. 자율적으로 반복하는 기능
실수를 스스로 수정하는 '자율 반복' 기능을 사용해 결과물을 생성합니다. 현재는 일반적으로 'GPT-4'를 기반으로 만들며, 정보를 저장할 수 있는 별도 메모리 공간과 데이터를 검색, 저장, 편집할 수 있습니다.
그렇다면 Auto-GPT의 구동방식은 어떨까요?
Auto-GPT는 태스크 생성, 태스크 우선 순위 선정, 그리고 태스크 수행이라는 세 개의 주요 워크로드를 담당하는 에이전트들 (GPT-4 기반)로 구성되어 있습니다. 다음은 Auto-GPT의 프레임워크 개요입니다:
1. Goal Initialization
사용자가 목표를 입력하면, Task Queue를 거쳐 Task Creation Agent에 전달합니다.
2. Task Generation
전달받은 목표와 이제까지 완료된 태스크 목록을 기반으로 새로운 태스크 목록을 생성합니다.
3. Task Execution
태스크를 자동으로 수행합니다.
4. Memory Storage
AI가 수행한 태스크 목록, 결과에 대한 내용을 벡터 데이터베이스에 저장합니다.
5. Feedback Gathering
외부 데이터 또는 내부 다이얼로그에서 완료된 태스크에 대한 피드백을 수집합니다.
6. New Task Creation
수집된 피드백과 내부 다이얼로그를 기반으로 새로운 태스크를 생성합니다.
7. Task Prioritization
마지막으로 완료된 작업을 보고, 대기 중인 작업들의 중요성을 정합니다. 그 다음, 중요한 순서대로 작업 목록을 다시 정리합니다. 이 정리된 목록을 사용자에게 보여주고, "이 작업들을 이 순서대로 실행해도 괜찮을까요?"라고 승인을 요청합니다. 사용자가 승인하면, 그 작업들을 실행하라는 요청을 Task Execution Agent에게 보냅니다.
8. Iteration
1번에서 7번까지 최초 사이클이 한 번 돌았다면, 이후에는 AI 에이전트가 1번에서 사용자가 입력한 목표에 도달할 때 까지 2~7번을 자율적으로 반복합니다.
② God Mode
지난 5월, 가장 많은 주목을 받았던 자율 AI 에이전트 서비스 중 하나입니다. God Mode는 Auto-GPT를 브라우저에서 실행할 수 있도록 한 서비스입니다. 개발자가 아니더라도 쉽게 쓸 수 있도록 그래픽 인터페이스를 활용하고 있습니다.
③ Cognosys
목표를 입력하면 태스크를 자율적으로 계획하고 하나씩 우선 순위대로 실행하기 시작합니다. 개인적으로 사용해 본 소감으로는, 자연스러운 한국어 결과값을 내놓는 것을 확인할 수 있었습니다.
자율 AI 에이전트, 인공지능 산업의 또 다른 축 될까?
지난 5월 23일, 빌 게이츠는 <AI 포워드 2023>에서 “AI 개인 비서의 등장으로 사람들은 검색 사이트나 아마존에 갈 필요가 없어질 것”이라고 발언했습니다.
빌 게이츠가 말한 AI 개인 비서는, 사용자가 요구한 태스크를 달성하기 위해 스스로 상황을 판단하고, 어떻게 목표를 수행할지 자율적으로 계획하고 문제를 풀 수 있는, 마치 자율 AI 에이전트의 특성과 흡사한데요.
자율 AI 에이전트가 점차 대중화되며 이를 통해 단기간에 각종 목표를 달성한 사례가 연이어 공개되면서, 업무 생산성 증대에 대한 기대 향상과 더불어 ChatGPT의 뒤를 잇는 새로운 메가트렌드로 자리 잡을 것으로 주목받고 있습니다.