공공기관에서 스켈터랩스의 MRC(기계독해) 기술을 도입한 후 얻을 수 있는 기대효과를 실제 사례를 통해 알아봅니다.
요약
문제 (Problem)
- 피해자 조사의 어려움: 피해자 조사는 민감하고 복잡한 정보 처리를 필요로 하며, 수사관이 모든 세부 사항을 정확하게 기록하는 데 어려움이 있음.
- 데이터 관리의 복잡성: 범죄 사실 조사와 관련된 비정형 자료의 관리와 분석이 어려움.
- 증거 확보의 제한성: 전화 녹음과 같은 음성 자료의 정확한 분석과 화자 식별이 어려움. 유효한 증거로 사용하기 위한 도전 과제 존재.
- 수사 데이터에 맞지 않는 일반적 AI 모델의 한계: 정확한 수사를 위해 특정 수사 데이터에 맞게 AI 모델을 최적화하는 과제 존재.
해결책 (Solutions)
- 스켈터랩스 MRC 도입으로 고도화된 조서 작성: AI 조서 시스템을 통해 성폭력 피해자와 수사관의 조사 과정 지원 강화. 비정형 자료를 데이터베이스화하여, 수사 과정에서 취득한 정보 관리와 활용이 용이해짐.
- 유효한 증거 확보 지원: 피해자 조서 및 전화 녹취 파일의 내용에서 범죄 사실을 검색하고 답변을 제공함으로써, 보다 정확하고 신속한 증거 확보 지원.
- 한국어 데이터셋에 최적화된 MRC 모델 도입: 'KorQuAD 1.0'과 'KorQuAD 2.0'에서 최상위권 성능을 보인 MRC 기술을 도입해 한국어 데이터셋에 특화된 독해력을 갖춤.
- 파인튜닝을 통한 경찰청 수사기관 시스템에 최적화된 AI 모델 활용: 실제 수사 데이터를 기반으로 한 파인튜닝 작업을 통해, 경찰청 수사 시스템에 알맞게 최적화. 이로 인해 조서 작성 및 전화 통화 녹취 파일에서의 범죄 사실 요건 확인이 효과적으로 이루어짐.
공공기관 기계독해(MRC) 기술 활용 실제 사례 :: 경찰청 여성청소년과
- 경찰청 서비스 개요:
피해자와 수사관의 조사 과정을 돕기 위한 AI 조서 시스템 고도화 - 서비스 도입 기관:
전국 시도 경찰청 여성청소년과 전국 1, 2급 경찰서 및 해바라기센터 등 을 포함한 총 239개소에서 운영 - 사용된 솔루션 및 기술:
스켈터랩스 자체 개발 MRC(기계독해) 기술 - 서비스 구현 방식:
온프레미스 - 활용 목적:
피해자 조서 작성, 범죄 사실 조사 등의 업무에서 누적되는 비정형 자료를 AI를 활용해 데이터베이스화해 범죄 수사 효율을 높이고 피해자 조사 지원을 강화하기 위한 목적 - 주요 기능:
수사 구성요건 분류 기반 범죄 사실 데이터 구축
자연어 기반 검색 서비스 제공 - 기대 효과(경찰청):
① 범죄 유형별 법적 구성요건을 세분화하여 피해자 조사 지원 시스템 고도화 및 유효한 증거 확보
② 비정형 자료를 데이터베이스화하여, 수사 과정에서의 정보 관리 및 조서 작성이 용이해짐
③ 수사관 업무 효율 상승
경찰청 ‘AI 음성인식 활용 조서 작성 시스템’에 활용된 MRC(기계독해) 기술 소개
이번 프로젝트를 진행하며 공공기관에서 MRC 기술을 도입한 후 얻을 수 있는 기대 효과를 정리해보았습니다.
#1. 민감하고 복잡한 정보 처리로 인한 피해자 조사의 어려움 → 맥락 읽는 MRC 기술을 통해 범죄 사실 확인과 증거 확보 지원 ✅
경찰청은 스켈터랩스의 MRC 기술을 성공적으로 도입해 범죄 수사 효율을 높였습니다.
특히, 스켈터랩스의 MRC 기술은 전화 통화 녹취 파일에서 범죄와 관련된 중요한 정보를 식별하고 이해하는데 크게 기여하고 있는데요. 사건의 핵심 구성요소를 파악하여 적절한 답변을 제공할 수 있는 것이 특징입니다.
예를 들어, 녹취록에서 '장소는 회사', '시간은 오후 4시'와 같은 범죄 관련 진술이 나올 경우, 시스템은 이를 범죄 사실로 태깅하여 관련 질문과 연결하고, 범죄 사실과 연계된 데이터를 구축하는 방식으로 작동합니다.
스켈터랩스가 개발한 MRC 기술은 딥러닝 엔진, 빅데이터 분석 및 예측 알고리즘에 기반합니다. 이 기술은 한국어 위키백과 데이터를 활용한 표준 데이터셋인 KorQuAD 버전 1.0과 2.0에서 최고 성능을 달성했습니다. 특히, KorQuAD 1.0에서는 인간의 독해 능력을 넘어서는 95.15의 F1 점수를 기록하며 뛰어난 결과를 기록했습니다.
이러한 기술적 우수성을 바탕으로 경찰청은 전문 기관의 인력과 지식을 활용하여 수사 지원 시스템을 개발 및 고도화 하였으며, 이를 통해 조사 및 전화 녹취 분석을 통한 정확한 범죄 사실 확인과 유효한 증거를 확보할 수 있도록 지원하였습니다.
#2. 수사 데이터에 맞지 않는 일반적 AI 모델의 한계 → 수사 데이터를 기반으로 한 파인튜닝 작업을 통해, 경찰청 수사 시스템에 알맞게 최적화 ✅
경찰청 AI 조서 시스템 고도화 과정에서 스켈터랩스는 실제 수사 데이터를 기반으로 한 파인튜닝 작업을 진행했습니다. 이를 통해 경찰청의 내부 시스템에 완벽하게 통합된 맞춤형 AI 솔루션을 제공, 조서 작성과 전화 통화 녹취 파일 분석의 효율성을 크게 향상시켰는데요.
이 과정에서 자체 개발한 고성능 MRC(기계독해) 모델을 활용하여 경찰청 시스템에 최적화된 솔루션을 구축했습니다. 이를 통해 피해자 조서 작성, 범죄 사실 조사 등의 업무에서 누적되는 비정형 자료를 인공지능을 활용해 데이터베이스화하여 범죄 수사 효율을 높이고 피해자 조사 지원을 강화하였습니다.
이처럼 스켈터랩스의 MRC 기술은 강력한 사용성과 범용성을 자랑합니다. 이러한 특장점은 이미 금융, 의료, 커머스 분야 등에서 폭넓게 활용되고 있으며, 도메인 특화 및 경량화된 솔루션으로 다양한 산업 분야에서 그 가치를 입증하고 있습니다.