요약
문제 (Problem)
해결책 (Solutions)
의료기관 STT 실제 활용 사례 :: 분당서울대학교병원
분당서울대학교병원 STT 기술 도입에 활용된 AIQ+ Speech 솔루션 소개
이번 프로젝트를 진행하며 의료 분야에서 AIQ+ Speech STT를 도입한 후 얻을 수 있는 기대 효과를 정리해보았습니다.
#1. 많은 양의 상담 기록 작성으로 인한 콜센터 과부하 → 상담 내용을 실시간으로 텍스트로 변환하여 업무 부담 감소 ✅
분당서울대학교병원에서는 스켈터랩스의 AIQ+ Speech 솔루션에 포함된 STT 기술을 도입했습니다. End-to-End 방식의 딥러닝 모델은 복잡한 음성 데이터를 텍스트로 효율적으로 변환하며, 특화된 도메인 학습이 가능해 분당서울대학교병원 환경에 맞는 맞춤형 모델을 제공하고 있습니다.
특히, 스켈터랩스의 AIQ+ Speech STT 기술은 ▲25,000시간 분량의 한국어 음성 데이터셋을 기반으로 ▲실시간 및 비실시간 처리를 지원하며 ▲소음이 많은 환경이나 복잡한 숫자 인식에서도 정확하게 텍스트로 전환할 수 있는데요.
이를 통해 상담사들은 통화 종료 후에 환자 정보를 기록하거나 중요 정보를 재확인하는 데 시간을 낭비하지 않고, 실시간으로 환자의 상세 정보를 문서화할 수 있습니다.
#2. 수동 기록 과정에서 발생할 수 있는 오류 → Base 인식률 90% 이상으로 오류 최소화 ✅
스켈터랩스의 STT 기술은 딥러닝 기반의 음성-언어 모델을 활용하여 사람 간 대화의 문맥을 이해하고, 부정확한 발음이나 방언까지도 정확하게 인식합니다. 또한, 배경음악이 재생되는 장소, 다수의 사람이 말하는 환경, 소음이 심한 상황, 낮은 품질의 오디오 등에서도 높은 인식 정확도를 유지합니다.
최근에는 다양한 데이터셋을 통해 특히 한국어 방언 발화 데이터를 포함하여 다양한 사투리를 가진 화자의 음성 인식률을 크게 향상시켰는데요. 이를 통해 최대 90% 이상에 달하는 높은 Base 인식률을 달성했으며, 이는 Kaldi(음성인식 오픈소스) 기반 타사 음성인식 엔진과 비교했을 때 높은 수준입니다.
스켈터랩스의 AIQ+ Speech STT 기술을 분당서울대학교병원에 도입함으로써, 상담원이 수동으로 기록하는 과정에서 발생할 수 있는 오류를 크게 줄였습니다. 이는 상담 효율성을 높이는 동시에 환자 서비스의 질을 개선하는 중요한 역할을 하고 있습니다.