Speech AI
음성 인식 및 합성
스켈터랩스의 음성 인식 엔진은 여러 명이 이야기하거나, 정형화되지 않은 복잡한 문장에 대해서도 높은 정확도를 보장합니다. 음성 합성을 활용하여 특정인의 목소리를 학습하거나 혹은 새롭게 목소리를 생성하여 텍스트를 자연스러운 목소리로 변환할 수 있습니다. 이를 바탕으로 텍스트 기반의 인터페이스를 보이스 기반으로 전환하고, 고객 커뮤니케이션을 자동화합니다.
Speech AI
음성 인식 및 합성
스켈터랩스의 음성 인식 엔진은 여러 명이 이야기하거나, 정형화되지 않은 복잡한 문장에 대해서도 높은 정확도를 보장합니다. 음성 합성을 활용하여 특정인의 목소리를 학습하거나 혹은 새롭게 목소리를 생성하여 텍스트를 자연스러운 목소리로 변환할 수 있습니다. 이를 바탕으로 텍스트 기반의 인터페이스를 보이스 기반으로 전환하고, 고객 커뮤니케이션을 자동화합니다.

Speech-to-Text
음성 인식
다양한 환경에서 유입되는 음성을 정확하게 텍스트로 변환합니다. 극장, 카페, 공공시설 등 소음이 많은 다중 이용 시설에 특화된 음성 인식 엔진은 비디오 클립, 전화 통화 등에서의 환경별 테스트 시, 타사 대비 가장 높은 정확도를 자랑합니다.
딥러닝 기반의 종단간(End-to-end) 학습 방식을 적용한 음성 인식 엔진은 화자가 여러 명인 경우, 발음이 부정확한 경우 등 난해한 환경에서의 음성 인식 정확도를 크게 개선시켰습니다. 해당 엔진은 API 형태로 상용화되었으며, 금융, 통신서비스 등 다양한 전문 분야에 대한 맞춤 학습을 부가적으로 제공합니다. 현재 스켈터랩스 팀은 화자 분할(Speaker Diarization) 및 필터(Voice Filter), 화자 분리(Speaker Seperation) 기술을 집중 연구중이며, 이를 통해 전에 없던 음성 인식 기술의 활용 가능성을 제시합니다.

Speech-to-Text
음성 인식
다양한 환경에서 유입되는 음성을 정확하게 텍스트로 변환합니다. 극장, 카페, 공공시설 등 소음이 많은 다중 이용 시설에 특화된 음성 인식 엔진은 비디오 클립, 전화 통화 등에서의 환경별 테스트 시, 타사 대비 가장 높은 정확도를 자랑합니다.
딥러닝 기반의 종단간(End-to-end) 학습 방식을 적용한 음성 인식 엔진은 화자가 여러 명인 경우, 발음이 부정확한 경우 등 난해한 환경에서의 음성 인식 정확도를 크게 개선시켰습니다. 해당 엔진은 API 형태로 상용화되었으며, 금융, 통신서비스 등 다양한 전문 분야에 대한 맞춤 학습을 부가적으로 제공합니다. 현재 스켈터랩스 팀은 화자 분할(Speaker Diarization) 및 필터(Voice Filter), 화자 분리(Speaker Seperation) 기술을 집중 연구중이며, 이를 통해 전에 없던 음성 인식 기술의 활용 가능성을 제시합니다.

Text-to-Speech
음성 합성
텍스트를 인식하여 사람처럼 자연스러운 억양과 발음으로 전달합니다. 현재 스켈터랩스가 생성한 목소리는 성인 여성 2가지와 성인 남성 1가지로, 녹음된 데이터를 기반으로 유사 목소리 제작을 지원하고 있습니다.
현재 스켈터랩스 팀은 MelGan Vocoder를 통한 보다 자연스러운 음성 합성 엔진의 상용화를 앞두고 있습니다. 또한 적은 학습데이터로도 제작 가능한 Voice Font 서비스를 연구 및 개발하고 있습니다.
* 음성합성 엔진은 보이스봇 솔루션 내 패키지로 제공되며, 단독으로 판매되지 않습니다.

Text-to-Speech
음성 합성
텍스트를 인식하여 사람처럼 자연스러운 억양과 발음으로 전달합니다. 현재 스켈터랩스가 생성한 목소리는 성인 여성 2가지와 성인 남성 1가지로, 녹음된 데이터를 기반으로 유사 목소리 제작을 지원하고 있습니다.
현재 스켈터랩스 팀은 MelGan Vocoder를 통한 보다 자연스러운 음성 합성 엔진의 상용화를 앞두고 있습니다. 또한 적은 학습데이터로도 제작 가능한 Voice Font 서비스를 연구 및 개발하고 있습니다.