글로벌타임스 "새 모델, 오독률 2.97%로 낮췄다..인간 평균치, 5.9%"

"엄격한 훈련 받은 전문가, 3%가량..마이크로소프트-IBM는 5% 수준"



(서울=연합인포맥스) 선재규 기자= 중국의 대표적 인공 지능(AI) 스타트업 클라우드워크가 새로운 음성 인식 기술에서 세계 기록을 새로 갈아 치웠음을 밝혔다고 글로벌타임스가 보도했다.

글로벌타임스는 29일 클라우드워크가 보내온 자료를 인용해 이 회사의 새로운 음성 인식 모델 '피라미덜-FSMN'의 단어 오독률이 2.97%에 그친 것으로 발표됐다고 전했다.

신문은 이 수치가 음성 인식 연구에 널리 쓰이는 세계 최대 규모 공개 영어 음성 데이터 리브리스피치에 근거해 나온 것이라면서, 엄격한 훈련을 받은 전문가들의 평균 오독률이 3%가량이라고 비교했다.

일반인의 오독률은 평균 5.9%에 달한다고 덧붙였다.

글로벌타임스는 또 클라우드워크 실적이 마이크로소프트와 IMB 등 글로벌 IT 대기업에 비해서도 월등히 개선된 것이라고 강조했다. 그러면서 마이크로소프트와 IBM이 전화를 통한 영어 음성 데이터 스위치보드에 기반해 확보한 오독률도 대략 5% 수준에 그친 것으로 지난해 발표됐다고 지적했다.

중국 과학원 충칭 연구소를 기반으로 2015년 출범한 클라우드워크는 안면 인식 기술에서도 획기적인 발판을 구축한 스타트업으로 평가받는다고 글로벌타임스는 설명했다.

jksun@yna.co.kr

(끝)
저작권자 © 연합인포맥스 무단전재 및 재배포 금지