본문 바로가기
윤's/┗ 웹 / 콘텐츠 / 플랫폼

음성인식 UX의 완성도를 높이는 시작점 - 음성 테스트 UX

by cfono1 2017. 12. 11.


- 관련 기사

스마트스피커 '춘추전국'..'AI강자' 中 바이두도 뛰어들어(링크)

"스마트 스피커는 트로이 목마와 같다"(링크)


- 관련 글

음성 AI 시대의 참새방앗간에 진출한 애플의 AI 스피커 - HomePod(링크)

IoT 시대에 근간이 될 개념 - SCP(Smart Connected Products)(링크)

스마트워치 부흥의 디딤돌, 홈 AI 서비스(링크)

삼성전자의 음성인식 투트랙 전략에서 보이는 어두운 기운(링크)


아마존 에코 및 경쟁제품들의 동향과 시사점.pdf


왜 네이버, 카카오는 AI스피커를 뿌려대는가 - 인공지능 스피커의 UX특성을 고려한 전략.pdf


현재 스마트 스피커 시장은 뜨겁다. 그야말로 핫한 시장이다. 이전의 글에서도 적었듯이 어느 날 갑자기 벼락처럼 모든 사람의 삶 속에 파고드는 것은 사실상 불가능에 가깝다. 낯선 것은 망설임을 낳고 망설임은 시장 확대의 적이다. 그렇기에 익숙함을 무기로 스며드는 것이 필요하다. 현재의 스마트폰도 가능성의 한계는 피처폰과 비교가 안 되지만 처음 사람들의 인식은 발전한 휴대전화기다. 익숙한 것이 새로울 때 사람들은 감탄하게 된다.


스마트 스피커도 결국에는 그렇게 될 것이다. 우리가 살면서 내리는 많은 지시가 문서 또는 터치(클릭)를 통해서도 하지만 말로 하는 것도 있듯이 결국 음성을 통한 듣고 말하기는 하나의 조작 수단으로 자리 잡을 것이고 그 역할은 스마트 스피커가 할 것이다. 물론 쓰임새가 늘어나기까지는 시간이 걸린다. 이 시간을 잘 견디기 위해 음악 감상이라는 킬러 콘텐츠가 필요한 것이고 스마트의 쓰임새를 말하지만, 스피커의 쓰임새(특히 애플)도 말하는 것이다. 많은 기업이 노력하는 쓰임새 외에 또 하나 필요한 것이 있다면 무엇일까? 바로 음성 인식의 완성도다.


음성 인식의 완성도는 앞서 말한 쓰임새의 기본이다. 사람 간의 대화에서도 말을 잘 이해하지 못하면 짜증이 나기 마련인데 기계와의 대화도 다를 리가 없다. 이 부분을 높이기 위해 고민하는 것 또한 너무나 중요한 것이다. 그렇다면 방법은 무엇일까? 사용자가 마냥 늘어나서 누적되는 데이터가 증가하길 기다리는 것? 그것은 너무 수동적이다. 좀 더 적극적인 방법이 필요하다.




미션 임파서블 3에서 악당으로 변장하기 위해 음성도 모사하는 순간이다. 음성 샘플을 위해 특정 문장을 정확하게 읽으라고 한다. 그리고 이 샘플은 실시간 분석되어 같은 톤으로 말할 수 있게 해준다. 그렇다. 사실상 해당 사용자에게 가장 정확한 인식을 하기 위한 방법은 테스트 하는 것이다. 모든 사용자가 공통적인 문장을 읽을 때 어떤 사용자가 어떤 발음에서 특이점이 있고 이 특이점을 어떻게 처리할 것인지 알 수 있다. 테스트 과정에서 (ㄱ)이라는 초성을 기역이라고 읽으면 '기역'이라고 발음할 때 그렇게 인식하면 되고 '기윽'이라고 읽으면 그렇게 인식하면 된다. 정확한 발음을 위해 사용자에게 표준어를 교육시킬 수는 없는 것 아닌가? 테스트 문장 샘플의 타당성만 적절하다면 언어 습관에서 오는 인식률 저하를 상당히 끌어올릴 수 있다. 



물론 여기까지는 기술 측면의 전략적인 판단이다. 이제는 사용자 측면의 전략적인 판단이 필요하다. 이 과정을 어떻게 포장할 것인가의 문제다. 사용자가 불편하지도 않으면서 재미도 느낄 수 있고 필요하다고 인정할 수 있는 과정이어야 한다. 지문 인식 과정은 짧은 순간이므로 그렇게 크게 불편함을 느끼기 어렵지만, 음성은 언어의 종류에 따른 특성, 지역, 나이, 성별, 음성 장애 유무와 정도, 개인적 언어 습관 등 더 많은 변수가 존재한다. 이런 음성의 적절한 샘플을 추출할 수 있는 음성 테스트 UX를 기계적인 시험 방식으로 처리한다면 오히려 음성 테스트 UX를 건너뛸 가능성이 크다. 아 귀찮아하면서 말이다. 그러면 안 하는 것만 못하다. 우선 전략자산이 음원이 많다면 가장 쉬운 접근은 노래방이다. 이미 가사가 있고 따라 부르면서 사용자의 발음 특성을 체크할 수 있을 뿐 아니라 대중적인 노래일수록 사용자 샘플의 비교가 쉽기 때문이다.



많은 기업이 핵심 시장이라 주목하는 스마트 스피커. 실제로도 경쟁력의 판도를 바꾸는 핵심 지점이기도 한 이 시장에서 플랫폼의 근간이 될 인식률 싸움을 어떻게 풀어나갈 것인지의 전략은 이제 핵심 과제이다.




* 이미지는 구글 검색입니다(사진 1, 사진 2 & 3, 사진 4)

* 첨부자료는 디지에코입니다(링크).