AI 스피커 시장에 뛰어드는 국내 기업

2014년 11월 ‘아마존’(Amazon)이 인공지능 음성 비서인 ‘알렉사’(Alexa)와 결합한 인공지능 스피커를 출시했다. 음성을 통해 명령하면 스피커가 출력하는 것에 소비자의 관심이 커지기 시작했고 사용 편의성이 높아지면서 새로운 시장이 개척되었다.

2018년 7월 22일 디지털 미디어렙 나스 미디어의 ‘2018 상반기 미디어 트렌드 보고서’에 따르면 2018년 AI 스피커가 국내 전체 가구의 15% 수준인 300만대가량 보급될 것으로 전망됐다. 7가구 중 1가구는 AI 스피커를 보유할 것이라는 예측이다. 국내 이동 통신 기업인 SKT와 KT는 인터넷, 모바일, 인터넷TV(IPTV) 등 자사 기존 서비스와 연계하고 네이버와 카카오는 음원 서비스를 묶어 파는 등 프로모션 경쟁으로 AI 플랫폼을 구축하기 위해 스피커 시장에 뛰어들고 있다.

글로벌 No.1으로 나가는 KT의 ‘기가 지니’

기존 AI 스피커들이 청각 기반의 서비스를 제공하는 반면 기가 지니는 시청각 기반의 인공지능 서비스를 제공한다. 음성만으로 인지하기 힘든 어려운 정보를 눈으로 직접 확인할 수 있다. 예를 들어 일반 AI 스피커에 날씨를 물어보면 음성대답만 하는데 기가 지니는 TV 화면에 날씨 정보를 보여주는 것이 다르다. 하만 카돈(Harman Kardon)의 스피커를 탑재하였다. 음성 인식률을 높이기 위해 마이크 4개를 탑재하였다. 원거리 음장기술, 자연어 처리 기술, 딥러닝 기술 등을 도입했다. 말하는 사람이 있는 방향에 따라 LED 불빛이 들어오는 기능이 추가되었다.

교육기업 대교와 협력하여 교육 콘텐츠도 강화하고 있다. 부모가 자녀에게 동화책을 읽어주면 기가 지니가 동화책의 단어를 인식하고 이에 맞는 효과음을 내는 서비스를 선보였다. 인터넷 TV의 셋톱 박스 형태로 TV와 연동된다. 서울 ‘노보텔 앰배서더 호텔’에 기가 지니 294대를 배치해 서비스를 제공하는 등 사물인터넷(IoT)의 확장으로 스피커를 통해 가전제품들도 제어가 가능하도록 기술을 발전시키고 있다.

SKT의 삶의 동반자 ‘NUGU’

SKT, NUGU

2016년 SKT는 이동 통신 업계들 중 최초로 AI 스피커를 선보였다. 자사 AI 스피커 ‘NUGU’에서 뉴스를 들을 때 특정 키워드로 뉴스를 검색할 수 있고 한국어 특화 음성 인식 기술을 갖춰 목소리 톤, 억양, 사투리까지 알아들을 수 있는 음성 인식률을 대폭 향상시켰다.

PC-FI 애호가들이 저주파 노이즈를 잡기 위해 케이블에 장착하는 장치인 ‘페라이트 코어’를 기본적으로 포함하고 고해상도 음원 플레이어의 선구자 아스텔앤컨(Astell&Kern)의 음향 튜닝을 거쳐 고음질을 가진 ‘스피커’ 로 발전하고 있다. 단순한 완성형 기기가 아닌 스스로 학습해 성장하는 '딥 러닝'(Deep Learning) 기술이 클라우드 소프트웨어와 연동되어 빅데이터를 이용한다.

SK브로드밴드와 셋톱 박스형 NUGU인 'B tv x NUGU'를 선보이며 AI 플랫폼 영역 확장에 나서고 있다. B tv x NUGU는 음성검색 기능을 집중적으로 고도화해 8중 복합 조건인 인물, 국가, 장르, 연도, 화질, 가격, 최신, 관객으로 콘텐츠 음성검색이 가능한 서비스를 제공한다.

SKT는 실내등 시장이 빠르게 성장하고 조명 기능에 대한 소비자들의 관심이 높아지고 있다는 점을 고려하여 2018년 7월 11일 AI 플랫폼과 조명 기능을 결합한 AI 기기 ‘누구 캔들(NUGU Candle)’을 출시했다. 기존 ‘NUGU mini’ 대비 출력을 3배 이상 높여 풍부하고 디테일한 음색을 구현하였고 음성으로 조명의 색이나 밝기를 조절할 수 있다는 것이 특징이다.

‘생활 속 AI’로 진화하는 카카오의 ‘카카오 미니’

카카오미니

카카오 미니의 강점은 대표 메신저 ‘카카오톡’, 음원 시장 1위 ‘멜론’과의 연계다. 생활 플랫폼으로 진화하고 있는 카카오와 연동해 택시 호출, 음식 주문 등 다양한 서비스를 이용할 수 있으며 음성 명령으로 카카오톡 메시지를 전송할 수 있다.

기존 카카오 미니는 스마트 스피커가 항시적으로 켜져 있어야 한다는 이유로 내장 배터리를 배제한 채 출시되었지만 이동성과 휴대성에 대한 소비자 요구가 높아지자 충전식 배터리 ‘카카오 미니C 포터블 팩’을 스피커 하단에 장착하면 무선으로 이용할 수 있도록 보완책을 마련하였다.

카카오의 자연어처리, 음성 합성 기술로 자연스러운 메시지 읽기를 구현해 대화하듯 카카오톡 커뮤니케이션을 이어 나갈 수 있도록 제공한다. 1:1 채팅방과 단체 채팅방의 새로운 메시지를 읽어주며 텍스트 메시지가 아닌 이모티콘, 동영상을 받은 경우에는 ‘이모티콘', ‘동영상' 이라고 말하여 메시지 형태를 알려준다. 사생활 보호를 위한 기능도 제공된다. 카카오톡 읽기 기능이 활성화되면 ‘헤이 카카오’ 카카오톡 플러스친구로 알림 메시지를 발송해 안내하고 숫자로 구성된 사용자 확인 코드를 설정하면 카카오톡 메시지 읽기 요청 시 코드를 말해야 읽어주는 사용자 확인 코드 설정 기능도 추가되었다.

생활 환경 플랫폼 구축에 나서는 네이버의 ‘네이버 클로바 프렌즈’

네이버, 클로바 프렌즈

네이버의 하정우 리더는 “네이버 클로바의 목적은 인공지능 플랫폼을 잘 구축해서 생태계를 구축하는 것이다”라고 말했다. 2017년 8월에는 클로바를 탑재한 AI 스피커 ‘웨이브’가 10월에는 라인 프렌즈 캐릭터를 활용한 AI 스피커 ‘프렌즈’가 출시됐다. 클로바 플랫폼은 LG전자 AI 스피커 ‘씽크 허브’와 푸르지오 아파트에 들어가는 등 파트너사들과 협약을 통해 생태계를 넓히고 있다.

AI 스피커는 광대한 데이터 베이스를 가진 국내 최대 포탈 사이트 네이버와 연계되어 네이버 검색, 라인 메시지 전송, 네이버 뮤직 등의 서비스를 이용할 수 있다. 378g의 가벼운 무게감과 한 손에 잡히는 휴대성도 장점이다. 내장배터리가 포함되어 있어 무선으로 최대 5시간 동안 사용할 수 있다. 360도 무지향성 사운드를 제공하기 때문에 위치에 따른 왜곡이 없으며 양방향 블루투스 연결을 지원하여 다른 기기와의 호환성을 높였다. 음성 쇼핑 서비스도 추가되었다.

안전한 쇼핑을 위해 아마존, 페이팔(Paypal) 등 글로벌 사업자들이 활용하는 FDS(Fraud Detection System)를 적용했다. 결제자 정보를 기반으로 패턴을 만든 후 평소 패턴과 다른 이상 결제를 잡아내어 결제 경로를 차단하는 보안 방식이다. 네이버는 과거 주문 이력을 바탕으로 간편하게 상품을 재 구매할 수 있는 기능과 등록한 목소리와 다른 목소리로 주문하는 경우 클로바가 결제를 승인하지 않는 '화자 인식' 기능도 추가하여 서비스 고도화에 나설 계획이다.

향후 스마트 스피커 사업자들의 전략은?

2018년 7월 10일 컨슈머 인사이트가 12,580명을 대상으로 조사한 결과 AI 스피커 이용자들의 불만 중 ‘음성 인식이 잘 되지 않는다.’ 는 것이 50%로 1위를 차지했다. 2위는 ‘자연스러운 대화가 곤란하다.’ 는 것이 41%를 차지했고 3위는 ‘외부 소음을 음성 명령으로 오인한다.’ 는 것이 36%를 차지했다.

AI 스피커의 지향점은 맞춤형 서비스인데 지금은 음악 재생, 조명 제어 등의 제한적 기능만 수행하는 데에다 기본적 음성인식에서도 한계를 보이고 있음을 알 수 있다. 다양한 업체와 협력하고 구글 검색으로 축적된 빅데이터로 음성 인식률을 높이는 ‘구글 홈’이 2018년 9월 11일 한국에 유입되면 국내 AI 스피커 시장의 경쟁이 치열해질 것으로 보인다.

단순히 질문에 대한 대답에만 초점을 맞추는 것이 아니라 각종 디바이스와 연결하여 생태계를 구축하는 것이 중요하다. 세계적인 경쟁력을 갖추기 위해서는 의료, 자동차, 금융 분야의 기업들과 협업해 차별화된 AI 스피커 서비스를 개발하고 관련 특허권 확보에 적극적인 노력을 기울여야 한다.

(작성자: 한양대 학생기자 최유민)

댓글
읽어들이는 중...