Siri, Alexa, Google⋯ 가장 똑똑한 음성 서비스는?

2019. 1. 10. 08:00애플 스페셜, 특집





요즘은 스마트폰에 음성 서비스가 탑재되는 게 당연한 시대가 되었습니다.. 대표적인 것을 따져 보면 애플 시리(Siri), 구글 어시스턴트, 아마존의 알렉사가 있겠는데요. 이들은 사용자들이 제일 많이 쓰는 대표적인 ‘인공 지능’ 서비스입니다. (아래 설명하겠지만 인공 지능처럼 보이는 서비스가 정확한 표현이라 할 수 있습니다.) 여튼 이번 포스팅에서는 각자 어떤 특징들이 있을지 살펴보도록 할게요.



▨      ▨      ▨



시리, 과연 인공지능이라 할 수 있나?

애플의 스마트폰과 스마트 스피커에는 ‘시리’가 탑재되어 있습니다. 그리고 타사 서비스로는 구글 어시스턴트(이하 어시스턴트), 아마존 알렉사도 있는데요. 많은 사람이 이들을 흔히 ‘인공 지능’이라고 하지만, 이는 자칫 오해를 불러올 수 있습니다. 적어도 애플은 시리를 인공 지능이라 부르지 않거든요. ‘머신 러닝 기술이 적용된 음성 비서’라고 말하고 있습니다.
 
머신 러닝은 인공 지능을 지탱하는 중요한 기술이기는 합니다. ‘그렇다면 시리를 인공 지능이라고 불러도 되지 않을까?’라고 생각하시는 분도 계실 텐데요. 확실히 시리는 음성 인식과 같은 기계 학습에 쓰이고는 있지만, 정작 사용자와의 대화는 프로그램화된 것에 불과합니다. 이는 어시스턴트와 알렉사도 마찬가지죠.

예를 들어볼게요. “재미있는 이야기를 해줘.”라고 했을 때, 알렉사와 어시스턴트는 말장난과 비슷한 수수께끼를 냅니다. 시리의 경우 화제를 돌리는 듯한 답변을 하다가 계속되는 요청에 시리의 과거에 얽힌 이야기를 해줍니다. 이런 응답을 가만히 보고 있자면 ‘알렉사는 친절하고, 어시스턴트는 똑똑하고, 시리는 쿨하다’라는 이미지를 받게 됩니다. 이는 각 음성 서비스의 지능이나 성격이 드러난 것이 아니라, 불행히도 서비스 제작팀 정책이 반영되어있을 뿐인 것이죠.


 구글 어시스턴트에 ‘재미있는 이야기 해줘’라고 하면, 말장난을 시작한다.

 
 

Siri에게 ‘재미있는 이야기 해줘’라고 하면 말을 빙빙 돌린다. 몇 번이나 끈질기게 물어야 자신에 대해 이야기를 해준다.  이는 인공지능의 재치가 아닌 인간에 의해 프로그램된 것에 불과하다.



일문일답 형식의 알렉사

‘프로그램된 것’이라는 것을 일단 전제로 깔아 놓고 봤을 때 각각의 음성 서비스는 어떤 장점이 있을까요? 먼저 알렉사는 복잡한 요청을 일문일답 방식으로 대응해준다는 것이 특징입니다. 이를테면 캘린더에 일정을 추가하고 싶을 경우 ‘날짜, 시간, 위치, 참가자, 내용 등’ 여러 정보를 입력해야 합니다. 시리와 어시스턴트의 경우라면 한 문장으로 입력해도 되거든요. ‘내일 5시부터 강남역에서 철수와 만나기’라는 형식으로 말이죠. 

그런데 이런 시리나 어시스턴트와 같은 방식이 꼭 장점은 아니랍니다. 중간에 내용을 잊어버리거나 말을 먹어버리는 등 귀찮은 상황이 생길 수 있거든요. 따라서 일부 항목만 전달하여 먼저 일정을 입력한 후, 캘린더 앱에서 나머지 정보를 보충하는 방법도 좋습니다.

다시 알렉사를 살펴볼게요. ‘5시에 약속이 있어’라고 말하면, ‘어떤 일입니까?’, ‘누구와 함께합니까?’ 등 하나하나 확인하고 정보를 추가하게 도와줍니다. 알렉사를 탑재한 기기는 아마존 에코(Amazon Echo)와 같은 스마트 스피커인데요. 사실 시리와 어시스턴트처럼 부족한 정보를 스마트폰에서 추가할 수 없기 때문에 음성만으로 일문일답 형식으로 입력해야 합니다. 어떻게 보면 매우 편리한 기능이죠.



대화 흐름을 기억하는 구글 어시스턴트

알렉사와 달리 구글 어시스턴트는 ‘대화 앞뒤 흐름을 기억하고 안내한다’라는 점에 뛰어납니다. 가령 ‘비틀즈’에 대해 물어본 후, “베이스는 누구야?”라고 물어보면 비틀즈의 베이스에 대해 제대로 대답을 해줍니다. 게다가 폴 매카트니만 알려주는 것이 아니라 환상의 멤버로 불리는 스튜어트 섯클리프까지 알려주기도 합니다.


구글 어시스턴트는 대화 흐름을 잘 파악한다. ‘비틀즈에 대해 알려줘’라고 한 후, 관련 질문이라면 계속 이어서 대답을 해주게 된다.


시리는 대화 주제를 계속해서 이끌어 가는 기능은 없습니다. 비틀즈에 대해 물어본 후, “어떤 곡이 있어?”, ’베이스는 누구?”라고 물어보면 어떤 대화를 했는지 알지 못하고, ’잘 모르겠습니다”라고 답변할 뿐이죠. 구글 어시스턴트처럼 한 가지 주제에 대한 관련 질문을 할 수 있으면 꽤 세세한 부분까지 알아낼 수 있습니다. 알렉사는 어시스턴트만큼은 아니지만 어느 정도 대화를 이어나가기는 합니다. 하지만 시리의 경우 꼭 이러한 기능이 추가되었으면 좋겠습니다.



Siri 전후 질문에 대한 관련성을 연속할 수 없다. ‘베이스는 누군데?’라고 물어도 그 질문이 ‘비틀즈’에 대한 것이라고 인식하지 않는다.



주변에 흘러나오는 음악을 알려주는 시리

주변에 어떤 음악이 흐를 때 음악 제목과 가수를 알고 싶었던 적이 없었나요? 시리는 이럴 때 유용합니다. 물론 다른 음성 지원 서비스도 기기 내에서 나오는 음악이 뭔지는 알려주지만, 시리가 대단한 점은 외부에서 나오는 음악을 듣고 인식을 한다는 겁니다. 시리가 주변 음악을 분석하는 서비스는 ‘샤잠(Shazam)’과 연결되어 있기 때문에 가능한 것이죠. 카페나 길거리에서 들리는 음악에 대해 알고 싶을 때 꽤 유용합니다.



Siri는 외부에서 들려오는 음악을 분석하여 곡명을 알려주는 기능이 있다. 카페에서 들리는 음악을 알고 싶다면 꽤 유용하게 사용할 수 있다.


아이폰 사용자라면 시리를 자주 써보세요. 사람과 대화하는 게 아니기 때문에 시리 사용하는 걸 뭔가 어색하게 생각하는 사용자도 많은데요. 너무나 안타까운 일입니다. 요즘 음성 인식률이 높아져서, 문자 입력 대용으로도 충분히 사용할 수 있거든요. 따라서 시리 활용 가치는 이전보다 상당히 올라왔다고 생각합니다.

만약, 시리를 이용하는 게 부끄럽다면, 전화하는 것처럼 귀에 대고 사용해보세요. '00이라고 미리 알림 해줘’, ‘00시에 깨워줘’, ‘오늘 비와’ 등을 꼭 사용해보세요.



스마트 스피커가 스마트폰을 대체한다.

이처럼 각 음성 서비스는 각자의 장점이 있습니다. 아무래도 서로 경쟁 서비스인 만큼 영향을 주고받아 더 나은 기능을 사용하게 된다면 사용자로서는 더할 나위 없이 좋을 것입니다. 그리고 나중에 시리와의 대화 기능이 진화하여 정식으로 ‘인공 지능’이라고 부르는 날이 오길 기대합니다.

더 이야기를 넓혀볼게요. 향후 음성 서비스의 플랫폼은 스마트폰에서 스마트 스피커로 넘어가고 있다고 볼 수 있는데요. 스마트폰은 편리한 기기라는 게 분명하지만, 사람으로 하여금 지나치게 의지하게 되는 상황이 생기게 되고 이는 곧 심각한 상황을 만들기도 합니다. 본래 사용에 맞지 않는 상황에 사용하게 되는 것인데요. 최근 뉴스에 보도되는 것처럼 보행, 운전 중 사용하는 행위 말이죠. 스마트폰 사용에 대한 강한 의지가 오히려 사용자가 끌려가게 되는 안 좋은 결과를 낳을 수 있습니다.

스마트 스피커는 거실, 혹은 방이라는 일정한 공간을 장치화하여 사용할 수 있게 해줍니다. 앞으로는 욕실, 차 안과 같이 상황 또는 장소에 맞게 사용할 수 있게 될 것이 분명합니다. 여러분들 중에 홈팟(HomePod)을 사용해보고자 하는 사람이 많을 텐데요. 꼭 홈팟이 아니더라도 다른 브랜드 스마트 스피커를 미리 체험해 보는 것도 좋습니다. 그러면, AI를 사용하는 새로운 접근 방식을 경험할 수 있을 것이기 때문이죠.