제20화. 구글이 바꿔 놓을 미래 그리고 모바일 - AMORE STORIES
#Digital
2018.06.21
6 LIKE
765 VIEW
  • 메일 공유
  • https://stories.amorepacific.com/%ec%a0%9c20%ed%99%94-%ea%b5%ac%ea%b8%80%ec%9d%b4-%eb%b0%94%ea%bf%94-%eb%86%93%ec%9d%84-%eb%af%b8%eb%9e%98-%ea%b7%b8%eb%a6%ac%ea%b3%a0-%eb%aa%a8

제20화. 구글이 바꿔 놓을 미래 그리고 모바일

칼럼니스트남재현 님
아모레퍼시픽 디지털 정보혁신팀


 구글은 2007년 스마트폰 운영체제인 안드로이드(Android)를 출시한 이후, '모바일 우선(Mobile First)'을 목표로 구글에서 만든 모바일 앱이 서비스 플랫폼과 안드로이드 생태계를 구축하는 역할을 담당하도록 했습니다. 구글은 지난 2017 Google I/O(Input/Output)에서 이제는 '모바일 우선'에서 벗어나 '인공지능 우선(AI First)'으로, 올해는 이를 넘어서 '모두를 위한 인공지능(Everyone for AI)'이 되도록 모바일 앱 서비스를 제공하겠다고 선언했습니다. 인공지능 핵심 기술의 연구 개발에 집중하는 동시에 많은 사용자들이 혜택을 누릴 수 있도록 인공지능 기술들을 모바일 앱에 적용하고, 사용자들에게 새로운 가치와 경험을 향상시키려는 의도로 풀이됩니다.

 안드로이드는 약 10년간 지속적으로 성장하며 PC(Personal Computer) 시대를 모바일 시대로 바꿔놓았습니다. 2017년 기준으로 개통된 안드로이드 스마트폰은 전 세계적으로 20억 대를 돌파했고, 구글의 핵심 모바일 앱인 플레이스토어, 크롬, 유튜브, 지도, 지메일 등은 월 이용자 수가 10억 명이 넘습니다. 10년 동안 안드로이드 플랫폼은 성능을 안정화하고, 사용자의 편의성을 향상시키기 위해 UX(User Experience)도 변경해왔습니다. 이런 변화에도 대다수의 앱은 멀티 터치 입력 방식을 고수한 서비스에서 벗어나지 못했습니다. 터치스크린인 스마트폰의 태생적 한계와 새로운 인터페이스 방식에 대한 기획 부재 혹은 기술적인 완성도가 낮아 앱에 적용하기 어려웠기 때문입니다.

 하지만 최근 인공지능 기술들의 발전과 함께 사용자의 입력 방식이 진화하고 있습니다. 특히 음성과 비전(이미지, 동영상)에 의한 입력을 기반으로 새로운 형태의 서비스를 제공하고 있습니다. 음성과 비전 기술을 활용할 만큼 기술적 완성도가 높아졌기 때문입니다. 2017년 기준으로 구글 음성 인식의 단어 오류율은 4.9%로 낮고, 이미지를 보고 강아지나 고양이와 같이 카테고리로 분류하는 이미지 인식 오류율은 오히려 오류율이 약 5%대인 사람보다도 낮습니다.
  • "음성 인식과 이미지 인식 오류율"
    출처 : 구글, 2017. 05

 이번 칼럼에서는 구글이 사용자에게 새로운 경험과 가치를 제공하기 위해 진화하는 인터페이스 방식에 맞춰 모바일 앱에서 어떤 서비스를 제공하는지 살펴보겠습니다.

# 구글 지메일(Google Gmail) : "인공지능이 개인 상황에 맞는 문구를 미리 제안"

 터치스크린에 의한 입력 방식은 당분간은 바뀌기 어려워 보입니다. 오히려 구글은 인공지능 기술을 접목해 문자(텍스트)를 사용자가 편하게 입력할 수 있도록 사용자와 상호작용을 강화하고 있습니다. 이런 기능은 구글의 지메일에 적용된 스마트 답장과 작성(Smart Reply and Compose)에 잘 나타납니다.
  • "Smart Reply vs. Smart Compose"
    출처 : 구글 AI 블로그

 두 기능 모두 받은 이메일에 답할 문장을 인공지능이 대신 제시해주는 기능으로, 스마트 답장의 경우 사용자가 한 번 클릭으로 바로 답장할 수 있도록 제공받은 문장들 중에서 하나를 선택할 수 있습니다. 반면 스마트 작성은 인공지능이 완성된 문장을 회색으로 표시해 제안하면, 사용자가 탭을 눌러 제안된 문장을 사용할 수 있습니다.

 인공지능이 학습을 통해 사용자들이 자주 사용하는 문구를 먼저 제안하고, 사용자들은 제안된 문구를 선택만 하면 되는 상황이므로, 철자나 문법 오류도 적어지고, 사용자의 문구 작성 시간도 상당히 절약시켜줄 것으로 보입니다.

# 구글 듀플렉스(Google Duplex) : "인공지능이 직접 가게에 전화를 걸어 예약 완료"

 인공지능이 사람을 대신해서 미용실이나 레스토랑에 전화를 걸어 예약하는 것을 상상해보신 적이 있나요? 구글 듀플렉스는 전화로 예약 같은 특정 작업을 자연스러운 대화를 통해 수행하는 기술로서 지난 2018 Google I/O에서 처음 선보였습니다.
  • 출처 : https://www.youtube.com/watch?v=lXUQ-DdSDoE

 미국 자영업자들의 60%가 온라인 예약 시스템을 갖추지 않은 것에 착안해, 이를 해결하기 위한 대안으로 전화로 예약하기를 최초로 개발했습니다. 이용자들은 구글 듀플렉스가 대신 전화를 걸어 예약을 진행하니 시간을 절약할 수 있고, 사업자들은 기존 응대자를 대체할 수 있어 비용 절감 효과가 커 모두에게 유익할 것으로 보입니다.

 구글 듀플렉스는 음성을 문자로 변환해주는 자동 음성 인식(Automatic Speech Recognition, ASR)과 문자를 음성으로 변환해주는 음성 변환(Text To Speech, TTS) 등의 음성 처리 기술과 의도를 분석하기 위한 딥 러닝 기술이 모두 결합되었습니다. (기술에 대한 자세한 소개는 참고 자료의 블로그에서 확인할 수 있습니다.) 자연스럽게 대화하기 위해 수십만 건의 예약 음성 데이터를 학습 데이터로 활용했습니다.

 수신된 음성을 ASR 시스템과 이전 문맥 상황을 고려해 문자로 변환하고, 딥 러닝 처리 과정을 거쳐 의도에 맞는 응답 문자가 생성되면, TTS로 전환해 음성을 송신하는 과정을 거칩니다. 이 과정에서 자연스러운 대화를 위해 대화 중간에 "흠(Hmm)"과 같은 추임새나 대기 시간 등을 조절하는 타이밍 기능을 추가하기도 했습니다.
  • 출처 : 구글 AI 블로그

 소개한 기술은 현재 미용실과 레스토랑 예약에만 국한해 적용되고 있지만, 향후에는 다양한 실생활 분야로 확대도 가능할 것으로 보입니다. 특히 자사의 고객 상담 응대 중 주문 상품에 대한 조회나 취소 부분과 같은 특정 분야에 듀플렉스가 직접 응대하는 날이 오지 않을까요?

# 구글 렌즈(Google Lens) : "인공지능이 카메라 속 다양한 사물을 인식해서 관련 정보를 즉시 제시"

 앞서 설명한 음성 인식 인공지능 기술이 자연스러운 대화로 예약을 진행하는 실생활 업무를 처리하기 위한 방향으로 흘러가고 있다면, 이미지 인식 기술은 카메라에 비친 사물을 인식하고, 사물에 대한 관련 정보를 검색하거나 쇼핑과 같은 다양한 서비스와 연동하는 방향으로 진행되고 있습니다. 이는 이용자가 시각적으로 접한 사물에 대해 알고 싶고, 구체적인 정보를 몰라 검색하기 어려울 때 이용됩니다.
  • "이미지 인식을 통한 다양한 서비스 제공"
    출처 : 구글플레이스토어, 구글렌즈 앱

 특히 구글 렌즈는 동식물을 비추면 동식물 이름과 상세 정보를 보여주고, 인기 있는 장소를 비추면, 평점, 영업시간, 역사적인 사실 등을 알려줍니다. 옷이나 가구 등의 제품을 비추면 비슷한 제품을 검색하며 쇼핑과 연동도 가능하게 해줍니다. 그리고 스마트 텍스트 선택 기능을 탑재해 카메라에 비친 글자를 선택해서 추출이 가능해 손쉽게 해당 문구를 메모에 저장할 수 있습니다.

 이 외에도 구글 렌즈는 서드파티 카메라 앱도 지원해 안드로이드 스마트폰 사용자는 내장 카메라 앱을 통해서도 구글 렌즈의 다양한 기능을 즐길 수 있습니다. 이는 구글이 인공지능 생태계를 확장하기 위한 전략으로 보이며, 국내에서는 이미 LG전자와 국외에서는 소니, 샤오미, 노키아 등과 협력을 추진하고 있습니다.

# 마치며

 구글은 사람들의 크고 작은 불편을 해결하기 위해 사용자가 스마트폰을 터치할 수 없는 상황에서 음성 인식 인터페이스를 활용하는 구글 어시스턴트(Google Assistant)와 기능을 확장한 듀플렉스 서비스를 선보였습니다. 그리고 현실 세계에서 눈앞에 놓인 상황 혹은 사물들을 이해시키기 위해 비전 인터페이스를 활용하는 구글 렌즈도 선보였습니다. 이런 서비스를 제공하기 위해서는 인공지능 기술이 필수적인데, 구글은 텍스트, 음성과 이미지 등의 다양한 데이터를 분석하고 학습하면서 기술을 발전시켜가고 있습니다.

 지금도 구글은 사람들이 느끼는 불편을 찾고, 그 문제를 대신해서 해결하기 위해 다양한 분야에 인공지능 기술을 적용해 서비스를 제공할 예정입니다. 의료 분야에서 환자의 안저(눈의 안구 뒷부분) 사진을 이용해 특정 환자의 심장마비 혹은 뇌졸중 발생 위험률을 높은 정확도로 예측해 환자에게 정기 검진을 제안할 수 있습니다. 그리고 청각 장애인을 위해 TV 속 여러 사람이 동시에 말하는 장면에서 화자별로 음성과 자막을 따로 분리해 보여주는 서비스를 제공하는 등 구글은 사용자들이 직면한 문제를 해결해나가고 있습니다.

내가 느꼈던 일상생활의 불편한 점을 앞으로 척척 개선해나갈 인공지능과 구글이 펼칠 미래가 기대되지 않으시나요?



  • 좋아해

    6
  • 추천해

    0
  • 칭찬해

    0
  • 응원해

    0
  • 후속기사 강추

    0
TOP

Follow us:

FB TW IG