第20篇 谷歌将改变的未来与移动互联网 - AMORE STORIES - CHINESE
#Digital
2018.06.29
0 LIKE
125 VIEW
  • 메일 공유
  • https://stories.amorepacific.com/zh/%e7%ac%ac20%e7%af%87-%e8%b0%b7%e6%ad%8c%e5%b0%86%e6%94%b9%e5%8f%98%e7%9a%84%e6%9c%aa%e6%9d%a5%e4%b8%8e%e7%a7%bb%e5%8a%a8%e4%ba%92%e8%81%94%e7%bd%91

第20篇 谷歌将改变的未来与移动互联网

专栏作家Nam Jaehyun
Amorepacific Digital IT Innovation Team


 谷歌自2007年推出安卓(Android)智能手机操作系统以来,设定"移动优先(Mobile first)"目标,让谷歌创建的移动应用发挥了建立服务平台与安卓生态系统的重要角色。在2017年谷歌I/O全球开发者大会上,谷歌宣布从"移动优先(Mobile first)"转向"人工智能优先(AI First)",今年还将提供移动应用服务,让其成为"无处不在的人工智能(Everyone for AI)"。这可以解释为:重点研发人工智能核心技术,同时将其应用于移动应用程序,以惠及更多用户,进而提升用户的全新价值与用户体验。

 安卓通过约10年的不断发展,推动了从PC走向移动时代的转变。截至2017年,全球安卓智能手机出货量突破20亿部,谷歌的核心移动应用——Google Play商店、Chrome、YouTube、地图、Gmail等月活用户超过10亿。过去十年来,安卓平台性能趋于稳定,为提高用户便利性而改善了用户体验(User Experience,UX)。尽管变化很多,大多数的应用程序仍采用多点触控式输入模式。原因在于搭载触摸屏的智能手机具有与生俱来的局限性,对新的界面缺乏策划方案,或因技术成熟度较低,而难以适用于应用程序上。

 然而,随着人工智能技术的发展,用户的输入法也不断演进。最典型的例子就是,基于语音和视觉(图像、视频)输入法提供全新服务模式。因为语音与视觉技术的应用频率增多,促使技术成熟度提升。2017年,谷歌语音识别中的单词错误率仅为4.9%,看图分类狗或猫的图像识别系统错误率低于人类的5%左右。
  • "语音识别与图像识别系统错误率",
    资料来源:谷歌,2017年5月

 本专栏将介绍谷歌为了给用户提供全新体验与价值,跟随不断演进的界面方式,通过移动应用提供哪些服务。

# 谷歌Gmail:"人工智能根据用户提供简短的回复建议"

 基于触摸屏的输入模式应该很难在短时间内改变。谷歌反而结合人工智能技术,为了方便用户输入文字,增强了与用户的交互作用。这一技术很好地体现在谷歌Gmail推出的智能回复与撰写(Smart Reply and Compose)功能。
  • "Smart Reply vs. Smart Compose",
    资料来源:谷歌AI博客

 这两个功能都利用人工智能技术给用户提供回复建议。"智能回复"基于用户之前发送的邮件,在撰写窗口的底部提供一些简短的回复建议,用户只要点击一次就能选择其中一个文章并立即回复。"智能撰写"是当用户开始输入句子时,键入的文字后面会出现灰色的建议文本,用户可以按Tab键来采取这一建议。

 人工智能通过学习来建议用户常使用的文章,用户只要从中选择即可,这不仅能减少错别字或语法错误,还能大大减少用户的邮件撰写时间。

# 谷歌Duplex:"人工智能帮助用户完成电话预约"

 有没有想象人工智能代替人类打电话预约发廊、餐厅的场景?谷歌Duplex是一种在电话中用自然语言完成预约等特定任务的技术,在2018谷歌I/O大会上首次亮相。
  • 资料来源:https://www.youtube.com/watch?v=lXUQ-DdSDoE

 在美国,60%的小商户没有在线预约系统。为解决这一问题,在世界上首次研发出用人工智能技术打电话预约的功能。谷歌Duplex代替用户打电话预约,可以帮助客户节约时间,还有利于商户取代现有接待人员,节约成本,可谓一箭双雕。

 谷歌Duplex结合了多项技术,包括把语音转化为文字的自动语音识别技术(Automatic Speech Recognition,ASR)、把文字转化为语音的文字转语音技术(Text To Speech,TTS)、用于识别意图的深度学习技术。(有关技术的具体资料可以参见博客。)为了进行自然对话,学习了达数十万的语音预约数据。

 通过ASR系统并分析之前的文章脉络,将接收到的语音转化为文字,经过深度学习处理过程,生成符合意图的回复内容,再藉由TTS将其转化成语音并发送。在此过程中,为了进行自然的对话,会在话语中间插入"嗯"等赘词,还增加了调整等待时间的功能。
  • 资料来源:谷歌AI博客

 前面介绍的技术目前只限于发廊和餐厅预约,未来有望扩大适用到日常生活中的各个领域。在我们公司的客服项目中,由Duplex应对客户处理订单查询或取消等特定任务,说不定会成为现实。

# 谷歌镜头:"人工智能识别照片里的事物并及时提供相关信息"

 如前所述,语音识别人工智能技术用自然语言完成电话预约等日常生活中的任务。图像识别技术则识别用相机拍摄的事物,并结合信息搜索或购物等各种服务。该技术帮助用户查询用视觉接触的事物或搜索具体信息。
  • "通过图像识别技术提供各种服务"
    资料来源:谷歌Play商店中的谷歌镜头App

 利用谷歌镜头,将智能手机摄像头指向动植物,会显示动植物的名称与详细信息;指向人气地点,会提供点评、营业时间或历史沿革等信息;指向衣服或家具等产品,会搜索类似产品并链接到购物网站。使用智能文本选择功能,可以选择并提取摄像头指向的文字,轻松将其保存到笔记上。

 除此之外,谷歌镜头支持第三方相机,安卓智能手机用户可以通过原生相机使用谷歌镜头的各种功能。这被视为谷歌为扩大人工智能生态系统而采取的战略。在韩国与LG电子,在海外与索尼、小米、诺基亚等公司正展开合作。

# 结束语

 谷歌为帮助人们解决大大小小的问题,推出了用户在无法触摸智能手机的情况下使用语音识别界面的谷歌助理(Google Assistant)以及扩充功能的Duplex服务。为了让人们在现实世界识别眼前的情况或事物,还推出了利用视觉界面的谷歌镜头。这些技术必须要有人工智能的支持,而谷歌通过分析和学习文本、语音和图像等各种数据,不断发展技术。

 此时此刻,谷歌不断挖掘用户的痛点,并为解决问题,将在多种领域提供采用人工智能技术的服务。比如在医疗领域,分析病人的眼底(眼球内后部的组织)图片,高精度预测病人罹患心脏麻痹或脑卒中的概率,并向患者提出定期健康体检的建议;在电视节目中很多人同时讲话的画面,为听力残疾人提供按人物分开显示语音和字幕的服务等,谷歌正解决用户所面临的问题。

 人工智能与谷歌帮助我们改善在日常生活中感到不便的诸多问题,它所开创的未来是不是指日可待?



  • 喜欢

    0
  • 推荐

    0
  • 赞赏

    0
  • 支持

    0
  • 想看后续

    0
TOP

Follow us:

FB TW IG