国开学习网 《计算机文化基础》第一章 拓展延伸3:Siri 开启人机交互新时代
Siri 开启人机交互新时代
Siri 自苹果发布的 iPhone 4S 手机走进了大家的生活,从此开启了人机交互的新篇章,与计算机对话已经成为现实。它可以帮助我们通过语音完成很多事情,比如打电话、阅读并回复短信、询问天气、设置闹钟、打开应用软件等等。Siri 在 iPhone 6s 上的功能有了诸多重大改进,你甚至不需要触碰它,只要离老远对着它大叫一声,就可以将其激活。你还可以在开车时喊一声“Siri,播放周杰伦的歌”,随后你便会听到周杰伦的《千里之外》(当然,前提是你的音乐库里有这个歌手的歌)。
那么,Siri 到底是怎么工作的?它包含了哪些高科技技术?
其实,Siri 是众多技术的结合,主要有人工智能和云计算。它在面向用户的时候,主要应用的是语音识别技术和语音合成技术。将我们的口语转化成文字,这里就需要强大的语音知识库,也因此需要用到云计算。而语音合成则是把返回的文字结果重新转换成语音输出。然后,主角儿在后头——由后台处理用户的请求并返回最匹配的结果。主要是分析用户的输入,根据输入类型,分别采用对应的后台进行处理。包括(1)以谷歌为代表的网页搜索技术;(2)以 Wolfram Alpha 为代表的知识搜索技术;(3)以维基百科为代表的知识库技术;(4)以 Yelp(类似国内的大众点评)为代表的问答以及推荐技术等的。
比如,当你要问某个地址时,谷歌的网页搜索和地图搜索就派上用场;当你要询问云计算是什么时,维基百科的信息就会被调用;而你要了解附近某个餐厅有什么特色时,谷歌和 Yelp 就会同时起作用。