当前位置:首页 > 智能 > 人工智能

语音助手大战时代:苹果Siri为何这么“笨”?

人工智能 2019-06-05 11:24:50

来源:北极光科技   责任编辑:禹锋

导语

语音助手已经变得无处不在,它就在你的口袋中、家中以及汽车中。

  苹果Siri已处于落后位置

  语音助手已经变得无处不在,它就在你的口袋中、家中以及汽车中。你可以使用苹果公司的Siri设定约会提醒,命令亚马逊公司的Alexa为你播放歌曲,或者向谷歌助理询问当地的天气预报。总之,人们与这些非人类助手的互动已经变得很正常。

  Siri在2011年登陆iPhone,但是它的底层技术实际上要比你可能想象的陈旧。和对手的产品相比,苹果的Siri“有些笨”。

  语音助手发展史

  80年前,首个能够处理合成语音的机器由贝尔实验室在1939年开发而成。1952年,贝尔实验室发明了一款能够听懂从0到9语音数字的机器。两年后的1954年,一台与乔治城语言学家合作的IBM机器能够把60句俄语话翻译成英语。

  1962年,IBM开发的Shoebox设备能够听懂16个单词。到了1976年,卡内基梅隆大学将机器能够听懂的单词数量增加到了1000个以上。上世纪80年代中期,机器已经能够听懂数万个单词。

  自那之后,科学家开始在语音处理技术中融入人工智能(AI)。AI自上世纪50年代以来就已经出现。

  在这些技术的积累下,我们现在才拥有了能够听懂我们讲话的Siri、Alexa、谷歌助理以及微软的“小娜”。

  AI的不同类型

  AI是计算机科学家们能够让语音助手更加易于使用的一大原因,但是你所理解的AI可能和它的实际含义有所不同。

  “AI分为两种类型,”密歇根州立大学计算机科学和工程教授乔伊斯·柴(Joyce Chai)表示,“强AI主要是处理能够像人一样推理、思考或行动的开发系统。另外一种就是弱AI,它更加专注于具体任务,也包含虚拟语音助手。我们距离实现强AI依旧还有很远的距离。”

  传统上讲,计算机要想就某件事情做出决定,它需要一套人类预定义的规则。借助AI分支机器学习,计算机通过对大量数据学习后可以自主推断出规则。在这种情况下,他们可以学习人类如何谈话和互动,从而听懂人类的语言。这需要大量数据。

  Siri听不懂问题

  哥本哈根信息技术大学副教授纳塔利·舒乐特(Natalie Schluter)解释称,这些公司面临的主要挑战是通过足够多样化的形式获取充足的数据,以便让机器为更多人服务,而不是局限在某个特定人身上。舒乐特表示,在实验室中开发出一款只能够理解你所说话的产品可能十分有趣,但是世界上有许多方言、不同的口音以及不同的声调。

  这不只是量的问题,数据的种类也很重要。如果你训练机器的数据只来自旧金山的白种人,那么你训练出的AI只能听懂范围非常窄的人群。

  “苹果和亚马逊不乏才华横溢的员工,”舒乐特表示,“但是有时我们必须确保这些员工对数据进行干预,保证他们在训练AI时使用的数据量适当,并且来自许多不同种类的人群。”

  为什么Siri落后了?

  那么,为什么Siri不能总是理解你提出的问题呢?

  从某种程度上讲,这和科学无关,而是与不同公司的实际运作情况有关。“Siri面临的挑战之一就是苹果在早期承诺过多但又做不到所造成的的负面形象。”SoundHound联合创始人兼CEO肯扬·曼哈耶尔(Keyvan Mohajer)表示。SoundHound为其他公司提供语音助手、音乐识别技术和语音工具。

  曼哈耶尔称,Siri的另外一个挑战就是没能真正像人们期望的那样快速增加知识库。亚马逊Alexa已经从最初的少量技能发展到了数万项。苹果也没有真正建立起一个开发者生态系统。

  另外一个可能导致Siri落后的原因就是苹果严格的隐私标准。在许多语音助手尽可能多的收集用户数据来训练他们的AI时,苹果一直在宣扬尽量降低这种数据收集,并进行匿名处理。尽管这可能导致语音助手的用处不够大,但是苹果对此不屑一顾。

  “我们拒绝接受这种理由,即充分利用技术就意味着放弃你的隐私权。”苹果CEO蒂姆·库克(Tim Cook)去年在杜克大学毕业典礼上发表演讲时称。

  此外,苹果还是一家出了名的保密公司。“苹果的员工在干什么,他们所认为真正重要的问题是什么?我们一点也不知道,”舒乐特表示,“通常情况下,我们与谷歌、亚马逊、微软以及其他公司的研究人员在同一个领域工作,参加相同的会议。我们发表文章,一起合作。然而,苹果的一切却无从知晓。”

  苹果从谷歌挖来詹南德利亚

  但是,苹果似乎开始越来越认真对待AI了。去年,苹果从谷歌挖来了知名计算机科学家约翰·詹南德利亚(John Giannandrea)担任其机器学习和AI策略高级副总裁。今年稍早时候,苹果又任命伊恩·古德菲洛(Ian Goodfellow)为其机器学习总监,后者曾是谷歌顶尖AI研究人员之一。

  去年年底,风投公司Loup Ventures发布的一份研究报告显示,Siri并不是语音助手的领头羊,但是在追赶竞争对手。本周,苹果又在全球开发者大会上宣布对Siri快捷方式进行更新,允许开发者进一步整合Siri,并升级了Siri的文本转语音引擎,现在已完全使用由软件发出的声音。

  不过,要想让Siri变得更强大,苹果还有一些事情要做。“第一版Siri能做12件事,”曼哈耶尔称,“但是要想变得真正有用,你需要能够做所有事情。这是覆盖范围的问题,增加更多内容,具备一个允许你增加内容,让理解速度比线性速度更快的架构。”

  曼哈耶尔指出,他认为苹果能够做到的最有前景的事情之一,就是围绕着Siri建立一个非常成功的开发者社区。他认为,在语音AI领域,还没有一家公司成功建立开发者社区。

(文/凤凰网)

免责声明:以上内容为本网转自其它媒体,相关信息仅为传递更多信息之目的,不代表本网观点、亦不代表本网站赞同其观点或证实其内容的真实性。如有侵权请联系本网删除。
Top