星期六 , 12月 21 2024
首页 / 人工智能 / VR / Siri 被苹果收购已有八年,未来之路在哪里

Siri 被苹果收购已有八年,未来之路在哪里

苹果最近过得并不太顺畅。iPhone X 已经出现了低迷状态,从 ” 降速门 ” 到通话失灵问题,这款去年年底刚推出的产品似乎有了 ” 凉了 ” 的趋势。而苹果最新发布的财报显示,尽管利润增加了,手机销量增长却停滞了。

对于苹果,大家总是乐于替它进行分析和寻找原因。而美国知名开发者 Brian Roemmele,这次瞄准的却是 Siri。从 2010 年被苹果收购,到 2016 年原班人马的全部离开,再到现在苹果语音助手对抗谷歌和亚马逊上的吃力,这是否意味着,Siri 的失败?Brian Roemmele 在最近的一次访谈中,详细讲述了他认为,苹果是如何错失 Voice First 未来的故事。

以下为经整理编辑的原文译文:

来源 | highscalability

施乐公司从它发明了个人电脑之后便一直在摸索着未来技术。在苹果麦金塔电脑系列中,苹果公司创造了个人电脑——施乐奥托(最早的个人电脑原型)。

苹果也在摸索未来,即 Voice First 的未来。 “Voice First” 的出现意味着未来我们与计算机互动的主要模式将由声音主导。当苹果收购 Siri 之后,公司在语音控制方面便有着长达 5 年稳固的同行业领先优势。但现在,亚马逊的 Alexa 和 Google 的智能语音助手不仅追上了 Siri,而且超越了它。

知名开发者 Brian Roemmele 在他 Rene Ritchie 的 ” 为什么 Siri 需要一个操作平台 “Vector 播客上接受采访时,十分兴奋地讲述了苹果公司如何创造 Voice First 的未来的故事。

Brian 在受访中谈到了很多地方,其中一些值得注意的主题都有:Voice First 代表着未来;苹果是首家探索和在产品中采用 Voice First 的公司 ; 苹果需要减少 iPhone 的税收,来抽出更多的资金建立 Siri 平台。

在每一部分中,我都会引用 Brian 在采访中的内容来解释这个主题。我想你会感受到这个话题的乐趣,因为 Brian 是一个有趣的人。

Voice First 代表着未来

Brian 多次提到,他一直在研究语音交互界面的相关技术。如果你对他的工作感兴趣,可以到他自己的网站上阅读更多相关信息:Voice First Expert。

我们用头脑中的声音思考。在我们在打字之前,都必须首先在脑海里刻画出一个声音,然后将内心的声音转录到键盘上,而我们说话的速度是比打字要快的。我们有超过 60% 的 iMessages 文本是使用语音组成的。

我们的移动设备的应用数量已经达到峰值,未来语音辅助系统将取代应用程序。

有人说人类是懒惰的。我觉得人类是应用工具的制造者,并且人类一直在尝试让自己的生活变得更有成效。

我们所做的 90%是筛选和整理 Google 搜索的结果,而智能助理知道如何做到这一点。当你真正分析需要完成的工作时,我们需要寻找将近 900 万 Google 搜索结果中的一个,然后你需要花费最少一个小时在 900 万个结果中去筛选你想要的那个。

Google 搜索的算法一直在进化吗?不,不。即使它能够根据你的 Gmail 邮箱、以及关联到你的社交信息来做出判断,但它还是不够好。对于你来说,这与你期待的个人智能助理还相差甚远。而以声音为主要信息判断的个人智能助理是我们想要开发的,但现在还并不存在。

人工智能系统将集中在一个小小的芯片上。问题是芯片中嵌入了哪些抽象层呢?大家都说,” 史蒂夫,你需要收购一个手机公司。” 但他却说不,我要在他们的笨水管上建立一个抽象层。 AI 的笨水管指的是自然语言处理,意图提取和所有其他的相关的辅助功能集成的手机功能服务。企业家将在芯片内创造一个抽象层,来形成下一个社交网络。

下一代将会随着他们的声音而长大,而老年人可以选择不再接触繁杂的应用程序。

每个设备都只用从你那里接收一个语音命令,到那时,你不会想去下载一个应用程序来与设备通话。

孩子们会使用 iOS 设备伴随他们长大,而且他们也希望每个屏幕都可以用手指操作。所以我们可以停止一些关于不需要触摸功能的笔记本电脑的胡乱猜想了。我们应该用小孩的眼睛看世界,他们往往只是想要在屏幕上移动一些东西。每台电脑都应该以学会倾听和理解用户的需求,并与他们进行互动。

苹果首先对 Voice First 进行探索

作为苹果公司的前 CEO,史蒂夫 · 乔布斯逝世前的最后一个行动是收购 Siri。他认为 Siri 是苹果的未来,比 iPhone,iPad 和 Mac 更重要,这也是他认为声音控制在未来会是行业发展的主流力量的原因。史蒂夫看到了一个人们不需要一直在呆在屏幕前使用移动设备的未来,在那时我们应该能够告诉我们的系统如何帮助我们的工作。但这是否意味着未来设备屏幕的消失呢?不,我们会尽量少用屏幕,但我们坚信声音是第一位的。Voice First 代表着未来。在未来的 AR 和 VR 技术领域里,我们不需要在设备上用手来操控设备。

尝试使用装有 Siri 的设备感觉就像我碰到第一个 iPhone 的那一刻,新的头发在我的背上划动,而我正在与历史性的事物进行互动。

从某种程度上说,Siri 在作为一个独立系统时比苹果将它整合到设备中时更强大。它被收购的时候有很大的期待,但当时我们也不知道史蒂夫 · 乔布斯不能伴随着它共同发展。

黑暗的时代来临了。 Siri 的许多背后许下的承诺,例如 Siri 将成为一个平台,而不仅仅是一个附件。将 Siri 发展成为平台还是操作系统附件是哲学性的问题,而这个理念的执行伤害了苹果对待 Siri 的初衷。

Siri 会跌倒在起跑线上。一些拥有最好头脑的技术人员将离开公司,而曾经主要的 Siri 支持者们离开并开始了新的语音系统 Viv 的研发。

苹果有机会购买 Viv,但是苹果有人认为 Viv 没有价值,最终 Viv 让三星收购。苹果就这样将我生命中见过的最强大的人工智能工具给了他们的主要竞争对手。除了老化的公司内部的哲学鸿沟,我不知道他们是怎么想的。这个世界一切都在进化,所以你必须重塑自己。在后乔布斯世界里的你如何正确地做到这一点呢?

当你开始沉醉于自己开发的库尔助手,你开始相信未来会像过去一样;你认为你在口袋里随身携带的设备已经非常实用和丰富,所以你不想让它消失。即使我们的应用程序数量已经达到峰值,但没有人愿意承认这一点。现实是,在去年,一般人才下载不到三个应用程序。

如果你是苹果公司,你的愿景是让自己开发的设备能看起来更薄,更快,功能更丰富,而当有人唤醒你并说你的设备即将被淘汰,你的大部分工作将在使用你的声音的操作系统下完成,这将使得你的设备功能变得更加先进。但你不想要只有声音的世界,所以这时候就需要一个设备来供你观赏。声音操控的确是很新颖的想法,但人们不想放弃打字,因为这是他们过去几十年来做的事情。

亚马逊有 12,000 人在 Alexa 工作。这个数量比谷歌,微软,苹果,以及任何一家公司都要多。

CES 之后,许多著名的分析者说苹果在智能语音与设备结合技术明显落后。因为他们做了一个严重的错误,他们没有把 Siri 作为一个单体平台来研发。

人们正在购买亚马逊的 Echo 智能音箱,甚至选择打包购买 6 个或者更多的 Echo 放在家里或者作为礼物送给别人。这意味着人们更多把他们放在每个房间里使用它们。

人们正在用智能音箱听音乐或者设定计时器,但他们也在做着其他的事情。大多数人在技术世界到来之前已经接受了 Echo 带给他们的便利。

Siri 是有可能作为用户的第一选择的。之所以像现在这种处境,是因为苹果没有使用真正属于自己的技术,而是从其他公司借用技术。

Siri 团队对苹果说,这只是一个演示平台,而我们真正需要的是建立一个自我编程平台。我们需要创建一个使用语音来编写自己的代码的人工智能,而这正是 Viv 正在发展的目标。 在当前技术的基础下,Viv 在建立自己的本体和分类法。我们可以想象,如果有一天你的孩子都能够实时通过声音告诉智能助手来创造属于自己的应用程序呢?

从先进产品中吸收的工程文化

这是我最喜欢的话题,因为它的方向是对的。工程师将永远推动和发展他们的数字花园。其中的一部分人需要拥有对未来收获的远见。如果不去想着收获,就永远不要想着得到新产物。

工程师往往会过于小心。他们在开发新产品时总认为常规技术可能会被打破而不敢冒险,我们这时候需要一个领导说不要在乎这些,因为我们正在创造美丽的东西,我们正在帮助人们实现它。所以,每个产品都需要一个领导来说我们正在实现梦想,这样效果就会很好。

我们期望的是有一天谷歌能达到亚马逊现在拥有的技术能力。亚马逊赢得的人们喜爱的原因是因为 Echo 智能音箱是由商人而不是工程师建造的,它是由一个仅仅考虑用户需求的人创造的。当你是一个商人,如果你不能卖东西,这就代表你失业了。史蒂夫是一个商人,当他上台时,他会做一个销售研讨会,但我们没有这个。杰夫贝佐斯是我们公司中最接近达到这一点的人,他是一位理性主义家,他认为人们必须用钱包来证明他的想法是对的。史蒂夫总是将此作为第二选择,他一直在创建一个更大的目标,他不得不先确保他的产品令人满意,甚至让人们的体验感达到超出预期的水平。

你需要与现实世界保持平衡。史蒂夫当年深入帕洛阿尔托研究中心的原因是,他走进了一个只有工程的行动。那台电脑终于完成了,阿尔托已经准备好面对大众了,但工程师们不会就此打住。史蒂夫说,我当时只看到三件事,但我应该能看到十个来赋予我的 Mac。但工程师们说没有准备好。他说你在说什么?我要将他们一起带出来嵌入我开发的电脑里,我已经准备好了。

你需要一个能够超越工程层面的人。那么你就会说让我们一起随他去吧。这不是 ” 完美 ” 的选择,但比现在看起来要好多了。如果你只靠工程文化来生活,那么问题就来了。

Google 是工程师,如果你相信能够让你成功的事情只能依靠工程技术人才来实现,那么你只能听天由命。

苹果需要放弃对 iPhone 的税收,抽取资金建立 Siri 平台

微软公司以 Windows 战略税作为目标摸索未来。 Windows 就是摇钱树,而微软内部的任何关于威胁到摇钱树的风气都会被立即斩断。就让我们参照微软是如何停止战略税这个无稽之谈的。

但 Siri 没有被考虑过放弃,因为苹果有 iPhone 手机税。一切都必须服务于 iPhone 生态系统,甚至是包括它们发布的新 HomePod,这是没有任何意义的。Brian 讲出了一个有说服力的例子,认为苹果把 Siri 买下来是因为他们觉得它会与 iOS 竞争。众所周知,假如两者不能很好的结合,对于苹果而言,这是一条死路。

当你被一个不允许你展示你的公司的伟大的界面中断时,你不想接受它。你不想把你的产品被一个无形的声音控制。斗争将是与我们的关系更好的个人助手,更好地理解我们,我们更多地不信任我们的信息出售我们的烤面包机。苹果公司处于最佳状态。公司需要重置。需要说这是它自己的平台。这将会调解苹果所做的一切。它需要有 SiriOS。它需要有自己的开发团队。亚马逊已经雇佣了大部分的专家。

关于 Siri 是否需要作为一个独立的平台发展的争论是苹果公司需要面对的问题。

我们需要 SiriOS,这是属于它自己的平台。它将决定自己的生存和死亡,但它将影响到我们从现在和未来所做的一切。这是一个由人工智能介导的操作系统,它连接了 ” 构建 ” 的所有本体和分类法,声音将对它进行控制。开放它的开发人员社区需要达到一个水平,那就是开发以前从来没有过的基于语音的系统,这需要让开发人员实时构建工作流来共享进程,而这代表了基于用户意图构建解决方案的实时能力,也就是实时从云端数据中获得有用数据的能力。所有的应用程序将存放在云中,下载和调用应用程序这种方法将会被取代,而操作系统将负责创建上下文同时保证信息连续性。它们要考虑的包括:这个人刚刚问我什么?它和刚刚问我的是一样的吗?我需要在之前做的事的基础上往后做什么?这些仅仅是低级别操作系统的功能,保持随时随地的信息交互。我们现在说的不是一般的人工智能,它需要贯穿您所需要的本体的上下文,来判断和解决您需要的问题。当它记住了这些在一个 ” 神经元 ” 中的上下文之后,这个 ” 神经元 ” 是根据时间基础来扩展的。

不要关心所谓的人工智能,或者让人们在乎他们正在与另一个人交谈。真正需要关心的是如何使智能设备提取上下文的能力,以便用户可以发出命令并有效地完成大量的工作。

HomePod 需要一个 iPhone 伴随左右,也就是说除非 iPhone 在身边,否则就没有智能系统支持。苹果内部的人赢得了 HomePod 只是一种 iPhone 的附件的论点,因为 HomePod 需要一个 iPhone 连接它才能运行。这真的是一个糟糕的决定。

苹果想要通过充分利用保护隐私的能力来主导行业发展,我们希望相关数据不会以用户无法想象的方式被他们使用。

Siri 在苹果 AirPods 设备中显得步履蹒跚,因为苹果没有给予 Siri 和 Vocal 任何智能,例如实时的上下文编程就是强大的智能工具,但我们没有看到它在 Siri 里得到应用。

请停止把 Siri 看作是一个操作系统的附件,应该让它拥有自己的平台,让它自己成长。 如果 iphone 因为 Siri 的崛起被淘汰那证明它无法跟上时代更迭的速度,拥有丰富而重要的开发者生态系统才是更重要的。

亚马逊需要解决的问题是,使用小技巧和关键字的设备迟早会被淘汰。

谷歌也有自己的问题,他们把智能助手看作是人们手臂上无法割舍的附属物。

Voice First 的商业模式不是通过按点击付费广告来获取利润,这是一种语音商务。 当您通过语音助手订购卫生纸时是不会包含品牌分类需求的。 而亚马逊不在乎,他们只是希望人们在他们的网站上买更多的纸巾而已。

关于 吉运好熊

吉运好熊
清华计算机系

检查

OpenAI重磅发布o3,再次突破AI极限

OpenAI迎来了年底AI春晚 …

发表评论

邮箱地址不会被公开。 必填项已用*标注