Siri的问题
在最近陷入困境之前,Siri的问题早已暴露。
2018 年,詹南德雷亚从谷歌转至苹果。他执掌了新成立的人工智能部门。科技界觉得,他的加入对苹果而言是一次重大的胜利。虽然有一些高管认为,詹南德雷亚更关注监管公司当下已搁置的自动驾驶汽车项目,但据一位知情人士讲,他对 Siri 有着特别的兴趣。
当时,苹果在 2011 年于 iPhone 上推出的 Siri 功能开始不再进步。它难以对一般性的问题进行回答,并且对第三方应用的支持也很有限。
在詹南德雷亚接手 Siri 助手之前,Siri 团队的成员就觉得自己在苹果公司的地位如同“二等公民”。知情的前苹果员工透露,Siri 工程师对软件工程团队掌控 iOS 更新感到沮丧,他们认为自己的问题未被优先修复,而软件工程师则觉得 Siri 团队无法支持费德里吉团队推出的新功能。
约翰·詹南德雷亚 John Giannandrea
詹南德雷亚告知其他人,他有把握能够参照谷歌打造自家 AI 语音助手的策略,从而修复 Siri 的问题。一位与他交谈过的人透露,他觉得苹果只需具备合适的训练数据,提升从网络抓取答案的能力,就能回答一些常识性的问题。
在某些方面,詹南德雷亚在苹果的同事里显得很突出。和他一起工作过的人说他很随和、安静,也不爱争吵。这与苹果高管团队的很多其他成员形成了明显的对比,因为其中一些人是以苛刻的人格而被大家知晓的。
詹南德雷亚时常向员工阐释他的信念,他认为机器学习能够逐步对产品进行改进,并且最终会带来极为巨大的收益,他把这一理念称作“爬山”。他过往还曾表达过对聊天机器人的消极看法,在 GPT 发布的前后时期,他曾向苹果员工表明,他觉得聊天机器人不会给用户带来过多的价值。
曾在苹果人工智能部门工作的前员工称,他加入该部门后,有一些同事告知詹南德雷亚,让他重组 Siri 的领导层,然而他并未采取这样的行动。
沃克是 Siri 的领导者之一,他时常遭到同事的批评。他在 2013 年加入了苹果公司。到 2022 年底,他负责起了公司的日常运营。在批评者的视角中,沃克不愿意在 Siri 上进行大的冒险,而是将精力集中在那些对 Siri 性能影响不大的指标上。很明显,沃克并没有对彻底改革语音助手怀有宏大的愿景。
苹果前工程师称,沃克常因微小进步而庆祝,像把用户向 Siri 提问与 Siri 做出回应间的延迟缩短几个百分点。他们还表示,沃克另一喜好是从“嘿 Siri”语音命令中移除“嘿”,此项目耗时两年多完成。
去年,一位知情人士透露,有一个工程师团队曾尝试利用 LLM(大语言模型)来提升 Siri 的情感敏感度,沃克对此予以拒绝。其目的是让 Siri 能够检测出处于困境中的用户,并给出恰当的回应。
沃克告知同事,他希望将精力集中在 Siri 的下一个版本上,而非为该项目投入资源。然而,在他毫不知情的状况下,该项目的工程师却绕过了他,依旧与软件工程组的安全和定位团队一同合作来开发这些功能。
失衡的激励机制
随着时间不断向前推进,费德里吉所带领的软件工程团队与詹南德雷亚所带领的人工智能团队之间的关系逐渐变得愈发紧张,在某些时候甚至达到了完全失调的状态。
从风格方面来看,两位高管有着明显的不同。费德里吉的管理风格强硬且苛刻,而詹南德雷亚的作风则轻松又随意,二者形成了鲜明的对比。曾与他们一起开过会的人士透露,费德里吉会向同事抛出各种各样的问题,然而詹南德雷亚更擅长倾听。
其他抱怨情绪开始滋生。软件工程组有些人对人工智能组同事获得更高薪水和更快晋升心怀不满。他们也对人工智能组一些工程师似乎能享受更长假期且在周五提前下班,而自己却面临更繁重工作安排感到不满。
两个团队之间的不信任程度变得极为严重。今年早些时候,詹南德雷亚的一名副手让工程师对联合项目的开发过程进行详细记录。这样做的目的是,如果项目失败,费德里吉的团队就无法将责任推给人工智能团队。
费德里吉开始组建自己的团队,这个团队由数百名机器学习工程师组成。然而,这并没有改善两个团体之间的关系。该团队名为“智能系统”(Intelligent Systems),是由费德里吉的一位高级副手塞巴斯蒂安·马里诺 - 梅斯 (Sebastien Marineau - Mes)领导的。
多年来,“智能系统”团队持续训练自身的模型,还构建了演示程序,借助此程序用户能够凭借语音命令来操控应用程序,并且通常情况下不需要 Siri 团队的协助。这样的情况使得该公司与 Siri 团队之间的关系变得紧张。
两位知情人士透露,在苹果的一次内部演示里,“智能系统”团队的一名成员展示了一张幻灯片,幻灯片中的动画展现了两座山峰相撞且被夷为平地的情景。一些人觉得,这是对詹南德雷亚“爬山”哲学的一种含蓄嘲讽。
四位直接了解该项目的前苹果员工透露,大约在 2022 年的时候,“智能系统”团队开始与沃克以及 Vision Pro 负责人罗克韦尔一同开展一个项目,这个项目的代号为“Link”。然而,该项目很快就以失败告终。其目标是开发出语音命令,用以控制应用程序,并且完成混合现实头显和未来增强现实眼镜的相关任务。
参加三方合作会议的工程师们感到震惊。罗克韦尔和马里诺 - 梅斯对 Siri 日常负责人沃克怀有公开敌意。他们两人经常向沃克表达对 Siri 在支持 Vision Pro 方面进展缓慢的不满。
罗克韦尔期望佩戴耳机的用户能够借助 Siri 来浏览网页,并且仅通过语音就能对窗口大小进行调整。他也期望在虚拟空间中进行交流的两人能够一同与 Siri 展开互动,例如一起规划一次共同的假期。
Siri 团队的部分成员对该目标持怀疑态度。知情人士透露,最终,因为 Siri 团队未能达成,罗克韦尔为 Vision Pro 所设想的诸多 Siri 功能被删减了。
人工智能引发的兴奋高潮
2022 年 11 月,OpenAI 发布了 GPT 这一产品。此事件在科技界以及公众当中引发了极为强烈的反响。不过,据当时在詹南德雷亚的 AI 团队里工作的前工程师所说,高层领导并没有展现出那种应该有的紧迫感。
费德里吉的软件工程团队内部的反应与其他情况不同。有多位苹果前员工称,“智能系统”团队的高层领导迅速开始分享 LLM 的论文,并且公开探讨怎样利用这些论文去改进 iPhone。
“智能系统”团队成员向费德里吉演示了人工智能在 iPhone 上所能达成的成果,接着软件工程团队内部便开始变得热闹起来。这些演示借助 OpenAI 的模型,展现了人工智能对用户手机屏幕内容的理解方式,以及如何以更契合对话的语音来引导应用程序和完成其他任务。
苹果的前员工称,人工智能部门的高管们和软件工程部门的高管们都在争着宣称拥有由 LLM 所支持的新功能。在许多情形中,软件工程凭借其取得的卓越成果而获得了突出的声誉。
该公司对 OpenAI 的模型进行了试验。2023 年,苹果管理人员告知他们的工程师。他们不能在最终的苹果产品中包含来自外部公司的模型。只能用这些模型与内部模型进行对比。
多位在 2023 年和 2024 年使用过这些模型的 Apple 前员工称,然而,这些模型的性能与 OpenAI 的技术相比差得很远。
一场令人疑惑的演示
苹果公司去年 6 月宣布推出一套 AI 功能套件,名为 Apple Intelligence。此套件包含写作工具、图像生成工具,还有新的照片编辑功能和邮件功能,以及升级版的 Siri。
苹果公司不再坚持以往反对与其他公司 AI 模型合作的态度,宣布与 OpenAI 展开合作,还将提供 GPT 作为扩展程序,以便回答问题或者执行其自身模型无法处理的任务。
在大会台上的演示里,一位苹果高管向 Siri 询问其妈妈的航班降落时间。语音助手查阅了她的电子邮件以及实时航班数据,接着给出了当前的到达时间。随后,她让 Siri 提醒自己关于午餐的计划,语音助手从她的 iPhone 信息里提取出详细内容,并规划出从机场到餐厅的路线。
然而,这次演示让苹果 Siri 团队的成员感到意外。一位前苹果员工称,他们未曾见过这些功能的可运行版本。这位前员工还表示,当时在演示中,唯一在测试设备上被激活的新功能是一条闪烁的彩色丝带,当用户调用 Siri 时,它会出现在 iPhone 屏幕边缘。
苹果方面,Siri 的演示打破了以往的惯例。以往,苹果仅仅会在发布会上展示那些处于测试设备运行状态,且经过营销团队审核,以保证能够按时发布的功能和产品。
此次发布会给外界留下了深刻印象。苹果股价在发布这些功能后的两天内有了显著变化,飙升了 10%以上。华尔街对该公司推出人工智能计划感到欣慰。
一些前苹果员工称,他们觉得费德里吉和罗克韦尔有能力扭转 Siri 的局面,对此持乐观态度。因为这两人通常比詹南德雷亚和沃克更亲自去做事,而詹南德雷亚和沃克更依赖直接下属来管理事务。
费德里吉是其中的一个。他通常比那些从事软件项目的初级工程师更熟悉软件项目的技术细节。罗克韦尔在 2015 年加入了苹果。在公司内部,他被看作一位有远见的领导者。他能够为项目带来新的思路,并且还能巧妙地应对企业文化。
费德里吉改变了现状。一位知情人士称,他先前的策略有变,他指示 Siri 的机器学习工程师全力打造最佳的人工智能功能,即便这意味着在其软件产品中会使用其他公司的开源模型,而非苹果自己的模型。
本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://www.mjgaz.cn/fenxiang/275500.html