OpenAI让苹果决定给Siri换个脑子

免费获取chatGPT 3.5 账户,或购买GPT 4.0plus 会员账户,扫描文章内微信公众号二维码,或加微信:yuke36

在苹果公司取消造车计划,转而投向生成式AI后约三个月,苹果总算要在自己的终端产品上应用AI模型了。

常年跟踪苹果的彭博新闻社记者马克·古尔曼(Mark)当地时间5月26日爆料,经历了为期两个月的磋商后,苹果已与达成合同,将前者的聊天机器人集成到iOS18,双方的合作伙伴关系预计将于6月的苹果全球开发者会议()上官宣。因为不放心让成为iOS一项主要新功能的单一供应商,苹果仍在努力与微软达成合同,希望可以作为一种选择。

此前,苹果早已推出、MM1、、Ajax等多款AI模型,但此次古尔曼爆料的焦点并不在那些苹果自研AI模型上,虽然苹果更相信外部更成熟的AI模型及其产品。

但苹果在生成式AI时代早已迟到了。

今年5月,苹果公司CEO蒂姆·库克(TimCook)就曾表示,AI的潜力“非常有趣”,但他表示该技术存在“许多问题须要解决”。他解释说,在决定如何以及何时使用AI时,“深思熟虑十分重要”。

过去的一年,华尔街的剖析师仍然在责怪苹果没有AI故事可讲。去年5月2日,在2024财年第2财季(去年第1季度)财报的电话会的问答环节,每一位提问的剖析师都在问有关AI的问题。但不仅之前的评论外,库克几乎没有透漏苹果未来的AI功能或服务,也没有透漏苹果怎样借助它们挣钱。

“我不想抢在我们发布公告之前发表言论,”库克在电话会上说,“我们觉得生成式AI是我们产品的一个关键机会,我们相信从理论上讲,我们拥有与众不同的优势。我们将在未来几周内进一步讨论这个问题。”而库克近日在接受美联社专访时则表示:“我们一直对生成式AI领域的机遇特别豁达,而且正在进行大量投资。”他强调,该公司过去两年已在研制上投入了1000亿欧元。

虽然苹果在生成式AI时代姗姗来迟,但苹果仍然拥有后发优势——庞大的用户基础、完善的产品生态以及软硬一体的范式。

在近日举行「AI创生时代——2024丙子引力X科技产业新风向」大会的*峰会上,出门问问创始人兼CEO李志飞就表示:“大公司跟小公司是完全不一样的。我认为对于大公司来说,后发可能是优势,尤其是做大模型的。”

在生成式AI领域,一方面,AI虽然有先发优势:先行者可以有数据飞轮;另一方面,AI虽然有后发优势:后来者的投入产出比更实惠。

仍然在AI领域占有先发优势的,正式成为苹果后发优势中的一环,而也想利用苹果的后发优势,寻求更大的下降机会。

01“虽迟但到”的决定

发布GPT-4o后,就有网友评论,苹果的语音助手Siri可以下岗了。

作为一款“原生多模态大模型”,GPT-4o所有输入和输出都由同一个神经网路处理,这促使GPT-4o才能接受文本、音频和图象的任意组合作为输入,并输出文本、音频和图象的任意组合,是兼顾了“听觉”“视觉”的多模态模型,同时还支持中途打断和对话插入,且具备上下文记忆能力。

官网博客显示,GPT-4o在谈话中对音频输入的平均响应时间为320微秒,最短的响应时间为232微秒,与人类的响应时间相像。

值得注意的是,在演示GPT-4o时使用的是,以的野心和能力,绝不仅仅只是想做一个APP,而是想步入整个苹果生态——需要通过苹果来突破用户下降困局。

在GPT-4o发布前,已经历了一年左右的流量下降窘境。随着GPT-4o的发布并接入,本月有望创下网路流量的新纪录。

数据显示,去年5月的前三周,网站平均每日访问量约为7700万次,本月总访问量有望超过23亿次,而此前的月访问量峰值为18亿次。

流量来了,自然想趁热打铁,苹果就是其重要目标。正如英伟达中级研究科学家JimFan所说:“谁先博得苹果,谁就博得了胜利。”

不过对端侧的“觊觎”其实早有疲态。今年夏天,科技媒体The就爆料,CEO萨姆·奥尔特曼(Sam)与苹果公司原首席设计官乔纳森·伊夫(JonyIve)正在合作开发一款的AI驱动的消费设备。这家初创公司目前正在与一些风险投资界的大鳄进行融资磋商,其中包括和的主要投资者。

刚才走出下降困局不久,苹果则还在经历下降困局。

苹果公司发布最新季度财报显示:去年前三个月,实现产值907.53亿港元,环比增长4%。

今年开始,华为、荣耀、小米、OPPO等手机厂商都开始积极尝试AI大模型落地。现现在,生成式AI早已成为手机产业链争夺的一个新赛道,而苹果这条赛道的脚步似乎慢了竞争对手几步。IDC中国区总工裁王吉平曾对媒体表示:“有AI加持的手机厂商增长表现更好。”

虽然苹果与合作的传闻不断,但接入GPT-4o的诠释出的这些令人惊讶的实时交互疗效以及暴增的流量,其实是让苹果最终选择作为合作伙伴的诱因。

苹果在“深思熟虑”之后,总算要迈出AI模型落地的*步。

02大招背后的问题

虽然距离还有十多天,而且外界早已心急如焚。不少人好奇,苹果和的合作模式会是如何的?

去年的英文海报主题是“大招码上来”,并且在苹果放大招之前,一些问题不容忽略。

图片[1]-OpenAI让苹果决定给Siri换个脑子-云上资源整合网

尤其是模型在端侧和云侧的使用情况以及用户隐私的保护,是你们关注的焦点。

对此,JimFan在X上发贴进行了预测:

舍弃siri。为iOS提炼出更大型、纯设备上的GPT-4o,并可选择付费升级以使用云;

将摄像头或屏幕传输到模型的原生功能,芯片级支持神经音频/视频编解码器;

与iOS系统级操作API和智能家装API集成。

JimFan觉得,可以通过为苹果设备训练端侧小模型,对部份付费用户提供云侧大模型的方法进行合作,从而灵活地解决用户隐私保护的问题。

无独有偶,古尔曼此前也发文称,苹果公司计划将自研高档芯片(如M系列芯片)置入云估算服务器中,用于处理估算难度大的AI功能,而相对简单的AI功能则直接在、iPad和Mac等终端设备进行本地处理。

不过,苹果想要在自己的设备上用好*进的大模型,还有以下三方面的问题值得阐述。

首先是Siri用哪些模型的问题。因为Siri是人机语音交互的入口,好多人好奇,苹果是会将Siri接入云端的GPT-4o模型,还是会将本地与云端模型混和使用,为Siri提供服务?

与国外手机厂商普遍采用云端处理语音助手的恳求不同,Siri的唤起和辨识都是在本地进行的。并且,端侧模型对手机显存、CPU、GPU算力调度的要求更高,vivo总工裁、OS产品总工裁周围就曾坦言:“性能方面,倘若做输入法的出词推荐,两秒就能出一个词;帧率方面,大参数目级的大模型在端侧运行十分耗电。”

国外某手机厂商专家西风(化名)在一场专家督查会上表示,因为GPT-4o参数目巨大且依赖强算力,因而Siri在接入GPT-4o后,不会走现有的端侧辨识合作路线,而是会在云端调用辨识功能。

他猜想,苹果唤起可能直接使用GPT-4o的云端模型,但具体任务的调用策略须要一个系统引擎来决定何时调用云端或本地模型。对于文本处理、生成等功能,本地模型能够胜任;但对于须要醇厚度和确切率更高的多模态交互(如视频功能),就须要调用云端模型来解决。

西风的推论,与古尔曼的最新爆料基本一致。古尔曼透漏,苹果的iOS18和macOS15都将包含特定的软件,用于确定任务是在端侧还是云侧进行处理。

接近苹果的硅谷某大厂生成式AI开发者丽声(化名)则表示,因为苹果对用户隐私的极端注重,苹果跟在大模型上的合作“只可能在云上进行”,不会让为其订制端侧模型。“对内应用的调用权限,也须要视用户信息的隐私程度而定。”丽声对「甲子光年」说。

其次是双方合作后,具体产品形态和落地时间的问题。苹果会不会单独为订制一个硬件?具体的落地时间会在何时?

的资深剖析师赵冬帅觉得,苹果可能会先从PC入手,先推出搭载了GPT-4o大模型的,以应对谷歌刚才推出的“+PC”的挑战;同时他觉得苹果会专门给GPT-4o订制一个硬件产品,以突出GPT-4o的语音和视觉交互功能。

而在西风看来,GPT-4o仍将会搭载在手机上,只是出现时间早晚的问题。他觉得,GPT-4o的云端应用预计会在iOS18发布时出现,而与硬件的充分融合则会在明年9月份的17上彰显,这也将推动国外厂商瞄准AI手机定义进行相应改革和参照。

丽声对于“苹果可能推出新硬件”的猜想持否定意见。在她看来,苹果的硬件战略是特别固定的,*不会由于和合作就为其专门订制新的硬件。“苹果大约每六到五年才能出一个新的硬件产品,GPT-5可能今年年初都会发布,那若果依照这个逻辑,莫非GPT每迭代一个版本,苹果就要为其订制一款硬件吗?”丽声说。

最后是接入后用户高频使用带来的算力调度与算力成本问题。接入GPT-4o后,全球超过10亿的活跃用户会不会使苹果的云端交互显得不顺畅?苹果又该如何解决接入GPT-4o后算力成本急剧提高的问题?

「甲子光年」了解到,通常来说,一个手机厂商每年须要向辨识相关的大模型供应商付费大概8000亿元左右。假如苹果接入GPT-4o,预计支付的费用会在万元级别。

图片[2]-OpenAI让苹果决定给Siri换个脑子-云上资源整合网

GPT-4o当前的定价,图片来源:开发者平台

其实也正是由于未来搭载大模型的太花费算力、太贵了,苹果在尝试一种愈发实惠高效的云端算力提供方式:直接将它的PC端芯片M2Ultra放进云端服务器。

这也意味着,为了更好地参与生成式AI的大赛,苹果虽然瞄上了算力端,准备自己上手做云服务了。

丽声对「甲子光年」证实了这一点。她表示,之前苹果做AI相关业务的时侯,算力端只是通过买主板、买AWS云服务解决,而且作为一家软硬结合的大厂,苹果在人力、财力上都不缺,好多苹果内部职工也都倾向于自己做云服务。因而她觉得,苹果未来可能不会把大模型训练和推理所用的算力像先前一样交给AWS解决,而是自己下场做云。

不仅云侧算力,端侧算力同样重要。目前主流端侧模型的参数目均在百亿左右,算力须要满足实时执行这样的模型的要求,便须要扩大芯片面积来提高性能。

「甲子光年」注意到,苹果在其最新发布的iPadPro上搭载了M4芯片,这是目前苹果性能最强的芯片。M4芯片的NPU运算速率达到了每秒38万亿次(38TOPS),而苹果的上一代芯片M3的NPU运算速率只有每秒18万亿次(18TOPS)。

图片[3]-OpenAI让苹果决定给Siri换个脑子-云上资源整合网

免费获取chatGPT 3.5 账户,或购买GPT 4.0plus 会员账户,扫描文章内微信公众号二维码,或加微信:yuke36

© 版权声明
THE END
喜欢就支持一下吧
点赞8 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容