https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
特斯拉在自研芯片这条路上,迈出了关键一步。
马斯克近日在X平台宣布,下一代AI5芯片已完成流片——这意味着设计蓝图已正式移交代工厂,进入实际制造环节。量产时间表定在2027年,届时AI5将全面接替现有的AI4,成为特斯拉自动驾驶系统与人形机器人项目的核心算力平台。
性能层面的数字相当亮眼。据此前披露,AI5单芯片性能可媲美英伟达Hopper架构,双芯配置的综合表现则接近Blackwell级别,而成本与功耗均大幅低于英伟达同类产品。马斯克此前表示,AI5关键性能指标较上一代AI4提升约40倍,其中内存增加9倍、计算能力提升8倍。此外,AI5还被认为将成为参数规模低于2500亿模型的最优推理芯片。
代工方面,AI5的生产任务由三星与台积电联合承接,制造地点分别落在三星德克萨斯州泰勒工厂和台积电亚利桑那州工厂,全程依托美国本土产能。值得一提的是,马斯克发文时误标了台积电账号,错误指向一家名称相近的半导体公司,在社交媒体上引发了一阵短暂混乱。
马斯克在帖子中罕见地透露了这款芯片背后的压力:"解决AI5对特斯拉而言是关乎存亡的,不得不让两个团队同时集中攻关,我自己也连续几个月每个周六都亲自投入其中。"如今流片顺利完成,他表示终于有余力重新启动此前搁置的Dojo3超级计算机处理器研发工作。
AI6芯片的研发同样在按计划推进。特斯拉的自研芯片路线图,正在一步步向前延伸。
via AI新闻资讯 (author: AI Base)
印度班加罗尔初创公司 Emergent 周三宣布推出自主 AI 代理 Wingman,正式进军由 Anthropic 和微软主导的代理软件领域。Wingman 采用“消息传递优先”策略,深度嵌入 WhatsApp、Telegram 和 iMessage 等主流即时通讯平台,允许用户通过自然语言指令在后台跨工具执行电子邮件管理、日程对接等日常任务。
Emergent 此前凭借“氛围编码(Vibe-coding)”平台积累了超800万开发者用户,Wingman 的发布标志着公司战略从“构建软件”向“软件自主运营”的重心转移。该代理程序具备独特的“信任边界”机制,能够在自主处理常规操作的同时,针对关键决策触发用户审批流程,以解决行业对完全自主系统可靠性的担忧。尽管已具备跨工具协同能力,但 CEO Mukund Jha 承认,系统在处理模糊目标或需要高度人类判断的边缘案例时仍面临局限。
成立于2025年的 Emergent 凭借150万月活用户,于今年1月获得由软银、Khosla Ventures 和 Lightspeed 领投的7000万美元融资,估值已达3亿美元。此次 Wingman 的推出,不仅为其现有用户提供了更深度的生产力升级方案,也预示着 AI 代理正从独立界面向存量社交生态渗透。这种去中心化的交互模式,或将成为未来企业级 AI 助理与用户协作的主流形态。
via AI新闻资讯 (author: AI Base)
谷歌近日在Gemini3.1系列中正式推出全新文字转语音模型Gemini-TTS,官方给出的定位直接而自信:"至今最富表现力的文本转语音解决方案"。
这款模型最核心的突破,在于把语音的"控制权"真正交给了开发者。以往的TTS产品,生成出来的声音往往千篇一律,语气平、节奏死、情绪单薄。Gemini-TTS则支持通过提示词直接调控语音的情感、节奏和风格——旁白需要低沉庄重,对话需要轻松自然,停顿落在哪里、情绪如何起伏,都可以用语言描述来精确控制。听感上的自然度和细腻程度,比过去的同类产品上了一个台阶。
多语言支持方面,Gemini-TTS覆盖约70种语言,中文普通话、英语、西班牙语、日语等主流语种均在列。更省心的是,模型可以自动识别输入文本的语种,无需开发者手动标注,直接生成对应语言的语音输出。对于需要服务全球用户的企业来说,这意味着一套API就能搞定多语种内容的语音化需求,有声读物、播客、客服机器人、教育应用都是直接受益的场景。
谷歌还特别强调了Gemini-TTS与同系列音频模型的协同能力。在实时对话、语音翻译和多模态交互场景中,系统可以在保持低延迟的同时,通过文本提示和音频标记对语音输出进行精细调控,让AI在电话、会议、导航等实际使用场景中听起来更接近真实的人类交流。
语音,正在成为AI下一个主战场。谷歌这次出手,来势不小。
via AI新闻资讯 (author: AI Base)
欧盟初审判定Meta垄断,责令WhatsApp恢复第三方AI接入
欧盟委员会近日发布公告,初步认定Meta公司在限制第三方人工智能助手接入WhatsApp的过程中,违反了欧盟的反垄断规定。尽管Meta此前曾调整过相关政策,但欧盟认为这些改动仍存在排他性嫌疑。
此次裁决源于对Meta竞争行为的持续调查。为了保护市场公平竞争,监管机构拟下令要求Meta必须无条件恢复第三方AI工具的访问权限,确保生态系统的开放性。
收费框架被指设障
自 2026 年 1 月起,Meta曾试图通过更新服务条款,实质性地禁止通用AI助手接入其通信应用。面对欧盟的调查压力,Meta虽然撤销了禁令,却转而增设了一套复杂的收费框架。
欧盟委员会指出,这种变相的收费模式依然会对第三方开发者造成阻碍。其结果是让竞争对手难以在WhatsApp平台上生存,从而巩固Meta自身的市场主导地位。
维护市场竞争秩序
为了防止对市场造成不可挽回的损害,委员会要求Meta恢复至 2025 年 10 月前的原始接入条件。这一临时措施将持续执行,直到监管部门针对Meta的行为作出最终的法律裁决。
目前,Meta已对相关指控提交了回应材料,但未能扭转监管机构的初步判定。此举显示了欧盟在全球科技巨头反垄断监管方面的强硬立场,旨在为AI创新者留出公平的竞争空间。
via AI新闻资讯 (author: AI Base)
欧盟委员会近日发布公告,初步认定Meta公司在限制第三方人工智能助手接入WhatsApp的过程中,违反了欧盟的反垄断规定。尽管Meta此前曾调整过相关政策,但欧盟认为这些改动仍存在排他性嫌疑。
此次裁决源于对Meta竞争行为的持续调查。为了保护市场公平竞争,监管机构拟下令要求Meta必须无条件恢复第三方AI工具的访问权限,确保生态系统的开放性。
收费框架被指设障
自 2026 年 1 月起,Meta曾试图通过更新服务条款,实质性地禁止通用AI助手接入其通信应用。面对欧盟的调查压力,Meta虽然撤销了禁令,却转而增设了一套复杂的收费框架。
欧盟委员会指出,这种变相的收费模式依然会对第三方开发者造成阻碍。其结果是让竞争对手难以在WhatsApp平台上生存,从而巩固Meta自身的市场主导地位。
维护市场竞争秩序
为了防止对市场造成不可挽回的损害,委员会要求Meta恢复至 2025 年 10 月前的原始接入条件。这一临时措施将持续执行,直到监管部门针对Meta的行为作出最终的法律裁决。
目前,Meta已对相关指控提交了回应材料,但未能扭转监管机构的初步判定。此举显示了欧盟在全球科技巨头反垄断监管方面的强硬立场,旨在为AI创新者留出公平的竞争空间。
via AI新闻资讯 (author: AI Base)
据代理商高管及行业消息人士透露,OpenAI 计划对 ChatGPT 广告引入按点击量(CPC)计费模式,以取代单一的曝光量(CPM)计费,旨在通过更灵活的转化路径挑战谷歌与 Meta 的市场地位。此外,OpenAI 正探索推出引导用户购买或下载应用的行动导向型广告,并计划近期提升追踪与衡量工具的精度,以解决目前广告主普遍关注的转化数据缺失问题。
尽管 OpenAI 预测其广告收入在2027年有望达到110亿美元,但目前的商业化进程仍处于早期试验阶段。数据显示,由于广告库存竞争度较低,部分早期广告主的实际 CPM 仅为15至25美元,远低于此前60美元的预期。为吸引更多中小型营销人员,OpenAI 近几周已上线自助式广告管理平台,取代了此前低效的人工操作模式,并与 Criteo 等广告技术公司达成代销合作。同时,月度投放门槛已从早期的20万美元预付降至3万至5万美元。
尽管如此,ChatGPT 广告在品牌安全与精准定向方面仍面临挑战。由于生成式 AI 回复的唯一性,现有的宽泛关键词定向模式难以确保广告展示的稳定性。营销人员指出,在缺乏成熟的品牌安全管控工具及视频等多元化广告格式的前提下,广告主普遍持谨慎观望态度。对此,OpenAI 表示将持续迭代产品,在探索用户价值的同时,力求通过更具创新性的广告形式缩小与传统数字广告巨头的差距。
via AI新闻资讯 (author: AI Base)
AI桌面入口的争夺,终于凑齐了三家主角。
谷歌于4月15日正式推出Mac原生版Gemini应用,至此OpenAI、Anthropic和谷歌三大AI服务已全部登陆Mac平台。这个时间节点本身就很说明问题——谁都不想在桌面端缺席。
这款应用100%采用Swift原生开发,针对苹果设备专门优化,而非简单套壳网页版。交互体验上下了不少功夫:按下Option+Space可以唤起迷你聊天窗口,Option+Shift+Space则打开完整界面,全程无需切换浏览器标签页,菜单栏图标和Dock也都能快速启动。对于频繁使用AI的用户来说,这种"随叫随到"的操作逻辑,确实比每次都去开浏览器顺手得多。
功能层面,屏幕感知是亮点之一。用户授权后,Gemini可以直接读取当前屏幕内容,提供基于上下文的辅助——开会、写文档、查资料时,它能"看到"你在做什么,而不只是等着你输入问题。此外,应用还支持多种语音播报选择,以及迷你聊天的定时重置等个性化设置。
定价方面,基础功能免费但额度有限,付费档分三档:AI Plus月费7.99美元,AI Pro月费19.99美元,顶配AI Ultra则高达249.99美元,价格跨度相当大。系统要求macOS15Sequoia或以上版本。
值得注意的是,谷歌对这款应用的定位表述颇为明确——"桌面助手",而非单纯的聊天工具。官方表示,这只是构建个性化、主动性桌面助手的第一步,未来数月还有更多功能更新。
相比OpenAI和Anthropic更早布局Mac端,谷歌此次入场稍晚,但带着明确的差异化打法来的。桌面AI入口这块地,三家都已插旗,接下来比的是谁能真正留住用户。
via AI新闻资讯 (author: AI Base)
谷歌周三正式发布适用于 Mac 平台的原生 Gemini 应用程序,标志着其在桌面级 AI 助手领域的竞争力进一步增强,全面对标 OpenAI 与 Anthropic 的同类产品。该应用目前已面向全球运行 macOS15及以上版本的 Gemini 用户开放下载。通过引入“Option + 空格键”全局快捷键,用户能够在不切换窗口或标签页的情况下随时呼叫 AI 支援,实现从网页端交互向系统级深度集成的跨越。
技术实现上,原生 Gemini 应用支持屏幕感知功能,允许用户直接将当前查看的窗口内容(包括本地文件与复杂图表)实时分享给模型进行深度解析。这种上下文感知能力使用户能够针对复杂数据快速提取核心要点,或在电子表格处理等具体办公场景中获取即时公式支持。此外,该应用集成了谷歌最新的多模态创作能力,支持通过 Nano Banana 模型生成高精度图像,并调用 Veo 模型进行视频创作,构建了从文本对话到多媒体生成的完整工作流。
此次原生应用的推出,不仅是谷歌补齐跨平台生态缺口的关键一步,更展现了其将大模型能力推向操作系统底层、构建个人 AI 助理的战略意图。随着 macOS 应用的上线,Gemini 进一步降低了 AI 进入专业生产力场景的门槛,这种系统级的无缝交互模式预计将加速生成式 AI 在办公自动化与创意设计领域的深度应用,持续重塑桌面端的人机交互逻辑。
via AI新闻资讯 (author: AI Base)
OpenAI退出,微软接盘,这场挪威算力争夺战结局有点意思
一进一出之间,挪威这块算力资源的归属已经悄然易主。
OpenAI已正式放弃直接从英国AI云服务商Nscale位于挪威的数据中心租赁算力的计划。而那批空出来的资源,很快被微软接手——后者将承接该数据中心的剩余算力。
值得玩味的是,OpenAI并没有就此彻底退出这场算力游戏,而是转了个弯:据OpenAI表示,公司正在与微软洽谈,计划从微软手中租用算力资源。也就是说,同一批算力,OpenAI从"直接租用"变成了"转租",中间多了微软这层。
这个结构调整透露出几个信号:OpenAI在基础设施布局上正变得更加谨慎,不再执着于直接掌控算力资源;而微软则继续扮演"接盘侠"的角色,在算力资源的争夺中不断扩大自己的版图,同时也借此深度绑定OpenAI对自身基础设施的依赖。
两家公司之间的关系,因此又多了一层耐人寻味的微妙——合作伙伴,同时也是彼此最重要的筹码。
via AI新闻资讯 (author: AI Base)
一进一出之间,挪威这块算力资源的归属已经悄然易主。
OpenAI已正式放弃直接从英国AI云服务商Nscale位于挪威的数据中心租赁算力的计划。而那批空出来的资源,很快被微软接手——后者将承接该数据中心的剩余算力。
值得玩味的是,OpenAI并没有就此彻底退出这场算力游戏,而是转了个弯:据OpenAI表示,公司正在与微软洽谈,计划从微软手中租用算力资源。也就是说,同一批算力,OpenAI从"直接租用"变成了"转租",中间多了微软这层。
这个结构调整透露出几个信号:OpenAI在基础设施布局上正变得更加谨慎,不再执着于直接掌控算力资源;而微软则继续扮演"接盘侠"的角色,在算力资源的争夺中不断扩大自己的版图,同时也借此深度绑定OpenAI对自身基础设施的依赖。
两家公司之间的关系,因此又多了一层耐人寻味的微妙——合作伙伴,同时也是彼此最重要的筹码。
via AI新闻资讯 (author: AI Base)
苹果全力提升 Siri!近 200 名工程师参与 AI 编程训练营
近日,苹果公司为增强其语音助手 Siri 在 AI 领域的竞争力,组织了近 200 名工程师参加为期数周的 AI 编程训练营。此次训练的主要目标是帮助团队学习如何利用 AI 工具来辅助编写代码,以便在即将发布的 iOS 27 版本中提升 Siri 的表现。
训练营结束后,苹果将根据表现筛选出 60 名核心开发人员继续参与 Siri 的开发工作,另外 60 人则将转岗,专注于评估虚拟助手的性能表现。这一举措反映了苹果公司在面对 OpenAI Codex 和 Anthropic Claude Code 等 AI 编程助手的挑战时,正在积极调整内部开发策略。
据悉,苹果的 Xcode 26.3 版本已开始支持 Agentic Coding 工具,显示出公司对新兴 AI 技术的重视。此外,苹果内部各部门也在显著增加对 Claude Code 等 AI 工具的采购预算,以提高开发效率。为进一步推动项目发展,Siri 团队的结构也经历了重大调整,原负责 AI 的领导已不再主导该项目,取而代之的是曾负责 Apple Vision Pro 发布的 Mike Rockwell。
此外,Gemini 的参与将帮助 Apple Intelligence 模型提升功能,使新版 Siri 具备更强的多步指令执行能力,并提供类似 ChatGPT 的对话体验。苹果的这些新举措,意在让 Siri 在日益激烈的市场竞争中重新焕发活力,提升用户体验。
via AI新闻资讯 (author: AI Base)
近日,苹果公司为增强其语音助手 Siri 在 AI 领域的竞争力,组织了近 200 名工程师参加为期数周的 AI 编程训练营。此次训练的主要目标是帮助团队学习如何利用 AI 工具来辅助编写代码,以便在即将发布的 iOS 27 版本中提升 Siri 的表现。
训练营结束后,苹果将根据表现筛选出 60 名核心开发人员继续参与 Siri 的开发工作,另外 60 人则将转岗,专注于评估虚拟助手的性能表现。这一举措反映了苹果公司在面对 OpenAI Codex 和 Anthropic Claude Code 等 AI 编程助手的挑战时,正在积极调整内部开发策略。
据悉,苹果的 Xcode 26.3 版本已开始支持 Agentic Coding 工具,显示出公司对新兴 AI 技术的重视。此外,苹果内部各部门也在显著增加对 Claude Code 等 AI 工具的采购预算,以提高开发效率。为进一步推动项目发展,Siri 团队的结构也经历了重大调整,原负责 AI 的领导已不再主导该项目,取而代之的是曾负责 Apple Vision Pro 发布的 Mike Rockwell。
此外,Gemini 的参与将帮助 Apple Intelligence 模型提升功能,使新版 Siri 具备更强的多步指令执行能力,并提供类似 ChatGPT 的对话体验。苹果的这些新举措,意在让 Siri 在日益激烈的市场竞争中重新焕发活力,提升用户体验。
划重点:
🌟 苹果为提升 Siri 竞争力,组织近 200 名工程师参加 AI 编程训练营。
💻 训练结束后,仅保留 60 人进入核心开发团队,其余转岗评估性能。
🚀 Siri 团队结构大幅调整,新项目由 Mike Rockwell 接手,目标是增强多步指令执行能力。
via AI新闻资讯 (author: AI Base)
Adobe公司推出了具备自主决策能力的Firefly AI Assistant,标志着创作工具向智能体时代的跨越。这款助手不仅能响应简单指令,更能在复杂创作流中实现自主规划与执行。
不同于以往的单向交互,该智能体能够深入理解用户的设计意图,并独立拆解任务步骤。它致力于成为创作者的得力伙伴,而非单纯的替代工具,极大地缩短了从创意构思到作品落地的路径。
打通全家桶工作流
这款助手的核心优势在于其强大的跨应用协作能力,能够完美覆盖Photoshop、Premiere、Illustrator等核心软件。用户只需在统一的对话界面输入自然语言,AI便会自动跨软件编排工作任务,并实时维护项目上下文。
这意味着复杂的多软件联动操作现在可以一键完成,大幅提升了生产力。Adobe通过预设的多种创意技能降低了使用门槛,让初学者也能通过单一提示词完成专业级的人像修饰等任务。
深度学习用户偏好
Firefly AI Assistant具备卓越的学习进化能力,能够随着使用时间的增加,逐渐掌握并模拟用户的审美风格。这种特性确保了在不同项目和跨平台操作中,作品视觉风格能保持高度的一致性。
此外,该工具还深度集成了Frame.io审阅功能,支持自动整理信息并实时接收各方的反馈意见。目前该助手正处于Beta测试阶段,预计在未来几周内,首批测试者将获得公测版的访问权限。
via AI新闻资讯 (author: AI Base)
全球首个云端沙箱AI来了,它能边干活边进化,越用越聪明
AI助手"越用越好用"这件事,MiniMax正在让它成真。
近日,MiniMax正式上线了MaxHermes——一款基于Hermes Agent构建的云端自我进化AI助手,也是全球首个云端沙箱产品。
它最核心的能力,藏在一套独特的学习闭环机制里。简单来说,MaxHermes每完成一项复杂任务之后,不会就此"忘掉"这段经历,而是会主动从中提炼出可复用的技能单元,以独立文档的形式保存下来。下次遇到类似任务时,这些Skills会按需自动加载,直接调用,省去重复摸索的过程。更关键的是,每一次新的使用反馈都会反哺这些Skills,推动它们持续迭代优化。
这套逻辑的本质,是让AI具备真正意义上的"经验积累"能力——不只是执行指令,而是在执行过程中不断沉淀、自我改进。用得越多,它就越懂你,越懂任务本身。
与现有大多数AI助手"每次对话从零开始"的模式相比,MaxHermes走的是一条截然不同的路。云端运行意味着技能库的积累不依赖本地设备,随时随地都能调取之前沉淀下来的能力。
AI助手从"工具"进化为"会学习的伙伴",MaxHermes迈出了值得关注的一步。
via AI新闻资讯 (author: AI Base)
AI助手"越用越好用"这件事,MiniMax正在让它成真。
近日,MiniMax正式上线了MaxHermes——一款基于Hermes Agent构建的云端自我进化AI助手,也是全球首个云端沙箱产品。
它最核心的能力,藏在一套独特的学习闭环机制里。简单来说,MaxHermes每完成一项复杂任务之后,不会就此"忘掉"这段经历,而是会主动从中提炼出可复用的技能单元,以独立文档的形式保存下来。下次遇到类似任务时,这些Skills会按需自动加载,直接调用,省去重复摸索的过程。更关键的是,每一次新的使用反馈都会反哺这些Skills,推动它们持续迭代优化。
这套逻辑的本质,是让AI具备真正意义上的"经验积累"能力——不只是执行指令,而是在执行过程中不断沉淀、自我改进。用得越多,它就越懂你,越懂任务本身。
与现有大多数AI助手"每次对话从零开始"的模式相比,MaxHermes走的是一条截然不同的路。云端运行意味着技能库的积累不依赖本地设备,随时随地都能调取之前沉淀下来的能力。
AI助手从"工具"进化为"会学习的伙伴",MaxHermes迈出了值得关注的一步。
via AI新闻资讯 (author: AI Base)
谷歌于 4 月 15 日正式推出 macOS 版 Gemini 应用。该应用采用 Swift 语言原生开发,支持通过 Option + Space 快捷键快速呼出对话框。用户可利用该应用进行快速问答、内容草拟、信息摘要、代码编写及图像分析,并支持屏幕共享以提供更丰富的上下文信息。
此外,谷歌与苹果已达成多年期合作,Gemini 将为今年晚些时候推出的 iOS 27 和 macOS 27 提供 AI 动力,助力升级版 Siri 及 Apple Intelligence 功能。双方计划在 2026 年 6 月 8 日举办的 WWDC 上披露更多合作细节。
9to5Mac
🌸 在花频道|茶馆讨论|投稿通道
via 科技圈🎗在花频道📮 - Telegram Channel
谷歌为 Mac 推出原生 Gemini AI 应用
谷歌公司正通过一个新的原生 macOS 应用将 Gemini 带到 Mac 上,该应用从今天开始提供。Gemini for Mac 可通过键盘快捷键激活,并内置了生成图像、分析屏幕内容、审阅文件等功能。Gemini是三大AI服务中最后一个拥有专用Mac应用的,因为OpenAI公司和 Anthropic 公司有Mac应用已有一段时间了。在Mac上,可通过 Option + Space键盘命令在任何位置调出Gemini,因此无需切换到专用窗口。Option + Shift + Space 可用于打开完整的Gemini聊天窗口。Gemini也可以从Dock或菜单栏访问。Mac上的任何窗口都可以与Gemini共享,从而让Gemini能为你正在查看的任何内容提供上下文帮助。
—— Macrumors
via 风向旗参考快讯 - Telegram Channel
谷歌公司正通过一个新的原生 macOS 应用将 Gemini 带到 Mac 上,该应用从今天开始提供。Gemini for Mac 可通过键盘快捷键激活,并内置了生成图像、分析屏幕内容、审阅文件等功能。Gemini是三大AI服务中最后一个拥有专用Mac应用的,因为OpenAI公司和 Anthropic 公司有Mac应用已有一段时间了。在Mac上,可通过 Option + Space键盘命令在任何位置调出Gemini,因此无需切换到专用窗口。Option + Shift + Space 可用于打开完整的Gemini聊天窗口。Gemini也可以从Dock或菜单栏访问。Mac上的任何窗口都可以与Gemini共享,从而让Gemini能为你正在查看的任何内容提供上下文帮助。
—— Macrumors
via 风向旗参考快讯 - Telegram Channel
苹果Siri工程师被送去参加AI编程训练营
苹果公司正在将其大部分 Siri 工程师送到一个为期数周的训练营,以学习使用AI进行编程。苹果公司决定教其程序员更好地使用AI进行编程,这一决定距离苹果预计在WWDC上发布一个更智能、更强大的 Siri 版本仅剩两个月。在员工参加编码训练营期间,大约六十名 Siri 开发团队成员将留下来继续开发Siri,另外六十人将评估Siri 的表现。苹果正在测试以确保 Siri 符合其安全标准,并且能够解释和执行用户的命令。使用AI进行编程正在成为标准,但苹果的 Siri 团队显然没有充分利用AI编程工具。苹果内部的一些团队已将大部分预算分配给Claude Code,但Siri团队在苹果内部有着“落后者的名声”。
—— Macrumors
via 风向旗参考快讯 - Telegram Channel
苹果公司正在将其大部分 Siri 工程师送到一个为期数周的训练营,以学习使用AI进行编程。苹果公司决定教其程序员更好地使用AI进行编程,这一决定距离苹果预计在WWDC上发布一个更智能、更强大的 Siri 版本仅剩两个月。在员工参加编码训练营期间,大约六十名 Siri 开发团队成员将留下来继续开发Siri,另外六十人将评估Siri 的表现。苹果正在测试以确保 Siri 符合其安全标准,并且能够解释和执行用户的命令。使用AI进行编程正在成为标准,但苹果的 Siri 团队显然没有充分利用AI编程工具。苹果内部的一些团队已将大部分预算分配给Claude Code,但Siri团队在苹果内部有着“落后者的名声”。
—— Macrumors
via 风向旗参考快讯 - Telegram Channel
苹果公司近期为 Siri 工程师团队开设了一项内部“AI 编程训练营”,旨在快速提升其在生成式人工智能与大语言模型领域的工程能力,以支持新一代 Siri 与 iOS 18 等系统中更复杂的 AI 功能落地。
这一培训计划被视为苹果在与Google、OpenAI 等公司竞争中弥补 AI 人才短板的重要举措,工程师将深入学习如何用 AI 模型优化语音识别、自然语言理解及多模态交互任务。
知情人士透露,该训练营内容覆盖从基础模型原理到实际工程部署的全流程,包括 Prompt 工程、检索增强生成(RAG)、AI Agent 框架、低延迟推理优化以及如何在 iOS 生态中实现离线与端云协同的语音服务。 课程不仅强调代码能力,还要求工程师理解如何在隐私与安全前提下,将 Siri 与系统级应用(如 Spotlight、通讯录、日历等)深度整合,以实现更自然、上下文连贯的对话体验。
苹果内部人士表示,Siri 多年来在 AI 方面进展被外界评价为“缓慢且不一致”,公司高层已将 AI 重塑 Siri 作为优先战略之一,AI 编程训练营正是这一转型的组织保障。 未来几年,苹果希望通过对 Siri 团队的系统性再培训,将 Siri 从一个简单的语音指令工具升级为真正的“AI 个人助理”,在设备控制、知识问答、创作与生产力场景中提供更主动、更智能的服务。
via cnBeta.COM - 中文业界资讯站 (author: 稿源:cnBeta.COM)
Google宣布在其 Gemini 3.1 系列中推出一款全新的文字转语音模型 Gemini‑TTS,被官方描述为“至今最富表现力的文本转语音解决方案”。 新模型能够生成听感自然、高保真的语音,同时允许开发者通过提示词(prompt)控制语音的情感、节奏和风格,例如在旁白或对话中精确调节语气、停顿与情绪变化。
在多语言支持方面,Gemini‑TTS 覆盖约 70 种语言,包括中文(普通话)、英语、西班牙语、德语、日语等主流语言,模型可自动检测输入文本的语种,无须手动标注语言类型即可生成对应语音。 这一能力使得开发者和企业可以在有声读物、播客、语音助手、客服机器人、教育应用等场景中,用一套统一的 API 为全球用户提供多语种语音内容。
Google还强调,Gemini‑TTS 与 Gemini 3.1 系列的其他音频模型(如 Gemini 3.1 Flash Live)协同,进一步强化了“实时语音体验”的能力。 在实时对话、语音翻译及多模态交互中,系统可以在保持低延迟的同时,通过文本提示和音频标记精细控制语音输出,让 AI 代理在电话、会议、导航等场景下更接近自然的人类语音交互。
via cnBeta.COM - 中文业界资讯站 (author: 稿源:cnBeta.COM)
Degraded Performance for Composer 2
Apr 15, 18:51 UTC
Investigating - We are investigating this issue.
via Cursor Status - Incident History
Apr 15, 18:51 UTC
Investigating - We are investigating this issue.
via Cursor Status - Incident History
ChatGPT FedRAMP workspaces not loading
Status: Investigating
We are investigating the issue for the listed services.
Affected components
● FedRAMP (Full outage)
via OpenAI status
Status: Investigating
We are investigating the issue for the listed services.
Affected components
● FedRAMP (Full outage)
via OpenAI status