https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
中文视觉大模型竞争新局面:豆包夺魁,国产实力全面反超!

SuperCLUE-VLM 发布了最新的中文多模态视觉语言模型测评结果,标志着国内人工智能领域的一次重大突破。在此次评测中,字节跳动的 Doubao-Seed-2.0-Pro-260215 以 90.66 分的优异成绩荣获总榜第一,成功超越了谷歌的 Gemini-3.1-Pro-Preview,后者得分为 89.35 分。

本次测评涵盖了国内外 17 款主流视觉语言模型,国产模型表现出色,不仅在榜单中占据多个前列名次,阿里巴巴的 Qwen3.5 系列、商汤的 SenseNova、以及智谱 GLM 等均表现不俗。相比之下,OpenAI 的 GPT-5.4 和其他一些海外知名模型则只能排在中游位置,显示出国产模型的强劲上升势头。

评测的内容涉及三个主要维度:基础认知、视觉推理和视觉应用,涵盖了多达 25 项具体任务,包括通用识别和医疗影像等。评测结果显示,国产模型在基础认知和数据分析上表现尤为突出,得分普遍超过 90 分,展现了成熟而稳定的能力。然而,在视觉推理及工业、医疗等专业应用领域,国内模型仍然有待进一步提升,某些专业场景的得分相对较低。

划重点:

🌟 Doubao-Seed-2.0-Pro-260215 以 90.66 分获评第一,超越谷歌 Gemini-3.1-Pro-Preview。

📊 国产模型在基础认知和数据分析上得分普遍超过 90 分,表现稳定。

🛠️ 在视觉推理及专业应用领域,国产模型仍需提升,部分场景得分偏低。



via AI新闻资讯 (author: AI Base)
Lovable 上线移动端 AI 编码应用,支持语音提示生成 Web 应用

4月28日,初创公司 Lovable 正式在 iOS 和 Android 平台上线其无代码 AI 应用构建器。该产品核心主打“氛围编码(Vibe Coding)”理念,允许潜在开发者随时随地通过语音或文本 AI 提示捕捉灵感,实现移动端的即时开发。用户可在电脑与手机间无缝切换项目进度,并在版本就绪时接收审核通知。

此次发布背景正值苹果公司对“氛围编码”类应用收紧政策。近期,苹果以违反开发者准则、存在安全风险为由,封禁了包括 Replit 和 Vibecode 在内的多款热门工具更新,甚至一度下架同类应用 Anything。监管核心在于禁止应用在宿主内直接下载新代码或改变自身功能。为确保合规,Lovable 采取了将应用预览转移至网页浏览器的策略,定位为生成“可运行的网站或 Web 应用程序”。

在 AI 驱动软件开发的趋势下,Lovable 的入局标志着编程门槛正从专业技术向“灵感驱动”转型。尽管面临应用商店生态的合规性挑战,但 Lovable 通过 Web 端的折中方案,为移动端 AI 原生开发探索出了可行路径。这种从代码编写到预览分发的模式调整,不仅是技术层面的妥协,更是 AI 辅助开发工具在严苛审核机制下寻求生存与增长的行业缩影。

via AI新闻资讯 (author: AI Base)
英伟达发布多模态“全能模型”,推理效率达竞品 9 倍

当地时间4月28日,英伟达正式推出其最新的开放式多模态大模型——Nemotron3Nano Omni。这款模型被定位为“全能选手”,通过高度整合视频、音频、图像和文本的深度推理能力,旨在为开发者提供更快速、更智能的交互响应方案。

技术架构上的创新是该模型的一大亮点。Nemotron3Nano Omni采用了30B-A3B的“混合专家”(MoE)架构,将视觉与音频编码器直接集成在系统内部。这种一体化的设计打破了以往多模态处理需要依赖多个独立感知模型的僵局,实现了从“碎片化上下文”向“统一上下文”的跨越。

性能数据表现尤为抢眼。根据官方披露,该模型在复杂文档处理、视频理解及音频感知等六大权威排行榜中均位列榜首。得益于其独特的感知精度,该系统在保持极高交互性的同时,吞吐量达到了同类开放式全向模型的9倍。这意味着企业在部署AI智能体时,能够以更低的成本实现更强的可扩展性,且不牺牲响应的即时性。

目前,已有多家先锋科技公司接入该模型。H Company首席执行官Gautier Cloix在评价该模型时表示,得益于新架构,其AI代理现在可以实时解读全高清屏幕录像,这标志着AI从简单的任务执行者转变为能够实时感知并理解数字环境的交互者。

作为Nemotron3系列(包括Nano、Super和Ultra型号)的重要成员,该系列模型在过去一年中已创下超过5000万次的下载记录。英伟达表示,Nemotron3Nano Omni不仅可以独立运行,还能与专有云模型或其他开源模型协同工作,为复杂的代理工作流提供底座支持。此次发布无疑为企业级AI智能体的生产与部署树立了全新的效率标杆。

via AI新闻资讯 (author: AI Base)
苹果iOS27 细节曝光:三大AI修图神器助攻,支持画幅“脑补”

备受瞩目的WWDC26 全球开发者大会定于 6 月 8 日开幕。据最新消息透露,苹果届时将发布全新的iOS27 系统,其核心亮点在于深度集成三项突破性的AI照片编辑功能,力求在数秒内重构图像。

在新版照片应用中,苹果将推出名为“Apple Intelligence Tools”的专属菜单。其中最受关注的当属“Extend”功能,它能够利用生成式AI技术,自动填充照片边缘之外的背景内容。

智慧功能重塑影像

除了能“脑补”画面的扩展工具,系统还内置了“Enhance”增强功能。该工具可以精准识别并优化图像质量,智能调节照片的光影平衡与色彩饱和度。

针对空间影像,苹果还开发了“Reframe”重构工具。用户在后期编辑时可以自由切换观看视角,这一功能将极大地提升空间照片的沉浸感与视觉冲击力。

测试阶段仍存挑战

尽管功能构想极具吸引力,但目前的开发进程似乎并非一帆风顺。内部测试数据显示,由于底层模型尚在打磨,画幅扩展与视角重构的稳定性仍有待提升。

苹果团队目前正全力优化算法,以确保最终交付的用户体验符合标准。如果技术表现未达预期,部分前沿功能可能会推迟发布,或在初期采取小规模试运行的策略。

via AI新闻资讯 (author: AI Base)
AI 浏览器 Comet 正式上线 iPad,全面支持多任务处理

近日,Perplexity 旗下的 AI 浏览器 Comet 宣布其 iPad 版本正式上线,并全面适配苹果 iPadOS 系统。这一新版本不仅支持多窗口浏览和多任务处理功能,还深度整合了 OpenAI 与 Anthropic 等主流 AI 模型,为用户提供更为智能的上网体验。

Comet 浏览器的推出,不仅丰富了用户的网页浏览方式,还大幅提升了用户与 AI 聊天机器人的互动。通过这一浏览器,用户可以轻松调用 OpenAI、Anthropic 等顶尖 AI 模型,进行智能搜索和交互。对于习惯于多任务处理的 iPad 用户来说,这一更新无疑是一个重大利好。

在 iPadOS 的多任务处理机制下,Comet 浏览器支持用户同时开启多个浏览窗口,提升工作效率。无论是进行文档查阅,还是在线学习,用户都能轻松在不同窗口间切换,享受流畅的操作体验。这一功能的推出,标志着 Perplexity 在不断扩大其在苹果生态中的布局。

值得一提的是,Comet 浏览器并非首次进入苹果平台。今年 3 月,Perplexity 已在 iPhone 平台上线该浏览器,并在 Mac 平台推出了一项名为 “Personal Computer” 的智能助手功能,进一步增强了桌面端的 AI 能力。可以预见,Perplexity 正致力于将 AI 技术融入更多日常工具中,推动用户体验的提升。

随着 Comet 浏览器的发布,Perplexity 在移动端和桌面端的持续努力,展示了其在 AI 浏览器领域的强大潜力和创新能力。未来,用户将能够期待更多智能功能的推出,进一步提升上网的便捷性与智能化。

via AI新闻资讯 (author: AI Base)
Claude深度集成Adobe、Blender等八大神器,AI代画代练时代开启?

创意领域的工作流正迎来一场效率革命。Anthropic 近日正式宣布,旗下人工智能模型 Claude 已实现与 Adobe、Blender 等八大主流创意软件的深度互联。通过新增的专属连接器(Connectors),Claude 的 AI 能力将不再局限于独立的聊天窗口,而是直接融入平面设计、3D 建模及音频制作的专业生产流程中。

在视觉创作领域,Claude 与 Adobe 生态的整合尤为引人注目。创作者现在可以直接在常用的工具中调用包括 Photoshop、Premiere 和 Express 在内的 50 多项核心功能。与此同时,针对 Affinity 的连接器则侧重于生产力的自动化,能够接管那些枯燥、重复的生产任务,甚至支持用户根据具体需求定制专属的自动化功能。

3D 建模与工业设计同样受益匪浅。Autodesk Fusion 的订阅用户如今只需通过简单的自然语言对话,即可指挥 AI 完成复杂工业模型的构建与修改。而 SketchUp 的使用者可以先向 Claude 描述初步构思,由 AI 快速搭建基础 3D 雏形后,再进入软件进行精细化打磨。

值得一提的是,开源 3D 软件 Blender 的集成利用了 Python API。这意味着开发者和动画师不仅能让 AI 协助分析并调试复杂的 3D 场景,还能批量编写自定义脚本来操作对象。对于视觉艺术家而言,现在甚至可以用自然语言实时操控 Resolume Arena 和 Wire 等舞台视觉软件。

在音频领域,此次更新同样覆盖了 Ableton 和 Splice。音乐制作人可以随时向 Claude 查询复杂的官方文档,或者在海量的免版税采样库中进行快速检索。

此次升级标志着 Claude 的角色定位发生了转变:它不再仅仅是一个简单的对话机器人,而是进化成了能够理解专业软件逻辑、编写插件、重构数据格式的“智能助手”。通过接管繁琐的执行层面工作,AI 旨在让创作者将更多精力回归到核心灵感的打磨上。

via AI新闻资讯 (author: AI Base)
国产AI视觉大模型集体“反超”,豆包力压谷歌拿下全球第一

根据SuperCLUE-VLM发布的2026年4月最新评测报告,中文多模态视觉语言模型领域发生了结构性变动。在对全球17款主流大模型进行的深度横评中,国产AI阵营表现出极强的爆发力,不仅在中文语境理解上优势明显,综合得分也实现了对海外顶尖模型的反超。

字节跳动登顶榜首,多款国产模型跻身第一梯队

测评结果显示,字节跳动旗下的Doubao-Seed-2.0-Pro-260215以90.66的高分荣登总榜冠军。这一成绩成功超越了此前备受关注的谷歌Gemini-3.1-Pro-Preview(89.35分)。与此同时,阿里旗下的Qwen3.5系列、商汤SenseNova以及智谱GLM等国产模型同样表现不俗,稳居榜单前列。相比之下,OpenAI的GPT-5.4及X.AI的Grok等海外知名模型在本次中文多模态测试中仅位列中游。

三大维度深度解构,基础认知能力表现成熟

本次评测体系严密,从基础认知、视觉推理、视觉应用三大核心维度展开,细分任务涵盖了通用识别、图表分析、医疗影像等25项具体场景。国产模型在“基础认知”与“数据分析”两个领域表现尤为出色,得分普遍跨越90分大关,显示出极高的技术成熟度与中文环境适配性。

垂直领域仍存挑战,工业与医疗推理成未来赛点

尽管在综合排名上实现领先,但测评数据也揭示了国产模型仍需完善的方向。在涉及工业检测、高精度医疗影像等专业性极强的“视觉推理”任务中,国内模型与全球顶尖水平相比仍有进步空间,部分细分场景的得分波动较大。

业内分析认为,本次榜单的更迭标志着中文多模态AI已经跨越了关键的技术拐点。国产大模型在中文场景的深度理解与应用能力上,已经建立起了坚实的竞争壁垒,正式开启了与国际巨头并驾齐驱甚至局部领先的新阶段。

via AI新闻资讯 (author: AI Base)
转头牵手亚马逊?AWS 迅速接入OpenAI全系产品

全球 AI 版图迎来了一次重磅震荡。就在 OpenAI 宣布其长期盟友兼最大投资方——微软,不再拥有其产品的“云端独家使用权”后,科技巨头亚马逊(Amazon)展现出了极为敏锐的反应速度。

这一举动意味着,长期以来将 OpenAI 模型作为核心竞争力的微软 Azure 平台,正式失去了其在云服务市场的差异化特权。

闪电上架:AWS 迅速接入 OpenAI 全系产品

市场观察显示,这一规则的改变迅速引发了连锁反应。在 OpenAI 与微软公布修订后的合作协议后不久,亚马逊首席执行官安迪·贾西(Andy Jassy)便在社交媒体上公开表态,称其为一则“耐人寻味的公告”。

随后,亚马逊云科技(AWS)迅速行动,扫清了此前的合作技术与法律障碍,正式在其平台上架了 OpenAI 的全系产品。这一动作的效率之快,超出了不少行业分析师的预期,也标志着 AWS 用户现在可以像使用其他大模型一样,直接调用 OpenAI 的尖端生成式 AI 能力。

资本博弈:500 亿美元合作背后的权力重组

事实上,这次“倒戈”早有预兆。此前,OpenAI 已与亚马逊达成了最高达 500 亿美元的合作框架协议。在如此巨额的注资背景下,双方在产品权限上的博弈日益公开化。

过去,OpenAI 与微软的深度捆绑虽然带来了稳定的算力支持,但也限制了其在其他云平台上的商业扩张。如今,随着协议的修订,OpenAI 成功实现了“多云布局”,在保持与微软合作的同时,充分挖掘 AWS 庞大的企业客户资源。

行业影响:AI 算力竞赛进入“大混战”

对于开发者和企业用户而言,这无疑是一个巨大的利好。OpenAI 产品进入 AWS 阵营,意味着企业无需为了使用特定模型而迁移整个云架构。

分析人士指出,随着亚马逊的强势切入,云服务巨头之间的竞争将从早期的“独家版权赛”转向“综合服务赛”。对于 OpenAI 而言,通过平衡微软与亚马逊两大巨头的关系,不仅获得了更灵活的资金和算力支持,更在 AI 基础设施领域掌握了更强的话语权。

via AI新闻资讯 (author: AI Base)
马斯克就起诉OpenAI案作证:奥尔特曼窃取慈善机构不能成为先例

马斯克周二在作证时表示,他起诉OpenAI及其两位联合创始人萨姆·奥尔特曼和格雷格·布罗克曼,是因为这家创业公司从慈善机构向营利性企业的转型是错误的,并为其他慈善事业树立了一个令人担忧的先例。马斯克在加州奥克兰联邦法院审判开始时对陪审团表示:“我的观点是,窃取一个慈善机构是无法接受的。”这场备受关注的审判,是三人多年积怨与公开交锋的最终爆发。三人曾于2015年共同创办OpenAI,但随后关系恶化,并成为竞争对手。马斯克表示,这场法律斗争的影响远远超出涉案人员本身,如果奥尔特曼和布罗克曼的行为不被视为不当,那么“这起案件将成为判例法,成为掠夺美国所有慈善机构的先例”。

—— 凤凰网科技彭博社

via 风向旗参考快讯 - Telegram Channel
Elevated errors on Claude Opus 4.7

Apr 28, 23:33 UTC
Investigating - We are currently investigating this issue.

via Claude Status - Incident History
OpenAI回击增长质疑:一切业务“运转如飞”

周二,OpenAI对外界关于其销售增长的质疑作出了回应,先前有报道称这家AI初创公司未能达到内部目标。OpenAI在声明中表示,无论是面向消费者还是面向企业的业务,都在“高速运转”(firing on all cylinders,指“发动机的所有气缸都在点火”)。OpenAI称,来自企业客户的需求持续增长,公司尚处早期阶段的广告业务也在扩张,“公司内部的氛围非常积极。”公司还称,“未能实现多项内部目标”的报道是“典型的标题党”。前一天有报道称,知情人士透露,OpenAI未能实现其内部多项目标,包括在2025年底之前让其ChatGPT拥有每周10亿活跃用户。

—— 财联社彭博社

via 风向旗参考快讯 - Telegram Channel
Codex stream is disconnecting intermittently

Status: Identified

We have identified that users are experiencing elevated errors for the impacted services. We are working on implementing a mitigation.

Affected components
Codex API (Degraded performance)
Codex Web (Degraded performance)
CLI (Degraded performance)
App (Degraded performance)
VS Code extension (Degraded performance)

via OpenAI status
Claude.ai unavailable

Apr 28, 17:41 UTC
Investigating - We are investigating an issue preventing users from reaching Claude.ai, and will provide an update as soon as possible.

via Claude Status - Incident History
Anthropic Claude现在可以接入Photoshop、Blender和Ableton

美国人工智能公司Anthropic宣布,其大模型助手 Claude 现已通过一组全新“连接器”直接接入 Photoshop、Premiere 等 Adobe Creative Cloud 应用,以及 Affinity、Blender、Ableton、Autodesk 等一系列主流创意软件。这一举措延续了本月稍早推出 Claude Design 后该公司向创意产业渗透的战略步骤,旨在让创意从业者更便捷地在熟悉的软件环境中调用 AI 能力。

据介绍,这些“创意连接器”可以让 Claude 访问应用、检索数据,并在关联服务中执行具体操作,从而围绕每款软件的特定场景提供辅助。例如,面向创作者的 Adobe 连接器可以调用 Photoshop、Premiere 和 Express 等应用,让用户在 Claude 的对话界面中“唤出”图片、视频和设计内容并进行处理,官方宣称这有助于在对话中“让图像、视频和设计真正动起来”。针对音乐制作软件 Ableton 的连接器,则能直接从其官方文档中提取信息,用于回答用户问题、解释功能或指导操作流程。而 Blender 集成则为这款 3D 建模软件的 Python API 提供自然语言接口,用户可以通过 Claude 在对话中调试场景、批量修改对象属性,甚至构建新工具,从而减少手写脚本的负担。

iframe (www.youtube.com)

Anthropic在声明中强调,Claude 无法取代人的品位和想象力,但可以“打开新的工作方式”,包括更快速、更有野心的构思过程、更宽泛的技能组合,以及帮助创意人员承担更大规模的项目。公司同时表示,AI 还可以分担创作流程中大量耗时的重复性任务,减少“体力活式”的手工操作,让创作者将更多精力集中在构思和审美判断上。

在产品更新之外,Anthropic还宣布成为 Blender Development Fund 的企业级赞助方之一,以支持这款开源 3D 软件的持续开发。该基金此前已获得 Netflix、Epic、Wacom 等大型企业的支持,安索匹克的加入被视为其在创意工具生态中进一步站队开源社区的重要信号。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:cnBeta.COM)
OpenAI称华尔街日报的报道是标题党 公司各项业务“火力全开”

OpenAI周二反驳外界关于其销售增长前景的质疑,尽管有报道称该公司未能达到内部目标,但OpenAI表示其面向消费者和企业的业务正“火力全开”。《华尔街日报》周一晚间报道称,随着竞争对手迎头赶上,OpenAI未能实现多项目标。OpenAI将这则报道称为“典型的标题党”。

这家ChatGPT开发商表示,其来自企业客户的需求以及尚处起步阶段的广告业务仍在持续增长。公司声明称:“内部氛围非常积极。”

周二,包括软银、甲骨文和CoreWeave在内的多家 OpenAI投资方和合作伙伴股价下跌。《华尔街日报》还报道称,OpenAI首席财务官Sarah Friar曾飙升,如果销售增长不够快,担心公司可能无力满足未来的算力需求。

投资者此前已越来越担心人工智能基础设施可能出现泡沫,质疑OpenAI及其他科技公司未来几年在数据中心和芯片上投入数千亿美元的计划是否能带来经济回报。

OpenAI在周二的声明中表示,公司仍将扩大算力视为“关键推动因素”,此举有助于为客户提供更优的产品体验。

不过,即便在《华尔街日报》报道之前,OpenAI已开始对基础设施投资采取更为谨慎的态度。

OpenAI近日表示,计划暂停一个位于英国的项目。微软也同意租用原本为OpenAI预留的挪威数据中心容量。今年3月,彭博报道称,由于融资谈判拖延,甲骨文与OpenAI放弃了在德克萨斯州扩建旗舰人工智能数据中心的计划。

CoreWeave周二指出,OpenAI 并非其唯一合作伙伴。该公司在声明中称,其客户还包括谷歌、Meta Platforms、Anthropic和微软等,并补充称“算力需求仍在增长”。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:环球市场播报)
Warp 开源客户端代码库,打造基于终端的智能开发环境

Warp 是一个基于终端的智能开发环境,现已开源客户端代码库。UI 框架采用 MIT 许可证,其余代码采用 AGPL v3。OpenAI 是创始赞助商,代理管理工作流由 GPT 模型驱动。支持内置编码代理,也可接入 Claude Code、Codex、Gemini CLI 等自定义 CLI 代理。

GitHub

🌸 在花频道 · 茶馆讨论 · 投稿通道

via 科技圈🎗在花频道📮 - Telegram Channel
Claude Code Code Review was intermittently failing

Apr 28, 06:00 UTC
Resolved - Claude Code Code Review intermittently wasn't starting sessions.

via Claude Status - Incident History
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]