https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
文心一言5.1预览版上线 LMSYS 竞技场,目前位列全球第13位

百度文心一言5.1预览版近日低调上线国际权威大模型盲测平台 LMSYS Chatbot Arena。最新竞技数据显示,该版本目前在总榜中位列第13位。此次“悄然入场”标志着百度核心模型已进入新一轮快速迭代周期,并开始接受全球用户的直接质量检验与基准对标。

尽管百度官方尚未公开5.1预览版的具体参数规模及架构改进细节,但根据过往迭代逻辑与竞技场表现分析,该版本预计在语义理解、多轮对话逻辑及长文本处理稳定性上进行了针对性强化。进入 LMSYS 竞技场通常被视为模型具备高度成熟交互能力及全球化视野的信号,意味着国产大模型正加速通过公开的国际主流评价体系验证其实战能力。

行业观察认为,文心一言5.1的低调发布与高位入榜,展现了百度在大模型赛道“小步快跑”的竞争策略。随着国产大模型在国际排行榜中的排位集体前移,中国 AI 力量正从跟随式开发转向以智效比与真实交互体验为核心的质量突围,文心一言5.1的后续全量发布或将为中文语义理解与生产力应用树立新的行业标杆。



via AI新闻资讯 (author: AI Base)
爆破 9000 亿美元!Anthropic拟在IPO前完成AI史上最高融资

在人工智能领域竞速白热化的当下,Claude的开发者Anthropic再次投下了一枚震撼弹。据知情人士透露,由于急需在正式IPO(首次公开募股)前完成最后一轮私募融资,Anthropic目前已收到多份“抢先融资”要约,其潜在估值被推高到了惊人的 8500 亿至 9000 亿美元之间。

据悉,这一轮融资规模预计在 400 亿至 500 亿美元之间。如果该计划最终落锤,Anthropic的估值将在短短数月内翻倍,甚至有可能一举超越其核心对手OpenAI在今年 2 月达到的 8520 亿美元估值。

资本市场的“疯狂”竞逐

尽管Anthropic董事会预计在 5 月份才会对最终的融资细节做出决策,但全球投资者的热情显然已经处于爆棚状态。消息显示,目前的资金需求远超预定筹资额,一位甚至准备投入 50 亿美元的机构投资者,至今甚至未能获得与该公司首席财务官见面的机会。

这种疯狂的追捧并非空穴来风。Anthropic近期的财务数据表现极为亮眼:其年化营收已正式突破 300 亿美元大关,相比 2025 年底的 90 亿美元实现了跨越式增长。更有内部人士指出,这一数字目前已接近 400 亿美元。

编程能力成为核心增长点

不同于外界对AI聊天机器人的泛化认知,Anthropic目前的收入支柱主要来源于其卓越的AI编程能力。旗下Claude Code和Cowork平台在开发者市场表现强劲。投资者普遍认为,随着公司业务进一步向金融、生命科学以及医疗保健等高价值行业渗透,其盈利潜力还远未被完全挖掘。

相比于今年 2 月完成上一轮融资时 3800 亿美元的估值,Anthropic在短短两个月内身价暴涨,反映出资本市场对大模型商业化落地前景的高度认可。随着 5 月董事会会议的临近,这场可能改写全球AI竞争格局的顶级融资案正进入最后的冲刺阶段。

via AI新闻资讯 (author: AI Base)
AI商业化瓶颈被打破:零犀科技凭借因果大模型实现规模化盈利

近日,AI应用初创企业零犀科技通过自研的因果大模型,成功在保险、金融等高门槛销售赛道跑通了从技术到业绩的闭环,宣布在2025年实现规模化盈利及正现金流,为行业提供了大模型落地的全新范式。

长期以来,B端企业对于大模型落地的获得感相对较低。尽管通用大模型在对话理解上表现出色,但面对保险、金融等逻辑严密且专业性极强的销售场景时,往往因“幻觉”频发、决策不稳定等问题,难以直接替代真人完成复杂的销售任务。许多企业面临着“投入高、交付难、效果不稳定”的尴尬局面,大模型在业务一线往往被视为只能聊天而无法产生实际业绩的工具。

针对这一痛点,零犀科技并未跟随主流卷模型规模,而是专注于提升AI的“归因”与决策能力。其核心技术方案聚焦于“因果AI”与“大模型后训练”。通过将销售专家的业务逻辑转化为因果判断标尺,AI不再是机械地复述话术,而是能够像金牌销售一样理解客户背后的潜台词,并实时复盘决策路径。这种“后训练”机制让模型不仅能吸收行业知识,更能学会复杂的业务决策逻辑。

在商业模式上,该公司推行了“按交付结果付费”(RaaS)模式,将自身利益与客户的业务增长深度绑定。不同于传统SaaS系统“先付费、赌结果”的逻辑,这种模式直接以保费增量、营收提升等核心经营指标来量化AI的价值。据数据显示,已有保险客户接入其销售智能体后,一年内新增保费达20亿元。随着模型自主决策能力的提升,AI在垂直领域的任务替代率已从早期的30%逐步提升至接近全流程自主。

目前,这套基于客户经营智能体(ACE)的解决方案已在汽车、银行、教育等多个赛道规模化落地,合作伙伴涵盖奇瑞、高途等多家行业头部企业。零犀科技的核心团队主要来自百度人工智能部门,拥有超过十年的AI实战经验。

业内分析认为,AI的终极价值不在于参数比拼,而在于能否在实体产业中创造增量。零犀科技的案例证明,当AI能够从“工具”进化为“生产力”并直接交付业务结果时,大模型的商业化困局将迎来实质性突破。在国内大模型应用进入爆发期的背景下,具备结果交付能力的头部企业正率先迎来价值释放。

via AI新闻资讯 (author: AI Base)
全模态全尺寸全国产!央企发布十项数字技术成果,星辰大模型领衔自主可控新突破

在数字中国建设的宏大版图中,中央企业再次展现了其作为科技创新“排头兵”的力量。 4 月 29 日下午,第九届数字中国建设峰会传出重磅消息,国务院国资委正式发布了十项代表当前央企最高水平的数字技术成果。这不仅是一次技术实力的集中展示,更标志着我国在关键领域自主可控能力上迈出了坚实的一步。

此次发布的成果涵盖了工业软件、核心电子元器件及人工智能等多个战略性前沿领域。其中,由中国电信推出的“星辰大模型”成为了现场关注的焦点。据介绍,该模型已经实现了“全模态、全尺寸、全国产化”,这意味着从底层架构到顶层应用,整个技术链条均做到了自主可控,为我国大模型技术安全提供了底层保障。

除了备受瞩目的AI大模型,另一项极具实战意义的成果是“港口数字孪生智能体拟真决策平台”。该平台通过数字化手段构建了一个与物理港口完全对应的“孪生世界”,利用智能算法进行模拟实验与决策辅助,极大提升了港口运营的预见性和科学性。

峰会期间,相关参会代表还共同发布了《数智赋能未来产业 创新引领产业变革》倡议书。该倡议呼吁各界力量进一步凝聚共识、协同发力,通过数字技术与智能化的深度融合,共同驱动未来产业的高质量演进。这十项成果的集体亮相,生动勾勒出中央企业在关键技术“卡脖子”环节持续发力、以数智化转型引领产业升级的新气象。

via AI新闻资讯 (author: AI Base)
谷歌相册上线AI衣橱管家,一键提取单品并支持虚拟试穿

谷歌宣布,谷歌相册将迎来一项极具创意的AI功能,旨在帮助用户将凌乱的相册转化为井然有序的“数字衣橱”。这项功能利用人工智能技术,自动识别并提取用户照片中出现的服装图像,让旧照片里的穿搭单品焕发新生。

AI驱动数字收藏实现智能分类

该功能的核心在于其强大的视觉识别系统,能够从海量照片库中精准锁定服装单品,并根据种类自动创建收藏夹。用户可以轻松按照珠宝、上装或下装等类别进行筛选,从而快速找回那些长期埋藏在相册深处、甚至已经被遗忘的服饰。

除了整理功能,谷歌相册还引入了穿搭设计工具。用户可以自由混搭衣橱里的不同单品,为夏季婚礼、海外旅行或日常通勤等场景定制专属的“情绪板”,并能将这些搭配创意一键分享给好友进行参考。

虚拟试穿技术打破“买家秀”难题

最引人瞩目的更新莫过于“虚拟试穿”功能的集成。用户在决定当天的穿搭方案前,只需点击选中的单品并选择试穿,系统即可模拟展示该服装穿在用户身上的实际效果,极大地提升了穿衣决策的效率。

据悉,这项衣橱规划功能将于今年夏天率先在安卓平台推出,iOS版本也将随后发布。通过这一更新,谷歌相册正试图从一个单纯的存储工具,转型为能够深度介入用户生活方式的AI助手。

via AI新闻资讯 (author: AI Base)
SAS推出企业级AI治理工具,全方位管控“智能体”以化解影子AI风险

在近日举行的SAS Innovate大会上,分析软件巨头SAS发布了一系列针对智能体AI(Agentic AI)的治理工具。这些工具旨在帮助企业建立透明、安全的自动化环境,解决企业在推进AI落地过程中面临的合规焦虑与信任危机。

构建治理底座实现从实验到生产的跨越

SAS此次推出了包括Viya Copilot、智能体加速器以及名为SAS AI Navigator的治理产品,构建起一套完整的管理框架。官方强调,AI治理不应仅被视为合规负担,而应是推动业务增长的基座,让员工能在受控且安全的结构中探索AI极限。

其中,SAS AI Navigator作为核心SaaS解决方案,计划于 2026 年第三季度上线。它能通过编制AI资产清单,将复杂的AI使用场景与政府法规、企业内部政策自动对齐,帮助管理者清晰掌握所有模型和智能体的运行状态。

深耕行业应用并布局量子AI前沿领域

针对垂直行业,SAS发布了供应链助手与营销分析智能体,通过预设的“护栏”确保自动化决策的可靠性。这些行业加速器能模拟需求波动等复杂场景,并向人类用户解释决策背后的逻辑,有效弥补了企业内部行业专家与AI技术人才的缺口。

此外,SAS还宣布将于 2026 年第四季度成立量子实验室(Quantum Lab),旨在降低企业探索量子计算与AI结合的成本。尽管自动化水平不断提升,SAS仍坚持“人机协作”理念,认为AI只是乐器,其生命力最终取决于人类如何演奏。

via AI新闻资讯 (author: AI Base)
谷歌相册发布 AI 衣橱规划功能:支持自动分类、混搭建议及虚拟试穿

当地时间4月29日,谷歌宣布将在谷歌相册(Google Photos)中推出基于生成式 AI 的“衣橱规划”功能。该功能通过深度学习技术自动识别、提取并分类用户照片库中出现的服装单品,构建数字化个人衣橱。这是谷歌继虚拟试穿技术后,在 AI 时尚交互领域的又一重要落地,旨在通过系统性组织存量照片资产,提升用户的穿搭决策效率。

核心功能层面,该 AI 收藏夹支持按珠宝、上装、下装等类别自动筛选,激活用户对存量衣物的“再发现”。同时,用户可进行跨单品混搭以创建虚拟穿搭,并支持保存至针对特定场合(如婚礼、旅行、职场)的数字情绪板(Moodboard)。值得关注的是,该功能整合了先进的虚拟试穿技术,用户通过点击“试穿”即可预览单品在自身形象上的实际视觉效果,实现了从“照片回溯”到“穿前预测”的闭环。

据悉,该功能将于今年夏天率先在安卓平台上线,随后推向 iOS 平台。行业观察认为,谷歌此举不仅是图像识别技术的延伸,更是利用生成式 AI 优化 C 端生活化场景的典型案例。通过将相册从存储工具转化为具备时尚导购与搭配建议能力的智能体,谷歌正在进一步通过 AI 固化其在移动端个人数据生态中的核心地位。

via AI新闻资讯 (author: AI Base)
蚂蚁集团正式开源万亿级大模型Ling-2.6-1T,主打“快思考”智效比提升

蚂蚁集团旗下的百灵大模型团队于今日宣布,正式向开发者开源其万亿级旗舰模型Ling-2.6-1T。该模型不盲目追求参数规模的堆叠,而是致力于在真实复杂任务中,系统性地优化模型的指令执行、工具适配及长上下文承接能力。

架构创新实现高效能“快思考”机制

Ling-2.6-1T采用了创新的混合架构,通过抑制过程冗余的强化奖励策略,成功降低了Token开销。这种“快思考”机制使模型在保持万亿参数智能上限的同时,能以更低的成本直接输出高质量结果,大幅提升了智效比。

针对复杂工作流,该模型加强了对复合型任务的学习。在多项执行类权威基准评测中,Ling-2.6-1T展现出强大的多步执行能力,在代码生成、缺陷修复以及噪声环境下的精准推理方面均达到了开源领域的顶尖水平。

全栈兼容助力企业生产工作流落地

为了让万亿级模型真正走进开发者的生产实践,Ling-2.6-1T实现了与主流Agent框架的高度兼容。它能够适配多工具、多约束的复杂业务场景,旨在成为企业系统中可部署、可持续运行的核心能力底座。

目前,该模型已在Hugging Face和ModelScope等开源社区上线。为支持全球开发者的体验与评测,官方还宣布将OpenRouter平台的免费API调用服务延期一周,进一步降低了万亿级模型的使用门槛。

Hugging Face:https://huggingface.co/inclusionAI/Ling-2.6-1T
ModelScope:https://www.modelscope.cn/models/inclusionAI/Ling-2.6-1T

via AI新闻资讯 (author: AI Base)
Anthropic拟以 9000 亿美元估值开启巨额融资,或在IPO前超越OpenAI

AI领域独角兽Anthropic近日传出震撼消息,因急需在首次公开募股(IPO)前完成最后一轮私募融资,该公司已收到多份总额约 500 亿美元的融资要约。此次融资的估值区间被锁定在 8500 亿至 9000 亿美元之间,显示出资本市场对其技术潜力的高度认可。

营收指数级增长引发投资者争抢

Anthropic备受追捧的核心动力源于其惊人的财务表现。最新数据显示,该公司的年化营收已正式突破 300 亿美元大关,相较于 2025 年底的 90 亿美元实现了跨越式增长,甚至有知情人士透露其目前的年化营收已接近 400 亿美元。

目前,Anthropic的收入主要由其强大的AI编程能力驱动,旗下Claude Code与Cowork平台在开发者生态中占据了重要地位。投资者普遍认为,随着公司向金融、医疗及生命科学等专业领域的进一步渗透,其未来的商业价值仍有巨大的上行空间。

估值翻倍有望登顶AI行业之首

如果本轮融资在 5 月的董事会上获得通过并按计划完成,Anthropic的估值将较今年 2 月翻一番以上。这一数字不仅能使其与长期对手OpenAI并驾齐驱,甚至极有可能刷新全球AI企业的最高估值纪录。

面对庞大的算力需求与研发开支,Anthropic正面临着巨大的资金压力。尽管公司目前拒绝就融资细节发表评论,但市场热度已反映在投资者的行动中,据传部分大型机构为了获得认购额度,正积极寻求与公司高层会面的机会。

via AI新闻资讯 (author: AI Base)
百度GenFlow 4. 0发布:Office三件套被AI接管,职场“牛马虾”时代正式开启

4 月 27 日,百度文库与百度网盘联合推出了通用智能体GenFlow 4.0,标志着办公自动化进入了一个全新的阶段。此次更新的核心亮点在于对Office Agent的深度重构,实现了对PPT、Excel、Word三类核心办公软件的全面覆盖。

在PPT创作方面,新系统推出了“专业”与“创意”双模式。专业模式利用HTML生成技术,主打逻辑清晰与规范排版,特别适合学术论文或商务汇报;而创意模式则侧重于视觉冲击力,能生成色彩丰富、风格多样的幻灯片,满足宣传展示需求。此外,新增的“PPT美化”功能支持一键优化老旧草稿,在保留原意的基础上提升视觉表现力。

针对数据处理,Excel Agent实现了自然语言驱动的深度解析。用户无需背诵复杂的函数公式,只需通过对话即可完成PDF或图片中表格数据的提取、合并与可视化分析。Word Agent则依托海量行业数据库,提升了专业报告的写作能力,能够自动抓取数据并生成万字级的调研报告,同时涵盖了润色、校对等全流程。

兼容OpenClaw:百度网盘打造“牛马虾”数字员工体系

除了个人办公效率的提升,百度网盘此次还公开了融合OpenClaw后的最新进展,正式推出“牛马虾”智能体体系。这一体系允许个人与团队在网盘PC端或APP上一键部署Agent,且由于采用了云端独立部署模式,不占用本地内存,即使在关机状态下,智能体也能 24 小时在线执行任务。

“个人虾”侧重于零门槛的效率工具,内置了创意写作、网盘整理等高质量技能,支持一键迁移其他平台的Agent配置。而“团队虾”则更倾向于充当“数字员工”,能够处理摄影修图、视频素材分发以及财务发票审核等繁琐流程。

值得关注的是,该体系引入了“团队记忆”功能。团队成员的经验和历史资产可以沉淀至数字员工的记忆库中,实现知识的组织级积累。在安全性方面,系统通过同步盘目录隔离等技术,确保数据主权始终归属于团队。

从超级个体到超级组织:AI重构未来工作流

目前,百度文库与百度网盘的AI月活用户已分别达到 9700 万和 8000 万。GenFlow 4. 0 的迭代,不仅是将传统数天的办公流程缩短至分钟级,更是对协作方式的重构。

据透露,百度网盘计划在 5 月底发布团队版“Agent协作军团”,届时多个智能体将能够集群并行协作。这一系列动作预示着职场人将从重复性的“接力棒”工作中解放出来,转向更高阶的决策与创意领域,推动个人向“超级个体”、团队向“超级组织”进化。

via AI新闻资讯 (author: AI Base)
蚂蚁百灵 Ling-2.6-1T 正式开源:万亿参数规模对标 GPT-5.4

蚂蚁百灵大模型(Ling)今日宣布,其万亿参数级旗舰模型 Ling-2.6-1T 正式开源。该模型延续了上周发布时的技术核心,不再盲目追求超长思考链或参数规模冗余,而是通过创新的 MLA 与 LinearAttention 混合架构实现“快思考(Fast-Thinking)”机制,旨在解决万亿级模型在真实生产流中的智效比难题。

实测数据显示,Ling-2.6-1T 在 Artificial Analysis 的完整评测中表现出惊人的 Token Efficiency,仅需16M tokens 即可完成全部评估,输出成本仅为同类模型的约四分之一。在综合智能水平上,该模型已对标 GPT-5.4(非推理模式);而在推理、代码实现、工具调用及多步任务执行等实战指标上,Ling-2.6-1T 均达到了目前开源领域的 SOTA(业内最高)水平。

针对开发者痛点,该模型系统性优化了指令执行与工具适配能力。在蚂蚁内部的实际应用中,它能自主完成反馈分类、日志分析及代码修复,支持262k 超长上下文承接。此次开源不仅降低了万亿级模型的使用门槛,更标志着 AI 智能体(Agent)开发进入了“高智效、即时执行”的新阶段。

via AI新闻资讯 (author: AI Base)
腾讯开源超轻量离线翻译模型,手机端运行仅需0.4GB内存

4月29日,腾讯混元团队宣布正式开源其极限量化压缩版的翻译模型——Hy-MT1.5-1.8B-1.25bit。这款模型最大的亮点在于,它将支持33种语言的翻译能力精准压缩到了440MB左右,这意味着即便是存储空间紧凑的移动设备,也能在完全不联网的状态下实现高质量的实时翻译。

极致压缩:手机内存的“减负”革命

这一成果源于腾讯此前发布的专业翻译大模型Hy-mt1.5。原始的1.8B模型在常规精度下需要占用约3.3GB的内存,这对于手机端运行而言无疑是沉重的负担。为了解决这一痛点,研发团队采用了极致的量化压缩技术,将参数表达由16位(16-bit)降至最低1.25位。

通俗来讲,这一过程类似于在不损失关键细节的前提下,将一张4K高清大图压缩成体积极小的微缩图。针对不同性能的设备,腾讯此次同步推出了2-bit和1.25-bit两种量化方案,确保模型在“瘦身”后依然能够保持卓越的语义理解能力。

性能实测:断网状态下的翻译质量超越主流竞品

虽然体积大幅缩小,但在性能表现上并未缩水。根据官方公布的评测数据,这款1.8B参数级的轻量模型在多个基准测试中,翻译质量已经能够比肩甚至超越谷歌翻译等主流商业系统,甚至在某些维度上可以与千亿级(235B)的大型模型抗衡。

目前,该模型已原生支持包括中、英、日、法、俄、阿拉伯语在内的33种语言,并涵盖了藏语、蒙古语等少数民族语言。此外,它还支持5种方言及民汉互译,总计翻译方向高达1056个,极大地拓宽了离线翻译的应用边界。

深度集成:隐私安全与便捷体验并重

除了单纯的权重开源,该技术已在实际场景中展现出极高的实用价值。在最新适配的演示版本中,该模型支持“后台取词模式”,无论用户是在离线阅读邮件还是浏览本地网页,翻译功能都能即唤即用。

值得关注的是,由于翻译过程完全在本地设备运行,不涉及任何个人隐私信息的上传或云端采集,这为对数据安全有极高要求的用户提供了可靠保障。目前,该翻译能力已在腾讯内部的会议系统、办公软件及浏览器等多个核心业务场景中落地应用。

为了方便开发者和技术爱好者体验,相关模型已在Huggingface及魔搭社区同步上线。这标志着高精度翻译技术正加速从云端走向终端,让翻译服务真正成为随身携带、触手可及的基础工具。

via AI新闻资讯 (author: AI Base)
马斯克出庭指控OpenAI“监守自盗”,却遭推文打脸陷入尴尬境地

埃隆·马斯克于本周三现身加州联邦法院,就其起诉OpenAI一案亲自出庭作证。这位亿万富翁在庭审中言辞激烈,指责萨姆·奥特曼及其合伙人“窃取了慈善机构”,将原本非营利的前沿实验室私有化并攫取巨额利润。

当庭改口否认特斯拉研发通用人工智能

尽管马斯克在法庭上情绪激动地陈述其初衷是为人类开发AI,但他在交叉询问环节遭遇了严峻挑战。当面对自己此前在社交平台发布的推文时,马斯克不得不承认特斯拉目前并未研发通用人工智能(AGI),这与其几周前“特斯拉将成为实现AGI公司之一”的公开言论直接矛盾。

OpenAI的律师还揭露了马斯克早期的商业构想,试图证明其曾支持将OpenAI转型为营利性公司并寻求控股权。马斯克坦言,他曾在 2017 年前后探索过控制该机构营利分支的方案,并在方案失败后停止了定期捐款,这一细节令其“纯粹慈善”的立场受到质疑。

法庭激辩聚焦安全风险与利润限制

庭审的另一个核心争议点在于OpenAI的结构变动是否威胁到了社会安全。马斯克主张,OpenAI向传统企业的转型削弱了对安全研究的重视;而辩方律师则反击称,包括马斯克旗下xAI在内的所有人工智能公司都面临同样的商业压力与安全风险。

此外,马斯克在庭上还被追问其投资金额的真实性,此前他宣称投入 1 亿美元,实则仅支付了 3800 万美元。随着法官宣布提问将继续进行,包括OpenAI总裁格雷格·布罗克曼在内的多位高层预计将在周四出庭,届时这场关乎AI行业格局的法律战将迎来更多关键证词。

via AI新闻资讯 (author: AI Base)
程序员“数字分身”上岗:阿里发布 QoderWake,实现代码修复全流程无人值守

阿里巴巴正式发布“QoderWake”与“Qoder 移动端”两款 Agent 产品,标志着其 AI 智能体生态实现从企业生产级到个人移动端的全场景覆盖。其中,QoderWake 定位于安全可控、持续进化的生产级数字员工,旨在真实业务场景中承担软件工程师、运营及分析师等职能。

目前,QoderWake 已率先上线“数字程序员”角色,并实现在阿里内部的深度应用。该智能体可自主执行代码变更简报整理、错误诊断、反馈分类、日志分析及根因定位等任务,并能自动生成修复代码。在实际运行中,QoderWake 实现了全流程无人值守,仅需人类在关键决策环节进行最终确认,显著提升了研发运维的自动化水平。

同步推出的 Qoder 移动端则聚焦于跨端协同与交互体验的革新。用户可通过手机远程操控桌面端 Agent 执行复杂任务。区别于传统的即时通讯(IM)接入方式,Qoder 移动端能够直观展示 Agent 交互过程中的思考链与工作流,并支持主动弹窗交互,确保用户对 AI 工作细节的实时感知与确认。

行业分析认为,阿里此次布局展示了 Agent 从“对话窗口”向“原生操作系统级”及“行业垂直生产力”转型的趋势。通过将复杂的数字员工落地于真实工作流,阿里正加速推动 AI 从辅助工具演变为具备独立任务处理能力的生产要素,为企业数字化转型提供了全新的自动化范式。

QoderWake入口:https://qoder.com/qoderwake

Qoder移动端入口:https://qoder.com/mobile

via AI新闻资讯 (author: AI Base)
DeepSeek 开启识图模式灰度测试,多模态视觉理解能力正式落地

在 DeepSeek-V4发布并引发行业震动仅五天后,DeepSeek 官方正式开启多模态识图功能的灰度测试,标志着其多模态能力进入实质性落地阶段。此次更新在移动端与网页版输入栏中新增了“识图模式”入口,并显著标注“图片理解功能内测中”,完成了从纯文本/代码向视觉交互的重要跨越。

实测数据显示,DeepSeek 在基础视觉理解与画面描述方面表现优异。在识别复杂人物、环境构图及摄影细节时,能产出极高还原度的描述文本;在开启“思考模式”后,模型展现了深度的逻辑推理能力,可根据文物视觉特征准确推导其艺术风格与历史背景。此外,其对图片中文字信息的提取与场景判断亦达到了行业主流水准。

然而,在面对极端视觉挑战时,该模块仍存在优化空间。测试表明,模型在处理碎块化、反色等抗干扰图像时识别率受限;在元素计数与复杂图形逻辑推理任务中,虽然展现了自博弈式的推理尝试,但在准确率与响应效率上仍有提升余地。此外,其对极新产品信息的覆盖仍受限于现有知识库的更新周期。

行业分析指出,该功能目前更接近于挂载在主干模型上的视觉理解模块,旨在通过灰度测试验证多模态链路。随着 DeepSeek 视觉补丁的快速迭代,国产大模型在原生多模态赛道的竞争重心正从“参数规模”向“全场景感知”转型。此次内测不仅补齐了 DeepSeek 的核心功能短板,也预示着其原生多模态大招已进入最后筹备期。

via AI新闻资讯 (author: AI Base)
AI公司Anthropic有望冲击9000亿美元估值

据知情人士透露,Anthropic正在考虑一轮新的融资,该轮潜在的融资可能使其估值超过9000亿美元,有望超越其对手OpenAI,成为全球估值最高的AI初创公司。Anthropic正在与投资者接洽,相关报价可能使其估值较当前水平增加超一倍。他们指出,目前的讨论仍处于非常早期的阶段,公司尚未接受任何投资要约。据报道,此次磋商尚未公开,但当下正值Anthropic借其AI软件爆发式成功而加大融资力度之际。与此同时,公司也在积极寻求更多基础设施,以满足不断增长的产品需求。值得一提的是,Anthropic今年二月完成 300 亿美元融资时,就有投资机构试图以8000亿美元甚至更高估值入股。

—— 财联社彭博社

via 风向旗参考快讯 - Telegram Channel
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]