https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
育碧官宣战略大转型:押注开放世界与服务型游戏,AI 将成开发新引擎

在经历了裁员、工作室关闭及多个项目流产的动荡期后,知名游戏大厂育碧(Ubisoft)正式披露了其全新的未来生存法则。据 AIbase 报道,育碧计划全面收缩战线,将核心资源精准投放于“开放世界冒险”与“原生服务型游戏”两大核心赛道,并试图通过生成式 AI 技术实现研发效率的跨代式跃升。

育碧在官方声明中明确指出,新的运营模式旨在提升战略执行力。尽管育碧在服务型游戏领域曾多次碰壁,甚至曾发表过“单人游戏已过时”的争议言论,但公司高层依然坚信,具备长期运营能力的服务型游戏才是行业未来的支点。为此,育碧专门成立了“创意工坊 CH3”,负责整合运营包括《飙酷车神》、《极限国度》及《碧海黑帆》在内的多款在线驱动产品。

值得关注的是,育碧对生成式 AI 的态度极为激进。据 AIbase 报道,育碧将其视作等同于当年 3D 技术革命的重大机遇,并计划持续加大对面向玩家的 AI 投资。目前,即便在削减了 6 个项目后,育碧仍有 4 个全新 IP 正在紧锣密鼓地开发中。这场以 AI 为加速器、服务型游戏为筹码的“破釜沉舟”式转型,能否让这家老牌巨头重回巅峰,正成为业界关注的焦点。

via AI新闻资讯 (author: AI Base)
淘宝天猫出重拳!AI 假图识别模型上线,让 P 图骗保无所遁形

在电商行业,利用 AI 合成虚假商品图来骗取退款的行为日益猖獗,这不仅损害了商家的利益,也扰乱了平台的生态。据 AIbase 报道,淘宝天猫在近日举行的商家服务大会上宣布,将正式上线售后 AI 假图识别模型,作为2026年营商环境优化的重要举措之一。

这一新工具的上线,意味着商家在面对售后纠纷时有了强有力的技术护航。商家现在可以通过旺旺聊天窗口,对疑似经过 PS 修改、添加虚假瑕疵(如破洞、污渍)的图片进行一键检测。一旦系统判定图片为 AI 生成的假图,该识别结果将直接被平台采信,用于后续的纠纷判决、退款审核及申诉流程,从而有效遏制恶意售后的“黑灰产”乱象。

除了技术治乱,淘宝天猫还披露了一系列亮眼的数据。据 AIbase 报道,其账号诚信体系已累计拦截异常退款行为,为商家挽回损失超40亿元;同时,平台通过优化物流赔付机制,预计全年可为商家节约成本超10亿元。未来,平台流量将进一步向高服务质量的店铺倾斜,通过算法和规则的持续优化,打造更加公平、健康的电商经营环境。

via AI新闻资讯 (author: AI Base)
百川智能发布Baichuan-M3 Plus,医学幻觉率降至2.6%,树立医疗AI新标杆

在医疗AI迈向临床可信应用的关键阶段,百川智能正式推出Baichuan-M3 Plus——一款专为高可靠性医疗场景打造的大模型。该模型创新性地将已在M2 Plus中验证有效的“六源循证范式”深度融入训练与推理全流程,确保每一条诊断建议、用药提示或健康指导均源自权威医学证据,将事实性幻觉率(factual hallucination rate)压降至仅2.6%,相较当前行业领先的GPT-5. 2 大幅降低超30%,刷新医疗大模型可信度新纪录。

“六源循证范式”是百川智能在医疗AI领域的核心方法论,指模型在生成回答时,必须综合参考六大类权威信源:包括国际诊疗指南(如WHO、NCCN)、国家药典、核心期刊文献、临床试验数据库、药品说明书及真实世界研究数据。通过在训练阶段注入结构化循证知识,并在推理时动态检索与验证,M3 Plus有效规避了通用大模型常见的“自信胡说”风险。

实测显示,在复杂病例分析、药物相互作用判断、慢病管理建议等高风险场景中,M3 Plus不仅回答准确率显著提升,更能主动标注信息来源,支持医生一键溯源核查。这一能力使其从“信息提供者”升级为“可审计的智能协作者”,极大增强临床使用信心。

百川智能表示,M3 Plus将优先面向医院、互联网医疗平台及医药研发机构开放,未来有望集成至电子病历系统、远程问诊平台和临床决策支持工具中。在医疗领域容错率极低的背景下,“说得少但说得准”正成为AI落地的核心准则。Baichuan-M3 Plus的发布,标志着国产大模型在专业垂类赛道上,正从“能用”迈向“敢用”的关键跨越。

via AI新闻资讯 (author: AI Base)
百川智能再推 M3 Plus,刷新医疗模型可靠性与应用成本新纪录

在“Baichuan-M3Plus 模型发布媒体沟通会”上,百川智能宣布推出全新升级版本 Baichuan-M3Plus(简称 M3Plus)。这是继开源新一代医疗模型 Baichuan-M3后,时隔仅9天再次发布的重要更新。官方表示,M3Plus 在医疗问答的准确性与可靠性方面实现进一步提升,再次刷新了行业内医疗模型在低幻觉表现上的纪录。

据介绍,在关键指标幻觉率方面,M3Plus 相比上一代产品实现了显著下降。在 Halluciation Rate 评测中,其幻觉率由 M3的3.5降至2.6,整体稳定性和可信度得到明显改善。

在发布会现场的实测环节中,百川智能将 M3Plus 与多家国内主流医疗模型产品进行了对比测试。结果显示,在部分同类产品的回答中仍存在引用来源不清晰、专业表述容易引发误解等问题的情况下,接入 M3Plus 的应用“百小应”给出了更为准确、清晰的回答,表现突出。

除性能提升外,M3Plus 还在成本控制方面取得突破。百川智能表示,该模型实现了 API 调用价格下调70%,有效降低了使用门槛,为后续规模化落地和推广应用提供了有力支撑。

via AI新闻资讯 (author: AI Base)
沃尔沃EX60全球首秀 最大纯电续航810km

沃尔沃正式发布全新纯电SUV车型沃尔沃EX60 ,该车基于纯电平台SPA3打造,最大纯电续航里程可达810km,超越了其核心竞品宝马iX3的标准纯电续航(WLTP续805公里)。

沃尔沃EX60在动力层面推出P6、P10、P12三款版本,其中P6为单电机布局,最大功率369马力,百公里加速5.7秒。

P10搭载双电机四驱系统,综合功率503马力,百公里加速4.4秒;P12同样采用双电机四驱,综合功率提升至670马力,百公里加速仅3.8秒。

新车匹配80千瓦时、91千瓦时、112千瓦时三种电池组,对应的纯电续航里程分别为620km、660km、810km。

充电上,支持最高400千瓦直流快充,电量从10%充至80%仅需19分钟,10分钟可补充340公里续航。

此外,沃尔沃还在该车首次搭载原生NACS端口,无需适配器即可接入超25000个特斯拉超级充电站。

再看新车外观,沃尔沃EX60延续斯堪的纳维亚家族设计语言,前脸采用分体式大灯,保留标志性雷神之锤造型,封闭式中央格栅搭配下包围主动式通风口,车身尺寸为4803×1899×1635mm,轴距2970mm,提供85L前备厢空间。

内饰采用极简风格,中控屏内置谷歌Gemini人工智能助手,支持自然语音交互和多场景智能服务,双辐方向盘搭配扁平化液晶仪表。

车内还配备28个Bowers & Wilkins扬声器,包括4个头枕音响系统储物空间设计巧妙,中控台下方集成无线充电面板和可开闭储物槽,悬浮式杯架从中央扶手延伸而出。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:快科技)
OpenAI首款AI设备蓄势待发 或于2026年下半年亮相

据Axios本周报道,OpenAI正“按计划”推进,将在2026年下半年推出其首款人工智能设备。这一消息由OpenAI全球事务主管克里斯·莱恩向该媒体透露,他将“设备”列为公司2026年值得期待的重大动向之一。

莱恩未透露这款即将面世产品的具体细节。该产品正由前苹果设计总监Jony Ive创立的oi Products团队操刀设计。艾夫的初创公司已于去年被OpenAI以65亿美元收购后正式合并。

此前多方爆料显示,这款首款由ChatGPT驱动的设备可能具备以下特点:口袋大小、能感知用户周围环境与生活情境,并且完全无屏幕。去年流出的法庭文件细节曾暗示它不会是可穿戴设备,但本周一则疑似供应链消息却指向OpenAI正在开发两款代号为“甜豌豆”(Sweetpea)的药丸形设备,它们佩戴于耳后。

据知名爆料者“智能皮卡丘”称,该设备将采用金属材质,并配备定制的2纳米芯片,旨在“通过指令Siri来替代iPhone的某些操作”,这表明其功能可能与AirPods有所重叠。据信,这款耳后模块还配备了用于环境或情境感知的传感器,并存放于一个蛋形充电盒中。

据报道,OpenAI正考虑在未来几年推出多款AI产品,可能包括一支笔和一款“家居式设备”。因此,本次爆料的产品可能与OpenAI首发的设备并非同一款。不过,“智能皮卡丘”声称艾夫的团队正优先开发这款耳后可穿戴设备,据传由富士康制造,最早可能在今年9月发布。具体情况仍有待观察。

莱恩在接受Axios采访时,并未承诺OpenAI的首款设备一定会在今年上市销售,但他表示公司“正考虑在(2026年)下半年推出一些东西”。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:手机中国)
OpenAI首席执行官Altman与中东投资者会面 为新一轮500亿美元融资筹集资金

知情人士透露,OpenAI首席执行官Sam Altman近期与中东顶级投资者会面,为新一轮融资筹集资金,总额可能至少为500亿美元。因信息尚未公开,要求匿名的知情人士称,Altman近期访问了该地区,并与阿布扎比部分有国家背景的主要基金等投资者洽谈。

知情人士表示,这家ChatGPT的开发者拟在本轮融资中筹集500亿美元或更多资金,对应公司估值约为7500亿至8300亿美元。目前谈判仍处于早期阶段,融资规模可能有所变化。彭博新闻社此前报道,OpenAI近期还与亚马逊洽谈,计划至少融资100亿美元。

OpenAI不予置评。媒体此前报道,该公司曾讨论以7500亿美元的估值筹集数百亿美元资金。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:环球市场播报)
海康威视2025年净利润大增18.46%,Q4强势提速,AI驱动进入高质量成长新阶段

在安防行业整体承压的背景下,海康威视交出了一份“以利润换增长”的高质量答卷。公司近日发布 2025 年业绩快报:全年实现营收925. 18 亿元,同比微增0.02%;**净利润达141. 88 亿元,同比增长18.46%**,显著跑赢收入增速,凸显经营效率与盈利质量的实质性提升。

尤为亮眼的是,**第四季度单季营收与净利润增速双双跃升至25.83%**,呈现明显的逐季加速态势。这一拐点背后,是公司自 2024 年起坚定推行“以利润为中心”战略的成效——主动优化产品结构、收缩低毛利项目、严控资本开支,并将资源聚焦于高附加值的AI创新业务。

现金流表现更优于净利润,显示公司回款能力增强、运营健康度提升。与此同时,**AI技术正成为海康威视新一轮增长的核心引擎**。其基于深度学习的智能感知、行为分析与多模态融合技术,已广泛应用于智慧城市、企业数字化、工业视觉等领域,推动产品从“硬件设备”向“AI解决方案”升级,进入规模化落地的成长期。

海外业务与创新业务(如热成像、汽车电子、智慧消防等)亦贡献稳健增量,有效对冲传统安防市场的波动,支撑整体业绩韧性。多家券商据此上调其目标价至 45 元,维持“买入”评级。

展望 2026 年,随着AI赋能的行业应用深化,以及全球智能化升级需求释放,海康威视有望延续“量稳利升”趋势。但需警惕的风险仍存:半导体周期波动可能影响芯片成本,AI商业化落地速度存在不确定性,且高强度研发投入能否持续转化为技术壁垒,仍是长期竞争力的关键考验。

当一家安防巨头不再靠“铺货”取胜,而是以AI驱动利润增长,海康威视的转型之路,或许正是中国硬科技企业迈向高质量发展的缩影。

via AI新闻资讯 (author: AI Base)
Inworld 推出全新 TTS-1.5:实时语音,延迟低,并支持多语言

近日,人工智能公司 Inworld 正式发布了其最新的文本转语音模型 TTS-1.5。该模型以其自然、富有表现力的实时语音而备受关注,能够在低延迟的情况下提供多语言支持。

根据官方介绍,TTS-1.5的使用成本约为每分钟0.005美元,声称比市场上的同类产品便宜25倍,这一价格无疑将吸引大量用户的关注。

TTS-1.5在技术上实现了低于250毫秒的实时延迟,这意味着用户可以在对话中几乎感觉不到任何延迟。语音合成技术的提升,不仅在速度上有了显著改善,模型在表达力和稳定性方面也进行了优化。这为各种应用场景,尤其是游戏和虚拟现实领域的对话系统提供了新的可能性。

除了极具竞争力的价格,用户对低延迟的需求也在不断上升。许多用户认为,延迟是文本转语音技术面临的一大挑战。如今,Inworld 的这一创新成果为实现更真实的对话体验铺平了道路。用户在社交平台上对这一技术表现出了浓厚的兴趣,并期待能在自己的项目中应用这一新模型。

划重点:

📢 TTS-1.5模型推出,具备自然的语音合成和多语言支持。

💰 该模型每分钟费用约为0.005美元,比市场同类产品便宜25倍。

实现低于250毫秒的实时延迟,为用户提供更真实的对话体验。


via AI新闻资讯 (author: AI Base)
YouTube 计划推出“AI个人形象”功能,Shorts 创作方式将迎新变化

未来一段时间内,用户在浏览 YouTube 短视频(Shorts)时,可能会看到更多由熟悉的创作者制作的新形式内容,甚至包括以创作者本人形象为基础生成的视频版本。YouTube 首席执行官尼尔·莫汉(Neal Mohan)在当天发布的年度公开信中透露,今年晚些时候,创作者将能够使用自己的“个人形象”来制作短视频内容。

莫汉并未在信中进一步披露该功能的具体细节。YouTube 发言人布特·布尔温克尔(Boot Bullwinkle)随后表示,平台将在未来公布更多相关信息,包括功能的上线时间以及具体使用方式。

这一举措是 YouTube 近年来持续扩展创作者工具的一部分。莫汉在信中提到,今年平台还将为创作者开放更多创作方式,例如通过文字描述生成互动内容,以及在音乐创作方面进行新的尝试。目前,其中部分功能已进入内部测试阶段。此前,YouTube 已陆续为创作者推出多种辅助工具,用于频道数据分析、视频配音以及短视频内容的快速制作。

与此同时,YouTube 也在应对平台内容质量管理方面的挑战。莫汉在信中专门用一节篇幅谈及这一问题。他表示,过去20年里,YouTube 一直避免对创作者生态施加过多限制,但这种开放性同时也意味着责任,即确保用户所期待的高质量观看体验。他指出,平台正在持续优化现有机制,这些机制在打击低质量内容、误导性标题以及大量重复发布方面,已取得明显成效。

除创作工具外,Shorts 也将迎来新的内容呈现方式。莫汉表示,YouTube 计划在今年将包括图片帖在内的多种内容形式,直接整合进 Shorts 的信息流中,以丰富用户的浏览体验。

via AI新闻资讯 (author: AI Base)
挑战英伟达垄断!初创公司 Upscale 获 2 亿美元融资,自研芯片直指 NVSwitch

在 AI 硬件竞赛中,连接 GPU 的网络架构正成为新的主战场。据 AIbase 报道,AI 网络初创公司Upscale AI近日宣布完成 2 亿美元的 A 轮融资。本轮融资由 Tiger Global、Premji Invest 等领投,旨在打破英伟达在机架级 AI 系统交换机领域的统治地位。

Upscale AI成立于去年,背后站着英特尔、AMD 和高通等巨头支持者。公司核心产品是名为“SkyHammer”的定制 ASIC 芯片。据 AIbase 报道,该芯片专为 AI 工作负载设计,旨在与英伟达 NVL72 机架中的 NVSwitch 芯片正面对抗。目前,尽管 Cisco 和 AMD 等巨头也在尝试推出替代方案(如 UALink),但技术成熟度尚处于早期,而Upscale计划在今年晚些时候就将产品推向市场。

为了提升兼容性,Upscale采用了一种基于内存语义的加载-存储网络架构,并支持 UALink 和 ESUN 两种竞争协议。据 AIbase 报道,该公司还计划通过支持开源网络操作系统 SONiC 来降低超大规模客户的管理难度。CEO Barun Kar 表示,随着新资金注入,公司将全力冲刺产品的交付与部署,力求在 AI 网络互联这一关键环节实现“去英伟达化”。

划重点:

💰 巨额融资入场: Upscale AI斩获 2 亿美元融资,用于研发挑战英伟达 NVSwitch 的 AI 网络交换机芯片。
🚀 自研 SkyHammer 芯片: 针对 AI 工作负载重新想象网络架构,计划在今年内推出支持 UALink 协议的定制化硅片产品。
🌐 打破生态封闭: 通过支持 SONiC 开源系统及多种行业协议,联合 AMD、高通等盟友共同对抗英伟达的 NVLink 闭环生态。

via AI新闻资讯 (author: AI Base)
玩美移动推出全新 API,让虚拟试穿成为时尚新风潮!

近日,玩美移动(Perfect Corp.,纽交所代码:PERF)在其时尚 API 中推出了一项重磅升级,新增了九个产品类别的虚拟试穿功能。这些类别包括手表、手链、戒指、耳环、项链、围巾、帽子、鞋子和包袋。这一创新旨在通过 AI 技术推动时尚行业的发展,为全球品牌和开发者提供全面的穿搭体验。

玩美移动的这项升级,依托于生成式 AI 和计算机视觉技术,能够精准识别人体结构、服装版型及环境光线,从而生成高度逼真的穿搭效果图。用户可以在系统中直观地查看各种配饰和单品的佩戴效果,这样不仅提升了购买信心,也增加了用户在电商平台的停留时间。

全新 API 与现有的服装及面料 API 协同工作,确保了用户体验的连贯性。系统智能适配用户特征,确保佩戴位置自然、尺寸精准,并且不同产品之间能够形成视觉上的和谐。同时,该 API 原生支持模型上下文协议(MCP),能够与电商平台、品牌官网、移动应用和全渠道零售场景完美兼容。这样的设计让品牌能够高效地生成高质量的图像输出,为消费者提供最佳的购物体验。

随着这一新功能的推出,玩美移动正在不断完善 AI 驱动的时尚生态,助力品牌提升转化率并减少退货率。通过高效的云端基础设施,该系统为消费者带来了更为便利的虚拟试穿体验,意味着购物将变得更加轻松愉快。

总的来说,玩美移动的新 API 将引领虚拟试穿的新潮流,充分利用现代技术来提升消费者的购物体验,为时尚行业注入新的活力。

via AI新闻资讯 (author: AI Base)
OpenAI CEO与中东投资者洽谈 500 亿美元融资计划

在AI军备竞赛愈演愈烈的当下,OpenAI 再次抛出了令人咋舌的融资计划。据 AIbase 报道,OpenAI 首席执行官萨姆·奥特曼(Sam Altman)近期频繁往返于中东地区,与阿布扎比多家具有国家背景的主权基金等顶级投资者深度接洽。据悉,OpenAI 本轮融资规模预计至少达到 500 亿美元,甚至更高,这直接将其市场估值推向了 7500 亿至 8300 亿美元的惊人高度。

尽管 OpenAI 目前尚未实现盈利,但其对未来的投入堪称史诗级。AIbase 报道显示,为了支撑昂贵的 AI 芯片研发、大规模数据中心建设以及顶级人才招募,OpenAI 已承诺在未来几年内投入超过 1.4 万亿美元用于基础设施建设。面对如此庞大的资金需求,寻求资金实力雄厚的中东主权财富基金支持,已成为奥特曼实现其宏伟技术版图的关键一步。

目前,这场庞大的融资谈判仍处于早期阶段。AIbase 报道指出,OpenAI 不仅在寻求中东资金,此前还有消息称其与亚马逊接洽筹集至少 100 亿美元。随着谷歌、Anthropic 等竞争对手的步步紧逼,OpenAI 显然希望通过这一轮规模空前的融资,在技术迭代与基础设施竞争中确立绝对的领先地位。

划重点:

💰 融资规模空前: OpenAI 计划融资至少 500 亿美元,公司估值有望冲刺 8300 亿美元大关。
🌍 剑指中东财团: CEO 奥特曼近期密集会见阿布扎比主权基金等投资者,旨在为长期的 AI 基础设施布局寻求资金支撑。
🏗️ 巨额基建投入: OpenAI 承诺未来几年在芯片和数据中心等领域的投入将超过 1.4 万亿美元,以应对日益激烈的行业竞争。

via AI新闻资讯 (author: AI Base)
京东联手宿豫区打造 AI 玩具产业新高地,未来玩具就靠它了

近日,宿迁地区共同建立一个 AI 玩具产业带。这一举措不仅为宿迁的产业发展注入了新活力,也为全国的 AI 玩具创新提供了一个新的标杆。

在大会上,京东展示了其最新推出的 JoyInside 软硬件一体化解决方案。这一方案专门为智能硬件设计,致力于提升消费者与产品之间的互动体验。据悉,京东已经与超过 40 家知名品牌展开合作,成功将终端交互频次提升了 120%。这样的成绩无疑让人对未来的 AI 玩具充满期待。

JoyInside 解决方案展示的硬件机芯方案涵盖了玩具和智能家居,支持多种连接方式,并通过严格的认证程序。这意味着,未来的玩具不仅仅是简单的娱乐工具,它们将更加智能化、互动化,能够与我们的生活紧密相连。与此同时,JoyInside 还提供定制化的硬件和全生命周期的支持,帮助品牌快速推出新产品,甚至共同打造市场上的爆款玩具。

随着技术的不断发展,AI 玩具正在从概念走向现实。这一产业带的建立,将进一步促进智能玩具的研发与创新,让我们可以期待在不久的将来,看到更加丰富多样的智能玩具出现在市场上。无论是孩子们的乐趣,还是家庭的互动,AI 玩具都将为我们的生活带来前所未有的体验。

未来,宿豫区将成为 AI 玩具产业发展的重要基地,吸引更多企业和投资者的关注。京东的这一战略布局,不仅有助于提升区域经济发展,也为消费者提供了更为丰富的选择。我们可以预见,AI 玩具的新时代正悄然来临,让我们拭目以待!

via AI新闻资讯 (author: AI Base)
东软集团携手 Cerence AI,打造未来智能座舱新体验

近日,东软集团与全球领先的人工智能技术公司 Cerence AI 正式签署了一项战略合作协议,旨在共同开发新一代智能座舱平台。此次合作重点将放在智能语音和大语言模型等前沿技术领域,目标是为全球汽车制造商提供高效、预集成的智能交互解决方案。

随着汽车行业智能化的加速发展,消费者对于智能座舱的需求日益增加。东软集团依托其先进的 NAGIC 智能座舱软件平台,将结合 Cerence AI 的顶尖语音技术、生成式 AI 及大语言模型技术,提升汽车座舱的自然语义理解和情感交互体验。这样的合作将为驾驶者带来更为安全、便捷和富有情感的智能出行体验。

合作的具体内容包括技术共创和生态融合。东软集团将利用其广泛的全球研发网络,而 Cerence AI 则提供其强大的技术优势,双方将共同探索智能语音交互的创新可能性。这一合作不仅将推动汽车智能化进程,还将开拓国际市场,让更多的用户体验到这一新技术带来的便利。

通过此次战略合作,东软集团与 Cerence AI 的目标明确:推动汽车行业的智能化进程,致力于为用户创造更加温暖和安全的出行体验。这种跨国合作体现了两家公司在未来智能出行领域的共同愿景和信心,标志着汽车产业进入一个全新的智能时代。

via AI新闻资讯 (author: AI Base)
国产算力新突破!摩尔线程×硅基流动在MTT S5000上实现DeepSeek V3 671B满血版高效推理,单卡性能逼近国际顶尖水平

国产AI芯片与大模型的协同优化迎来关键里程碑。近日,**摩尔线程与硅基流动联合宣布,基于国产GPU MTT S5000,成功完成对千亿参数大模型 DeepSeek V3 671B “满血版”的深度适配与性能验证**。通过创新应用FP8( 8 位浮点)低精度推理技术,实测性能表现亮眼:**单卡 Prefill(预填充)吞吐量突破4000 tokens/秒,Decode(解码)吞吐超1000 tokens/秒**,整体推理速度已逼近国际主流高端AI加速卡水平。

这一成果意义重大。DeepSeek V3 671B作为国内领先的开源大模型,参数规模庞大、推理负载极高,此前多依赖英伟达A100/H100 等高端GPU部署。此次在**完全国产化硬件平台**上实现高效运行,不仅验证了摩尔线程MTT S5000 在大模型推理场景下的真实能力,更标志着国产AI算力生态正从“能跑”迈向“高效跑”的新阶段。

关键技术突破在于FP8 低精度推理的深度优化。FP8 在保持模型精度损失极小的前提下,可显著提升计算吞吐、降低显存占用与功耗。摩尔线程与硅基流动联合完成了从底层驱动、算子库到推理引擎的全栈调优,使MTT S5000 充分发挥FP8 硬件加速潜力,有效支撑了大模型高并发、低延迟的推理需求。

对于行业而言,这意味着国产替代路径进一步清晰:**高性能大模型不再必须绑定海外高端芯片**。在当前全球算力供应链不确定性的背景下,MTT S5000 + DeepSeek V3 的组合为金融、政务、能源等关键领域提供了高性价比、高安全性的本土化AI部署选项。

尽管在绝对峰值性能或软件生态成熟度上,国产GPU与国际顶尖产品仍有差距,但此次实测数据表明,**在特定高价值场景下,国产方案已具备实用化竞争力**。随着软硬件协同优化持续深入,中国AI基础设施的自主可控能力正加速成型——从“可用”到“好用”,只差一次又一次这样的实测突破。

via AI新闻资讯 (author: AI Base)
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]