https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
国产大模型集体冲刺IPO!MiniMax、智谱、壁仞科技均通过港交所聆讯,资本市场迎来“AI六小龙”上市潮

国产大模型企业正加速迈入资本市场的聚光灯下。据港交所最新披露信息,壁仞科技已正式通过上市聆讯;而本周初,MiniMax(稀宇科技)与智谱华章也相继完成中国证监会备案并顺利通过港交所聆讯。这意味着,“大模型六小龙”中的多家头部企业已实质性进入IPO倒计时,中国AI产业正式迎来资本化关键拐点。

此次集中过会并非孤立事件,而是国产大模型从技术研发迈向商业落地与价值兑现的重要标志。在算力、模型、应用三层生态日趋成熟的背景下,资本市场对AI基础设施与底层技术公司的认可度显著提升。

市场的热情已提前反映在参股公司股价上。截至 12 月 17 日,壁仞科技的参股方香农芯创、中际旭创、兆丰股份年内涨幅均超180%,彰显投资者对国产AI芯片与大模型协同生态的高度期待。 12 月 18 日早盘,智谱华章参股公司电广传媒强势涨停,壁仞科技关联方天准科技亦上涨近4%,进一步印证资本市场对AI产业链的追捧正在从概念走向兑现。

值得注意的是,尽管“大模型六小龙”常被并列提及,但各家技术路径与商业化重点各有侧重:

- 智谱华章聚焦开源与行业大模型,GLM系列广受开发者欢迎;

- MiniMax强攻多模态与语音交互,产品矩阵覆盖B端与C端;

- 月之暗面以Kimi长上下文能力突围,近期加速探索企业服务;

- 壁仞科技则深耕AI芯片底层,为大模型提供国产算力支撑。

随着MiniMax、智谱、壁仞等企业率先叩开港股大门,其余如月之暗面、百川智能、零一万物等亦被认为紧随其后。这场IPO竞赛,不仅是融资动作,更是对技术壁垒、商业化能力与长期战略的全面检验。

当“六小龙”陆续登陆资本市场,中国AI产业或将迎来真正意义上的“成年礼”——从资本输血走向自我造血,从技术炫技转向价值创造。而投资者用真金白银投出的,不仅是对某一家公司的信心,更是对整个国产AI生态未来的押注。

via AI新闻资讯 (author: AI Base)
工业具身新标杆:人形机器人“小墨”规模化入驻宁德时代产线

近日具身智能领域迎来重大里程碑:全球首条实现人形机器人规模化落地的新能源动力电池 PACK 生产线,在宁德时代中州基地正式投运。由宁德时代生态企业 千寻智能 研发的人形机器人“小墨”已批量上岗,专门负责电池包下线前最具挑战性的 EOL(最终功能测试)与 DCR(直流内阻测试)工序。

这一环节长期以来因涉及数百伏高压插接操作、环境复杂且柔性要求极高而高度依赖人工,而“小墨”的引入不仅彻底消除了高压打火带来的安全风险,更将单日工作量提升了三倍,插接成功率稳定在99% 以上。

“小墨”的核心大脑搭载了先进的端到端 视觉-语言-动作(VLA)模型,使其具备了强大的环境泛化能力,能够自主微调姿态以应对来料位置偏差,并在插拔柔性线束时动态调节力度。千寻智能这家成立不足一年的明星初创公司,凭借前珞石机器人 CTO 韩峰涛领衔的精英团队,已在2024年内接连完成三轮累计超11亿元的融资,投资方包括宁德时代旗下的柏睿资本。

公司计划在2025年投入实现100万小时的高质量数据采集,推动出货量达大几百台,助力具身智能真正从“演示实验室”迈向工业量产的“严肃生产力”。

via AI新闻资讯 (author: AI Base)
🤖 OpenAI推出ChatGPT应用商店,集成Apple Music和DoorDash等服务

OpenAI于周三晚间正式推出ChatGPT应用商店(App Directory),用户可在此浏览所有可用工具,同时向开发者开放SDK以构建新的交互体验。该商店已集成Apple Music和DoorDash等热门服务,其中Apple Music应用可帮助用户查找音乐、创建播放列表和管理音乐库,DoorDash则能将食谱灵感和用餐计划转化为购物车。此前被称为“连接器”的功能现已统一更名为“应用”。OpenAI CEO Sam Altman表示,此举是公司迈向“万能应用”目标的重要一步。目前,OpenAI尚未透露具体的盈利模式,但表示正在探索数字商品等货币化选项。

(科技圈)

via 茶馆 - Telegram Channel
火山引擎总裁谭待:大模型市场未来将迎十倍增长

在 FORCE 原动力大会上,火山引擎总裁谭待在接受媒体采访时,对公司旗下豆包大模型的表现做出了积极评价。他指出,尽管在国内市场上,豆包大模型的成绩相对明显,但在全球范围内,如 OpenAI 和 Gemini 等竞争对手的表现同样突出。因此,火山引擎在这一领域还有很多努力的空间,尤其是在全球市场的拓展上,谭待提到公司旗下的 Seedance 和 Seedream 在国际市场上的表现也不错。

谈及未来的发展趋势,谭待表示,2026年大模型市场的竞争将不仅仅局限于当前的存量市场。他强调,未来更重要的是扩展市场规模,推动整个行业的增长。他预测,明年的市场规模可能会实现十倍的增长,因此,企业之间的竞争将不再是零和博弈,而是通过共同努力来扩大整体市场。

谭待的发言为业内人士提供了新的视角,认为未来的发展潜力巨大。火山引擎将继续致力于提升自身技术水平和市场份额,为全球用户提供更加优质的产品和服务。

划重点:

🌟 大模型市场将在未来一年可能实现十倍增长,企业之间的竞争将转向市场扩展。

📈 火山引擎在国内市场表现良好,但需努力提升在全球市场的竞争力。

🤖 谭待强调,未来的成功在于共同推动行业发展,而非简单的零和博弈。


via AI新闻资讯 (author: AI Base)
OpenAI 推出 ChatGPT 应用商店,集成 Apple Music 和 DoorDash 等服务

OpenAI 周三晚间正式推出 ChatGPT 应用商店(App Directory),用户可浏览所有可用工具,同时向开发者开放 SDK 以构建新的交互体验。新应用商店集成了 Apple Music 和 DoorDash 等热门服务,其中 Apple Music 应用可帮助用户查找音乐、创建播放列表并管理音乐库,DoorDash 则能将食谱灵感和用餐计划转化为购物车。

此前被称为"连接器"的功能现已统一更名为"应用",包括文件搜索应用、深度研究应用和同步应用等类型。OpenAI CEO Sam Altman 此前表示,公司计划构建强大平台所需的各项功能,应用商店的推出标志着向"万能应用"目标迈出重要一步。不过 OpenAI 尚未透露具体盈利模式,仅表示正在探索数字商品等货币化选项。

The Verge

🍀在花频道 🍵茶馆 📮投稿新鲜事

via 科技圈🎗在花频道📮 - Telegram Channel
Google Labs 放大招!AI 助理 CC 正式亮相:每天早上自动发邮件,帮你把 Gmail、Calendar、Drive 全盘打理好!

Google Labs 今日低调推出了一款代号为“CC”的全新 AI 邮件助理(实验性功能),它不是简单的 Gmail 智能回复,而是真正能在 Gmail、日历(Calendar)和云端硬盘(Drive)之间自由穿梭的“全能生活助理”。

每天早上自动为你写一封“人生提醒信”

CC 最吸睛的特性是:每天早晨,你打开 Gmail 收件箱,就能看到一封来自 CC 的个性化早间邮件,内容堪称“懂你到骨子里”:

- 今天上午10点有一个重要会议

- 下午需要回复某位客户的邮件

- Drive 里的项目报告还差你的签字

- 昨天那封没回的邮件我已经整理好,随时回复……

一封邮件搞定全天待办,再也不用打开十几个标签页、翻遍备忘录、来回切换 App。

核心能力:跨应用深度理解与主动提醒

- 自动梳理待办:实时扫描日历事件、未读邮件、Drive 文件修改记录,精准提炼出“今天最重要的事”。

- 主动推送提醒:不用你去问,它每天主动给你发“今日日程简报”。

- 一键回复与操作:邮件里直接提供“快速回复”按钮,或直接回复邮件给 CC 即可让它帮你起草、发送、安排会议。

- 零学习成本:无需额外 App、无需训练模型,只需用 Gmail 就能享受到它“像私人助理一样”的服务。

一句话总结 CC 的定位  

“它不是帮你写邮件的 AI,而是帮你过好一天的 AI。”

目前状态  

CC 目前作为 Google Labs 实验项目,部分用户已获得内测资格。Google 表示,将根据反馈逐步扩大测试范围,并可能在未来整合到 Gmail 正式功能中。

AIbase 点评  

在 AI 助理越来越泛滥的今天,CC 真正做到了“少即是多”——它没有花里胡哨的界面,只用你最熟悉的邮箱,每天主动把生活理得井井有条。这种“润物细无声”的体验,或许才是真正改变用户日常的 AI 应用。

via AI新闻资讯 (author: AI Base)
亚马逊任命长期 AWS 高管彼得・德桑提斯领导新 AI 组织

在亚马逊公司最新的消息中,首席执行官安迪・贾西宣布,长期担任 AWS 高管的彼得・德桑提斯将负责公司新成立的人工智能(AI)组织。这个新的组织将专注于亚马逊的 AI 模型,如 Nova,以及硅片开发和量子计算,旨在提升 AI 工具的速度和效率。

彼得・德桑提斯在亚马逊工作了27年,其中有8年担任 AWS 的高级副总裁。AWS 是全球约三分之一互联网服务的基础,近年来公司在企业级 AI 领域的承诺愈发明显。贾西表示,随着 Nova2模型在 AWS 最近的 re:Invent 活动上推出,定制硅片的快速发展,以及在模型、芯片与云软件基础设施之间优化的优势,公司希望能够让德桑提斯专注于这些新领域。

亚马逊对 AI 的日益重视,正值公司希望在激烈的 AI 竞争中巩固其市场地位。除了自身的创新,亚马逊也在积极进行投资。上个月,AWS 宣布将在美国政府的 AI 基础设施上投资500亿美元。此外,亚马逊还在与 OpenAI 进行谈判,计划投资100亿美元,并已对 OpenAI 的竞争对手 Anthropic 进行了80亿美元的投资。

亚马逊的这一战略布局,将使其在未来的 AI 领域更具竞争力,同时也将进一步推动云计算和智能技术的结合。

划重点:

1️⃣ 亚马逊任命彼得・德桑提斯领导新的 AI 组织,专注于 AI 模型、硅片开发和量子计算。

2️⃣ 德桑提斯在亚马逊拥有27年的丰富经验,其中8年在 AWS 担任高级副总裁。

3️⃣ 亚马逊正加大在 AI 领域的投资,包括计划在 AI 基础设施上投资500亿美元及与 OpenAI 和 Anthropic 的合作。


via AI新闻资讯 (author: AI Base)
英伟达推出 Nemotron 3:混合架构提升 AI 代理处理效率

英伟达近日发布了其全新的 Nemotron 3 系列,这一系列产品结合了 Mamba 和 Transformer 两种架构,旨在高效处理长时间上下文窗口,同时减少资源消耗。Nemotron 3 系列专为基于代理的人工智能系统设计,这类系统能够自主执行复杂任务,持续进行长时间的交互。

新产品系列包括三个型号:Nano、Super 和 Ultra。当前 Nano 型号已正式上市,而 Super 和 Ultra 预计将在 2026 年上半年推出。英伟达在这次发布中打破了传统的纯 Transformer 架构,采用了一种混合架构,这种架构将高效的 Mamba 层与 Transformer 元素及混合专家(MoE)技术相结合。与传统的纯 Transformer 模型相比,Nemotron 3 能更好地处理长输入序列,同时保持内存使用稳定。

Nemotron 3 支持高达一百万个令牌的上下文窗口,这使其与 OpenAI 和 Google 等前沿模型相匹配,可以在不对硬件造成过大压力的情况下,存储大量的信息,比如整个代码库或长时间的对话历史。Nano 型号具有 316 亿个参数,但在每个处理步骤中,只有 30 亿个参数处于激活状态。根据人工智能分析指数(AII)的基准测试,Nemotron 3 在准确率上可与 gpt-oss-20B 和 Qwen3-30B 相媲美,并且在令牌吞吐量上表现更为出色。

英伟达还为更强大的 Super 和 Ultra 型号引入了两项重要架构改进。第一项是 LatentMoE,它旨在解决标准 MoE 模型中内存带宽的开销问题,允许系统在处理令牌之前将其投影到压缩的潜在表示中。第二项改进是多词元预测(MTP)技术,在训练过程中可以同时预测多个词元,从而提高文本生成速度和逻辑推理能力。

此外,英伟达发布了 Nano 型号的权重、训练方案和多个数据集,包括基于 Common Crawl 的 Nemotron-CC-v2.1 等,这为开发者提供了强大的支持。此次发布符合英伟达致力于开发更小型语言模型的战略,以优先考虑速度而非原始性能。

划重点:

🌟 Nemotron 3 系列结合 Mamba 和 Transformer 架构,提升 AI 代理处理效率。

🚀 Nano 型号已上市,Super 和 Ultra 预计于 2026 年上半年推出。

📊 英伟达发布模型权重和训练数据集,助力开发者创新。


via AI新闻资讯 (author: AI Base)
xAI重磅发布Grok Voice Agent API:每分钟仅0.05美元,音频推理基准登顶第一!

xAI正式推出Grok Voice Agent API,为开发者开放实时语音交互能力。这一API基于Grok语音技术栈打造,已在移动应用和数百万Tesla车辆中服务海量用户,现向全球开发者全面开放。

极致性价比:每分钟仅0.05美元

Grok Voice Agent API以行业领先的成本效率脱颖而出,采用简单平价计费模式——每分钟连接时间仅0.05美元。这一定价显著低于主流竞品,帮助开发者以最低成本构建高性能语音应用。

音频推理基准排名第一

在权威音频推理基准Big Bench Audio上,Grok Voice Agent API位居第一。该API平均首音频响应时间不到1秒,比最接近的竞争对手快近5倍,展现出卓越的实时响应与推理能力。

核心能力一览

- 实时双向语音通信:支持流式音频输入输出,实现低延迟、自然对话体验。

- 多语言支持:覆盖包括中文在内的数十种语言(官方称超100种),具备原生级发音、口音和方言捕捉能力。

- 自动语言识别与切换:无需配置,即可自动检测用户语言并无缝切换;开发者也可通过系统提示指定响应语言。

- 外部工具调用:轻松集成自定义工具,或接入xAI的实时搜索能力,覆盖网络和X平台数据。

- 实时联网搜索与推理:在对话中即时查询信息并进行复杂推理。

- 情感提示控制语音:通过提示调节语音情感表达,提升交互自然度。

- 多种人声选择:提供多样化声音选项,包括Sal、Rex、Eve、Leo等经典角色,以及Mika、Valentin等伴侣型人格。

- 兼容OpenAI Realtime API规范:无缝迁移现有应用,并支持xAI LiveKit插件,便于快速集成。

未来展望  

xAI表示,该API将持续迭代,未来几周内将推出独立文本到语音(TTS)和语音到文本(STT)端点,以及进一步优化的音频模型,提升发音准确度和延迟表现。

via AI新闻资讯 (author: AI Base)
字节跳动推出 TRAE CN 企业版,助力高效编程

字节跳动正式发布了其 AI 编程工具 TRAE CN 的企业版。这款工具在字节内部已经获得了超过92% 的工程师的使用,显示出其强大的实用性。同时,个人版的注册用户也已经突破了600万。

根据字节内部的实践数据,TRAE 在抖音生活服务团队的 AI 代码贡献率高达43%,这表明其在提升工作效率方面的显著效果。为了满足企业在性能、部署适配、效能追踪及代码安全等方面的需求,TRAE CN 企业版经过了全面优化。

这款新产品能够支持多达10万个文件和1.5亿行代码的容量,具备强大的处理能力。同时,它实现了从知识库到 Agent 的全场景业务适配,方便用户在不同场景下进行高效的代码编写和管理。此外,TRAE CN 企业版还支持实时效能追踪管理,让企业能够随时掌握项目进展和代码执行情况。

在安全性方面,TRAE CN 企业版采用全链路代码加密传输,确保数据的安全性。值得一提的是,它还提供云端零存储的解决方案,保障企业在使用过程中的合规性与安全性。


划重点:

🌟 TRAE CN 企业版正式发布,已有超92% 的字节工程师使用。

📈 支持10万文件和1.5亿行代码,性能优化显著。

🔒 全链路代码加密传输,确保企业数据安全合规。


via AI新闻资讯 (author: AI Base)
xAI 推最快语音代理 API,支持中文实时搜索与情绪控制

AIbase 报道,xAI 正式发布了 Grok 语音代理 API,以每分钟仅 0.05美元的极具竞争力价格,在实时语音 AI 领域掀起了性能与性价比的双重风暴。该模型在音频推理基准测试中高居榜首,凭借不足1秒的首音延迟,实现了比竞品快近5倍的响应速度。

技术上,Grok 语音代理不仅支持包括中文在内的数十种语言自动检测与自由切换,更深度集成了实时网页搜索与推理能力,使其回复能够紧跟全网最新资讯。通过支持外部工具调用、情绪控制及多种语音选项,开发者可以构建出极具表现力且能执行实际任务的 AI 智能体。

值得一提的是,该 API 完全兼容 OpenAI 实时 API 规范,这为追求高性能、低成本方案的开发者提供了无缝迁移的可能,标志着马斯克在实时对话 AI 赛道上正式迈出了挑战行业格局的关键一步。

via AI新闻资讯 (author: AI Base)
马斯克“新战书”:xAI两三年内超越竞争对手

多位知情人士透露,上周在xAI公司旧金山总部举行的全体员工大会上,马斯克扬言,只要公司能够顺利挺过未来两到三年,xAI就能战胜竞争对手。他补充称,该公司快速扩展其算力和数据容量的能力将是在所谓超级智能的竞争中致胜的关键,并最终有望让xAI成为最强大的AI公司。马斯克表示,xAI有可能在未来几年内实现通用人工智能(AGI),甚至最早可能在2026年实现。此外,马斯克还告诉员工,与其他人工智能公司相比,xAI将具有优势,因为它每年可以获得约200亿至300亿美元的资金支持,并且能够受益于他旗下其他公司的协同效应。特斯拉今年早些时候已将Grok集成进其生产的车辆中。

—— 财联社

via 风向旗参考快讯 - Telegram Channel
Gemini3Flash 正式面向 Perplexity Pro 与 Max 用户开放

12月18日,人工智能搜索平台 Perplexity 宣布,其集成的最新大模型 Gemini3Flash 已全面向 Pro 和 Max 订阅用户开放。此次更新标志着 Perplexity 在提升响应速度与推理效率方面迈出关键一步。

Gemini3Flash 是谷歌近期推出的轻量级高性能模型,主打低延迟与高吞吐能力,在保持强大语言理解能力的同时,显著优化了推理成本与响应速度。Perplexity 表示,该模型将为用户提供更快速、流畅的问答体验,尤其适用于需要实时信息整合与多轮交互的复杂查询场景。

据官方介绍,Pro 与 Max 用户无需额外操作,即可在现有界面中直接调用 Gemini3Flash。系统将根据查询类型智能选择最合适的模型,确保在速度与准确性之间取得最佳平衡。此外,该模型对多语言支持和代码理解能力也进行了针对性优化,进一步拓展了 Perplexity 在专业领域的应用边界。

此次集成是 Perplexity 与谷歌深度合作的又一成果。随着 Gemini3Flash 的上线,Perplexity 有望在竞争激烈的 AI 搜索赛道中强化其技术优势,为高阶用户提供更高效、精准的信息服务。未来,该模型或将进一步下放至免费用户层级,扩大技术普惠范围。

via AI新闻资讯 (author: AI Base)
微软开源 TRELLIS.2:一键将图片转为高精度 3D 模型

近日,微软正式开源了其最新的图像到3D 模型生成工具 ——TRELLIS.2。该工具在生成高质量、带材质的3D 模型方面表现出色,仅需输入一张图片,便可迅速生成可供 Blender、Unity、Unreal 等平台使用的.glb 格式三角形网格文件。

TRELLIS.2使用了一种名为4B 的模型,能够处理分辨率在512³ 到1536³ 之间的图像。在 NVIDIA H100显卡的支持下,生成512³ 分辨率的3D 模型仅需约3秒,1024³ 分辨率的模型则需约17秒,而生成1536³ 分辨率的模型则约需1分钟。这一速度使得用户能够在极短的时间内获得高精度的3D 模型,极大地提升了工作效率。

TRELLIS.2不仅能生成3D 模型,还附带了 PBR 四件套贴图,包括颜色、粗糙度、金属度和透明度,这些特性对于电商场景尤为重要。商家只需拍摄产品图片,上传至 TRELLIS.2,即可在1分钟内获得适合上架的3D 模型,大幅简化了电商产品展示的流程。

TRELLIS.2的发布标志着图像生成3D 技术的进一步发展,吸引了众多开发者和企业的关注。通过这一工具,用户能够轻松制作出高质量的3D 内容,无论是在游戏开发、虚拟现实还是电子商务领域,都具备广泛的应用潜力。

HF:https://huggingface.co/microsoft/TRELLIS.2-4B

github:https://github.com/microsoft/TRELLIS.2

划重点:

🌟 TRELLIS.2是一款微软开源的图像到3D 模型生成工具,能迅速生成高质量3D 模型。

⏱️ 该工具在 NVIDIA H100显卡上生成512³ 分辨率模型仅需3秒,效率极高。

🛒 附带 PBR 四件套贴图,方便电商用户快速将产品转为3D 展示。


via AI新闻资讯 (author: AI Base)
火山引擎发布 AI 节省计划,豆包大模型最高降价47%

在12月18日举办的火山引擎 FORCE 原动力大会上,火山引擎总裁谭待发布了多项重磅更新,旨在通过视觉模型进化、生态整合及极具竞争力的定价策略,加速 AI 在企业端的规模化普惠。

在多模态领域,豆包视觉模型迎来双重迭代。图像创作模型 Seedream4.5 能力显著增强,已支持多图组合、创意写真、虚拟试穿及海报设计等多种商业化功能。与此同时,全新视频生成模型 Seedance1.5Pro 正式亮相,该版本实现了音画高精同步与多人多语言对白,具备影视级镜头叙事能力,并引入 Draft 样片功能,让开发者能以极低成本快速验证创意一致性。

生态应用方面,豆包助手 API 正式登陆火山方舟大模型服务平台。首批上线的“日常沟通”与“联网搜索”等能力,赋予了企业级应用更强的实时信息获取与拟人化交互体验。为了进一步降低模型使用门槛,火山引擎同步推出 “AI 节省计划”

该计划覆盖所有按量后付费的大模型产品,采用阶梯式折扣模式,承诺用量越多单价越低,最高可为企业节省 47% 的使用成本。通过软硬件协同优化与商业模式创新,火山引擎正致力于让大模型真正成为人人用得起、用得好的生产力基座。

via AI新闻资讯 (author: AI Base)
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]