https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
火山引擎谭待:2026年大模型市场将迎十倍增长,AI竞争不是零和博弈而是共同做大蛋糕

在AI从技术演示迈向产业落地的关键拐点,火山引擎总裁谭待在2025 FORCE原动力大会上作出大胆预测: 2026 年大模型市场规模有望实现十倍增长,而企业间的竞争不应是“你死我活”的零和博弈,而应聚焦于共同扩大市场、加速行业AI化。

“明年,竞争的核心不再是争夺现有份额,而是如何一起把蛋糕做大,”谭待强调。他认为, 2025 年AI已进入规模化应用爆发前夜,而衡量这一进程的核心指标是 Tokens调用量——“模型的价值,只有在真实调用中才能被验证和释放。”

针对近期火热的AI手机等终端,谭待保持理性:“行业仍处早期阶段。对用户而言,载体是Agent还是APP并不重要,关键是能否更便利、更低成本地满足需求。”他指出,当前生活中仍有海量需求未被高效解决,AI的真正价值在于提升这些需求的解决效率,而非堆砌技术概念。

谭待将 2025 年定义为“智能体(Agent)”,并预测 2026 年将迎来全面爆发。目前,智能体已在办公自动化、短剧生成、视频创作等场景落地,明年功能将更强大,应用将更深入。尤其在企业端,智能体正经历两大关键跨越:

- 广度跨越:企业平均部署的智能体数量从 2024 年的几十个,跃升至 2025 年的上百个,头部企业甚至突破千个;

- 深度跨越:从最初的轻量级试点,逐步渗透至ToB严肃生产环境,甚至进入科研、工程等高专业门槛领域,真正释放业务价值。

作为字节跳动旗下智能科技品牌,火山引擎正以豆包大模型为引擎,推动AI从“可用”走向“好用、常用”。谭待的判断,既是对行业趋势的洞察,也传递出明确信号:在AI普及的下一阶段,生态协同、场景深耕与价值共创,将取代单纯的技术军备竞赛,成为决定胜负的关键。

当十倍市场增长的浪潮涌来,真正的赢家,或许不是跑得最快的那个,而是最懂得与伙伴一起造船、共同出海的人。

via AI新闻资讯 (author: AI Base)
🤖 Anthropic 测试 Claude “任务模式”:强化 AI 智能体自动化与多步执行能力

Anthropic 近期对其 AI 模型 Claude 开启了“任务模式”(Tasks Mode)的内部测试,旨在将其打造为涵盖知识协作与代码自动化的全能智能体。该模式采用双面板布局,支持模型生成分步执行计划并实时追踪多步任务进度。用户可在任务流中进行干预,调整模型使用的上下文或技能,且生成的代码、文章等“制品”(Artifacts)将实现集中管理。该功能预计最快于 2025 年 12 月内正式发布。

(科技圈)

via 茶馆 - Telegram Channel
蓝色光标官宣深度接入豆包大模型,全面融合大语言与视频生成能力

蓝色光标近日在投资者互动平台正式确认,已与字节跳动旗下豆包大模型家族展开深度合作,覆盖大语言模型(LLM)两大核心能力。此举标志着国内头部营销科技公司正加速拥抱国产大模型技术,推动AI在内容创作、品牌传播与营销自动化等场景的规模化落地。

通过此次合作,蓝色光标将把豆包大模型的文本生成、多轮对话、逻辑推理等能力,与Seedance视频生成模型的视觉创造力深度融合,打造覆盖“文案—脚本—视频—投放”全链路的智能营销引擎。这意味着从广告文案撰写、社交媒体内容生成,到短视频自动剪辑与动态优化,均可由AI高效协同完成。

作为中国营销传播领域的领军企业,蓝色光标的此次技术整合,不仅是对豆包大模型能力的认可,更释放出明确信号:国产大模型已从技术验证阶段迈入商业应用深水区。在AI重构内容生产范式的浪潮下,营销行业正成为大模型落地最活跃的前沿阵地之一。

随着豆包大模型日均Token使用量突破50万亿、视频模型Seedance持续迭代,蓝色光标有望借助其高性价比、低延迟、强中文理解等优势,进一步提升服务效率与创意产能,为客户构建更具竞争力的AI驱动营销解决方案。

via AI新闻资讯 (author: AI Base)
Mistral AI 发布新版文档识别技术 Mistral OCR 3 模型

Mistral AI 最近发布了其最新版本的文档识别技术 ——Mistral OCR3,标志着文档处理领域的重大进步。该技术在处理各类文档时展现了卓越的准确性和高效性,特别是在表格、扫描文档、复杂表格以及手写识别方面,相较于其前一版本 Mistral OCR2,整体表现提升了74%。

Mistral OCR3的设计宗旨在于从多种类型的文档中提取文本和嵌入式图像,以实现极高的准确度和出色的性能。它不仅支持 Markdown 输出,还能够基于 HTML 重构表格,帮助下游系统更好地理解文档的内容和结构。与市面上许多同类产品相比,Mistral OCR3体积小巧且价格合理,每1000页的处理费用仅为2美元,通过批量 API 更能享受50% 的折扣,最终价格低至每1000页仅1美元。

为了确保产品的准确性,Mistral OCR3引入了更具挑战性的内部基准,专注于真实业务场景中的表现。与前几代 OCR 模型相比,该技术在处理手写识别、表单、扫描及复杂文档等方面进行了显著升级,适应了多种文档类型的需求。

Mistral OCR3特别适合高容量企业级流程以及交互式文档工作流程。开发者可以通过该技术将文本和图像提取为 Markdown 格式,自动解析发票、合规表格等各类文档,并实现手写或历史文件的数字化处理。目前,早期客户已经在发票处理、公司档案数字化以及技术报告文本提取等方面取得了积极成果。

IDC 的研究总监蒂姆・劳指出,OCR 技术是实现生成式人工智能和智能体人工智能的重要基础。能够高效提取高保真度文本和嵌入式图像的组织,将有机会释放数据价值,从而在竞争中获得优势。

划重点:

📄 Mistral OCR3的整体准确性比前一版本提升74%,尤其在复杂文档处理方面表现卓越。

💰 该技术价格合理,每1000页处理费用仅为2美元,通过批量 API 可降至1美元。

🖥️ Mistral OCR3适用于多种业务场景,包括发票处理、文档解析及历史文件数字化。


via AI新闻资讯 (author: AI Base)
罗永浩宣布 2025 科技创新大会将发布细红线 AI 软件

罗永浩近日在微博上透露,2025 年度科技创新分享大会的门票将于 12 月 22 日中午 12:00 在大麦 App 上正式发售。此次活动定于 12 月 30 日在上海市徐汇区的西岸国际会展中心举行。罗永浩强调,本次售票将采用实名制,购买的门票不得转让。入场时,工作人员将核对购票信息和身份信息,观众需要携带购票时所用的身份证明。

罗永浩在活动中将介绍一些尚未广泛为公众所知的中国创新科技产品。他特别提到,本次大会的重点是发布由细红线科技开发的 AI 软件,而并非以销售产品为目的的 “带货直播”。他还提醒潜在购票者,如果不确定自己能否参加,建议谨慎购买,以便让有时间的人可以获得这次宝贵的机会。

这一科技创新分享大会不仅是一个展示平台,也被视为罗永浩在科技领域的再一次尝试。近年来,他的创业经历备受关注,尤其是细红线科技在 AI 方向的进展。此次大会或将为观众带来不少意想不到的科技亮点,期待着能在现场看到更多新鲜的科技产品。

via AI新闻资讯 (author: AI Base)
联想携手字节跳动推进 AI 手机合作,内部揭示更多业务动态

最近,联想与字节跳动的合作引发了广泛关注。根据媒体报道,字节跳动正在加快与包括 vivo、联想、传音等在内的硬件厂商进行 AI 手机的合作,目的是在这些设备上预装 AIGC 插件,从而提升用户的使用体验和获取入口。这一举措旨在改变 AI 在实际应用中的被动局面,进而拓展市场。

据了解,联想集团与字节跳动的豆包和火山引擎等业务保持着紧密的合作关系。联想内部人士透露,双方在智能终端领域的沟通一直非常密切,双方希望借助各自的优势,进一步推动 AI 技术的落地和应用。

这一合作不仅是技术上的结合,更是市场战略上的深度融合。字节跳动通过与硬件厂商的合作,能够将其先进的 AI 技术直接应用于消费者的日常设备中,从而提高用户的使用满意度。同时,联想作为硬件制造商,也希望借助字节跳动的技术实力,增强其产品的市场竞争力。

随着科技的迅速发展,AI 手机的概念逐渐从理论走向实际应用。此类合作有望为用户带来更智能化的手机体验,提升日常生活的便利性。业内专家认为,这一趋势可能会引领未来手机市场的发展方向。

🌟 联想与字节跳动合作推进 AI 手机,预装 AIGC 插件。

🤝 双方在智能终端领域保持密切沟通,推动技术落地。

📈 此次合作有望提升用户体验,引领手机市场新趋势。


via AI新闻资讯 (author: AI Base)
谷歌Gemini可检查视频是否是自家AI生成

谷歌将Gemini的人工智能验证功能扩展到了由该公司自家人工智能模型制作或编辑的视频。用户现在可要求Gemini通过询问“这是用谷歌人工智能生成的吗?”来判断上传的视频是否由人工智能生成。Gemini将扫描视频的画面与音频,以检测谷歌名为SynthID的专有水印。谷歌表示,回应将不限于“是”或“否”,Gemini会指出水印在视频或音频中出现的具体时间点。该公司于十一月为图像推出了此功能,该功能同样仅限于由谷歌人工智能制作或编辑的图像。Gemini可验证大小不超过100MB、时长不超过90秒的视频。该功能在Gemini提供的所有语言和地区均可使用。

—— Theverge

via 风向旗参考快讯 - Telegram Channel
📝 “汉语盘点 2025”揭晓:“韧”与“深度求索”当选年度国内字词

12月19日,由国家语言资源监测与研究中心、商务印书馆及新华网联合主办的“汉语盘点 2025”揭晓仪式在北京举行。经网友推荐、语料库大数据提取及专家评议,“韧”正式当选为年度国内字,“深度求索(DeepSeek)”当选为年度国内词。

今年是该活动连续举办的第 20 周年,旨在通过语言记录生活并描述中国视野下的社会变迁。主办方表示,评选结果反映了过去一年的社会脉动,未来将继续以汉语为媒,推动文化传承与文明互鉴,为社会发展注入语言力量。

(科技圈)

via 茶馆 - Telegram Channel
国内首个国标 VLA 大模型开源!北京人形 XR-1让机器人真正“会干活”

国内具身智能领域在12月18日迎来重大突破:北京人形机器人创新中心宣布正式开源具身 VLA 大模型 XR-1。这是国内首个、也是目前唯一通过具身智能国家标准测试的视觉-语言-动作(VLA)大模型,标志着我国人形机器人从“实验室行走”向“真实场景干活”迈出了关键一步。

此次开源不仅包含 XR-1大模型,还配套发布了强大的数据底座 RoboMIND2.0 以及高保真数字资产数据集 ArtVIP 最新版。XR-1作为具身智能的“小脑”,具备跨本体运行能力,能够在天工2.0、UR、Franka 等多种机器人平台上实现通用操作知识的无缝迁移。依托超百万量级的自有多本体数据,XR-1在物体颜色、位置、背景干扰等七大泛化维度测试中表现出色,能够精准执行取放、推拉、旋转等复杂双臂技能。

北京人形机器人创新中心目前已构建了完整的“大脑+小脑+本体”生态:

● 物理本体: 依托“具身天工”平台,已发布天工2.0、天轶2.0等多类型本体;
● 具身大脑: 依托“慧思开物”平台,此前已开源 WoW(我悟)世界模型和 **Pelican-VL(天鹕)**大模型,负责高层逻辑推理与任务拆解;
● 具身小脑: 本次开源的 XR-1 则负责将大脑的指令转化为精确的物理动作,实现软硬件的高效协同。

AIbase 分析认为,通过将核心模型与高价值数据集全面开源,北京人形旨在降低行业开发门槛,解决具身智能数据难复用、泛化性差的共性难题,推动国内机器人产业进入“全自主、更好用”的大规模应用新阶段。

via AI新闻资讯 (author: AI Base)
Claude AI 新 “任务模式” 上线:智能助手全新进化,能提问会执行!

近日,科技媒体 TestingCatalog 报道,Anthropic 旗下的 AI 助手 Claude 正在进行一项名为 “任务模式”(Tasks Mode)的新功能测试。此项功能旨在将 Claude 打造成一款全能型智能体,能够在各类复杂任务中提供高效支持。

在最新的内部测试版本中,Claude 引入了一个直观的双面板布局。右侧面板用于展示用户上传的文件或 AI 生成的上下文信息,而左侧的进度区则动态呈现多步任务的执行流程。这种设计不仅让用户可以清晰地看到任务进展,还能更好地理解后台的复杂逻辑。

与传统 AI 不同,Claude 在处理复杂需求时,会先生成一份结构化的 “行动计划”(Action Plan)。如果用户的指令不够明确,Claude 会主动提出 “澄清性提问”(Clarifying Questions),确保任务的准确执行。如果用户在规定时间内没有回复,Claude 也会智能地跳过这一环节,继续执行后续任务。

这一新模式的灵活性使得用户可以随时介入,修改行动计划或添加新的上下文信息,以确保最终结果符合预期。在执行过程中,Claude 能够实时调整,体现出更高的适应性。

为了增强自动化能力,Claude 任务模式还集成了多种 “技能”(Skills)和 “模型上下文协议”(MCPs)。根据任务目标,系统会自动调用必要的工具或进行代码生成、网络搜索等操作。无论是代码片段、文章,还是 Web 应用,所有生成的成果都会自动归档到专用的 “工件”(Artifact)标签页中,方便用户随时预览和审查,形成一套完整的工作流。

业内专家普遍认为,此次更新旨在吸引 Google NotebookLM 的用户。尽管两者都采用了面板化的上下文管理方式,但 Claude 显然在 “深度任务规划” 和 “多工件输出” 方面更具优势。尽管官方尚未确认最终发布日期,但考虑到目前功能的成熟度,该模式预计将在本月内向公众开放。

via AI新闻资讯 (author: AI Base)
豆包上线 Seedance 1.5 Pro,可直接生成有声视频

字节跳动新一代音视频创作模型 “Seedance1.5Pro” 正式登陆豆包,为普通用户打开了 “零门槛做有声视频” 的新体验。

这次上线的 Seedance1.5Pro,核心是把 “文字 - 画面 - 声音” 的创作链路做了一体化升级:

语义 + 音画同步:不再是先出画面再配声音,模型能深度理解文本意图,同步生成匹配内容的画面与音效、台词,避免 “音画脱节”;
更自然的 “开口说话”:生成的人物台词不再是机械合成音,语气、节奏更贴近真人表达;
电影感叙事 + 动态镜头:画面会自带景别切换、运镜效果,复杂动作(比如人物的肢体互动)也能被精准捕捉,不用再手动调特效。

普通用户的操作也很简单:打开豆包 App 对话框,点击 “照片动起来” 功能,选择 “1.5Pro” 模型,上传一张参考图(比如自己的生活照、手绘草稿),再输入提示词(比如 “让这只猫用温柔的语气讲睡前故事,背景是星空卧室”),就能直接生成一条完整的有声视频。从 “生成图文” 到 “生成有声视频”,Seedance1.5Pro 让豆包的创作能力又往前迈了一步 —— 现在不管是做剧情短片、产品解说,还是把静态素材变成动态内容,都能在对话框里一站式完成,真正实现 “让画面有声,让创作发生”。

via AI新闻资讯 (author: AI Base)
微信元宝 AI 助手增加新功能,轻松一句话设置提醒

近日,微信的元宝 AI 助手宣布了新功能,用户现在可以通过一句话在微信中设置提醒。只需向元宝发送包含事项及时间的消息,元宝就能自动识别任务内容,并在指定时间通过微信服务通知提醒用户。这一功能的推出,让设置提醒变得如同与朋友聊天一样简单。

元宝具备精准识别时间任务的能力,用户只需简单输入,比如 “提醒我下周一早上交周报” 或 “提醒我明早八点抢假期的票”,元宝就会在规定的时间通过微信发送通知,适合日常的日程安排和工作待办事项。尤其对于父母等长辈用户,子女还可以教他们发送语音消息,元宝同样能够识别并设置诸如吃药提醒等日常事务,大大降低了使用门槛。

据了解,元宝于今年四月正式上线,用户可以在微信搜索 “元宝” 添加为好友后与其进行对话。与元宝进行交流时,用户不需要下载其他应用或小程序,它以好友的形式存在于通讯录中,聊天时还会显示 “对方正在输入...” 的提示,增加了互动的真实感。

除了提醒功能,元宝 AI 助手还具备一键解析公众号文章、图片及文档内容的能力,用户可以进行智能解读与互动。此外,元宝还拥有图文识别、表格解析、物体与场景识别以及证件照自动打码等多项实用功能,进一步提升了用户的使用体验。

划重点:

📅 元宝 AI 助手支持用户通过一句话轻松设置提醒,提升了日程管理的便捷性。

🗣️ 用户可以通过语音消息与元宝互动,方便长辈用户使用。

📱 元宝不仅限于提醒功能,还提供文章解析、图文识别等多种实用功能。


via AI新闻资讯 (author: AI Base)
被无数人看衰的Manus,8个月狂飙1亿美元ARR!创全球最快纪录,AI代理时代彻底引爆

新加坡总部AI代理初创公司Manus正式宣布,其年度经常性收入(ARR)已突破1亿美元大关。这一成就仅用时8个月(自3月产品正式上线以来),成为全球史上从0到1亿美元ARR最快的初创企业。公司整体收入年化运行率已超过1.25亿美元,标志着通用AI代理正从概念迅速转向大规模商业化落地。

 惊人增长数据:8个月缔造AI传奇

Manus在官方博客中披露关键指标:

- ARR突破1亿美元:采用最严格的订阅收入口径计算;

- 月复合增长率超20%:自Manus1.5版本10月发布以来,增长势头持续加速;

- 累计处理147万亿tokens:体现了海量用户对复杂任务的真实需求;

- 创建超过8000万虚拟计算机实例:支持用户自主执行研究、开发、自动化等高强度任务。

这些数据不仅刷新了AI初创企业的增长纪录,也证明了“AI代理”作为独立品类的强劲商业潜力。

 产品核心:不止会“想”,更会“干”

Manus被誉为全球首个真正意义上的通用AI代理,能够基于自然语言指令自主完成多步骤复杂任务,如简历筛选、旅行行程规划、股票分析、代码调试甚至全栈应用开发。其核心优势在于深度浏览器控制、并行子代理执行以及第三方工具集成,远超传统聊天式AI的局限。

自今年3月推出以来,Manus迅速俘获全球用户,尤其在巴西、美国、日本和中东市场表现突出。公司强调,所有增长均源于用户对“行动型AI”的真实付费意愿。

 团队与融资:精干高效,资本加持

Manus当前团队规模仅105人,分布于新加坡、東京、旧金山等地,并计划在巴黎开设新办公室。公司此前完成由知名风投Benchmark领投的7500万美元融资,估值一度飙升至近5亿美元。这笔资金主要用于全球扩张和技术迭代。

 AIbase点评

在AI代理赛道竞争白热化的2025年,Manus的爆发无疑是最大黑马。它用硬核数据回击了早期外界质疑,证明“行动胜于空想”——AI不再只是对话工具,而是能真正创造价值的生产力引擎。这一里程碑不仅提振了全球AI创业信心,也预示着代理式AI将重塑无数行业 workflow。

未来,Manus将继续加速产品迭代,推动AI从“助手”向“执行者”的全面转型。AI代理的黄金时代,已正式开启。

via AI新闻资讯 (author: AI Base)
OpenAI等AI企业将开始预测用户是否未成年

OpenAI与Anthropic正在推出检测未成年用户的新方法。随着OpenAI更新了关于ChatGPT应如何与13至17岁用户互动的指导方针,同时,Anthropic正在开发一种新方法,以识别并踢出18岁以下的用户。周四,OpenAI宣布ChatGPT的 “模型规范” 将为18岁以下用户纳入四项新原则。现在,其目标是让ChatGPT将青少年安全放在首位,即使这可能与其他目标相冲突。Anthropic不允许18岁以下用户与Claude对话,其正在推出相关措施,用以检测并停用未成年用户的账户。该公司正在开发一个新系统,能够检测出用户可能未成年的细微对话迹象,并表示已会对在聊天中自称未成年人的用户进行标记。

—— Theverge

via 风向旗参考快讯 - Telegram Channel
Google 发布 2025 年度研究报告,披露 AI 与量子计算重大突破

Google Research 于 12 月 18 日发布 2025 年度总结,披露其在 AI 模型、量子计算及科学发现领域的关键进展。报告显示,Gemini 3 已实现生成式 UI 交互;量子芯片 Willow 运行速度较传统超算提升 1.3 万倍。此外,Google 推出 AI co-scientist 系统助力药物研发,并利用 FireSat 卫星强化气候监测。公司拟于 2026 年在新加坡设立全新研究中心,持续推动 AI 赋能科研与社会治理。

Google Research

🍀在花频道 🍵茶馆 📮投稿新鲜事

via 科技圈🎗在花频道📮 - Telegram Channel
🚀 Google 发布 2025 年度研究报告:AI 与量子计算实现跨越式突破

Google Research 于 12 月 18 日发布了 2025 年度总结报告,展示了其在人工智能、量子计算及科学应用领域的重大技术进展:

* AI 模型进化:新一代模型 Gemini 3 已实现生成式 UI 交互,标志着人机交互方式的进一步升级。
* 量子计算飞跃:新型量子芯片 Willow 正式亮相,其运行速度较传统超级计算机大幅提升了 1.3 万倍。
* 科研与医疗赋能:推出 AI co-scientist 系统以加速药物研发进程;同时利用 FireSat 卫星系统强化全球气候监测能力。
* 全球战略布局:Google 计划于 2026 年在新加坡设立全新的研究中心,旨在持续推动 AI 在科研与社会治理领域的深度应用。

(科技圈)

via 茶馆 - Telegram Channel
火狐浏览器祭出 AI“终极开关”:允许用户一键彻底关停所有 AI 功能

在 Mozilla 新任 CEO 宣布将 Firefox 打造为“现代 AI 浏览器”后,由于担心隐私泄露和浏览器臃肿,大量忠实用户表达了强烈不满。针对社区的质疑,Firefox 开发者 Jake Archibald 近期公开回应,明确表示 Firefox 将推出一个名为“终止开关(Kill Switch)”的功能,旨在通过赋予用户绝对的控制权来重新赢回信任。

据 AIbase 报道,这个“终止开关”并非简单的隐藏选项,而是一个全局性的设置。一旦用户选择开启该开关,浏览器内的所有 AI 相关元素都将被彻底移除。开发者承诺,这些功能在关闭后不会在后续更新中“自动复活”,除非用户手动重新开启。这一设计直接回应了用户对 AI 功能强行植入的恐惧。

此外,Firefox 明确了 AI 功能的集成原则:所有 AI 模块都将采用“主动选择加入(Opt-in)”模式,而非默认开启。这意味着用户在安装或升级浏览器后,AI 功能默认是禁用的,只有在用户明确同意后才会激活。开发者坦言,虽然目前社区仍存在不信任的情绪,但团队希望通过这种“透明且彻底”的方案,证明 Firefox 依然坚守用户至上的原则。

尽管推出了“总开关”机制,但部分技术社区成员仍持有保留意见。他们担心 AI 项目的开发会占用原本属于性能优化和兼容性改进的资源。目前,Mozilla 官方尚未发布更详细的 AI 商业逻辑说明,但“终止开关”的出现,无疑为正处于争议中的 Firefox 争取到了与用户对话的空间。

via AI新闻资讯 (author: AI Base)
QQ音乐推本地化AI作曲:酷睿Ultra加持,几分钟生成完整歌曲,创作隐私不外泄

AI音乐创作正从云端走向每个人的桌面。QQ音乐近日上线“AI作歌”功能,依托搭载酷睿Ultra处理器的AI PC,首次实现完全本地化的大模型音乐生成——用户无需联网,仅靠设备自身算力,几分钟内即可创作一首结构完整、风格鲜明的原创歌曲,如近期走红的AI作品《大东北》便诞生于此。

操作流程极简:用户在QQ音乐界面点击“AI作歌”,输入关键词灵感(如“雪乡”“热炕头”),选择“流行”等曲风,点击“AI快速创作”,系统便自动生成包含引子、主歌、副歌的完整作品。无论是专业音乐人试旋律,还是普通用户记录生活感悟,创作门槛被前所未有地拉低。

与依赖云端API的竞品不同,QQ音乐此番选择本地推理路径,所有AI计算均在用户设备端完成。这不仅大幅缩短生成等待时间,更从根本上保障了创作隐私——灵感、歌词、旋律等敏感数据无需上传服务器,杜绝泄露风险。

这一能力的实现,核心在于酷睿Ultra处理器内置的专用NPU(神经网络处理单元)。该硬件单元专为AI负载优化,可在低功耗下高效运行大模型推理任务。即便在笔记本电脑上,用户也能流畅完成音乐生成、视频剪辑、图像处理等创意工作,同时延长电池续航。

此举标志着AI PC正从“性能升级”迈向“角色转变”——它不再是被动执行指令的工具,而是理解用户意图、主动辅助创作的智能创意伙伴。随着本地大模型生态的成熟,未来个人设备或将承载更多高价值、高隐私的生成式AI场景。

当一首歌的诞生只需一杯咖啡的时间,且完全属于你自己,音乐创作的民主化时代,或许才真正到来。而QQ音乐与酷睿Ultra的这次联手,正为亿万用户打开那扇门。

via AI新闻资讯 (author: AI Base)
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]