https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
Elevated error rates on Opus 4.5

Jan 14, 08:34 UTC
Investigating - We are currently investigating this issue.

via Claude Status - Incident History
消息称OpenAI 秘密开发代号 “Sweetpea” 硬件对标 AirPods

消息称,人工智能巨头 OpenAI 正在加速布局硬件领域。据供应链知情人士爆料,OpenAI 首席执行官奥尔特曼(Sam Altman)正与前苹果首席设计官 Jony Ive 联手,秘密研发一款旨在挑战苹果 AirPods 地位的全新 AI 音频设备。

据爆料者“智慧皮卡丘”透露,该项目的内部代号为 “Sweetpea”。在产品形态上,这款设备展现了极具颠覆性的设计逻辑,其主体采用金属材质,外形酷似圆润的鹅卵石。不同于传统的入耳式耳机,Sweetpea 内部包含两个胶囊状的组件,用户可以将其取出并佩戴在耳后。这种“前所未见”的独特工业设计,被认为是 Jony Ive 离开苹果后在 AI 硬件上的重要尝试。

在性能配置方面,该设备预计将搭载最前沿的2纳米工艺智能手机级芯片,三星的 Exynos 芯片目前被视为首选,同时 OpenAI 可能还同步开发了定制化芯片。由于大量采用了与高端智能手机性能对标的材料与核心组件,该产品的制造价格预计将维持在较高水平。

目前,代工厂富士康已被要求为该系列产品的生产做准备。根据规划,OpenAI 计划在2028年第四季度前推出包括耳机和触控笔在内的共五款硬件产品,而 “Sweetpea” 耳机则是优先级最高的首发项目。预计该产品最早将于今年9月正式发布,第一年的目标产量设定在4000万至5000万台之间。市场预期,这款设备将具备通话、音频播放以及跨应用控制功能,甚至有望实现脱离手机的独立运行。

划重点:

🎧 跨界联手: OpenAI CEO 奥尔特曼联合前苹果设计大师 Jony Ive,共同打造代号为 “Sweetpea” 的新型 AI 音频设备,目标直指 AirPods。
💎 独特设计: 设备主体采用金属鹅卵石造型,内置两个可佩戴在耳后的胶囊状组件,硬件形态与传统耳机有显著区别。
🚀 顶级配置: 预计采用2纳米制程芯片,首年产量目标高达5000万台,并可能具备独立于手机运行的高级 AI 功能。

via AI新闻资讯 (author: AI Base)
特斯拉2月14日起停售FSD买断版,全面转向订阅制模式

特斯拉CEO马斯克在社交媒体平台X宣布,特斯拉将于2月14日后停止销售FSD(全自动驾驶)功能的买断版本,此后该功能将仅以月度订阅形式提供。这标志着特斯拉在商业模式上的重大转变。

FSD功能自2016年推出以来已历经多次迭代升级,从最初的Autopilot辅助驾驶逐步演进为更高级的智能驾驶系统。2025年2月,特斯拉在中国市场开始分批推送FSD智能辅助驾驶功能,软件版本为2024.45.32.12。需要强调的是,该功能仍属于L2级辅助驾驶,需要驾驶员持续监督。

马斯克对FSD的推广一直持积极态度。去年6月,他曾公开呼吁欧洲监管机构尽快批准FSD技术落地,称延迟审批"令人非常沮丧"甚至"危及人们的安全"。在此前的财报电话会议上,马斯克表示特斯拉只有在需求量非常大的情况下才会考虑FSD授权,并强调FSD的安全水准必须远高于普通人类驾驶员。

从买断制转向订阅制,可能帮助特斯拉建立更稳定的经常性收入来源,同时降低用户的初始购买门槛。不过,这一变化也意味着已购买FSD买断版的车主将成为"最后一批"永久拥有该功能的用户,新用户则需要持续支付订阅费用才能使用FSD功能。

via AI新闻资讯 (author: AI Base)
🎥 Google 发布 Veo 3.1 视频生成工具,支持 4K 分辨率与竖屏格式

Google 宣布推出 Veo 3.1 升级版,该工具支持基于参考图像生成视频内容。新版本显著提升了角色身份、背景及物体的连贯性,即使使用简单提示词也能生成更具表现力的视频。此次更新首次支持原生 9:16 竖屏格式输出,并新增最高 4K 分辨率的升级功能,以满足移动端短视频创作及高端大屏播放的需求。目前,Veo 3.1 已在 Gemini 应用、YouTube、Flow、Google Vids、Gemini API 和 Vertex AI 同步上线。

(科技圈)

via 茶馆 - Telegram Channel
Google 发布 Veo 3.1 视频生成工具升级版,支持 4K 分辨率和竖屏格式

Google 宣布推出 Veo 3.1 Ingredients to Video 升级版,该工具可基于参考图像生成视频内容。新版本在保持角色身份一致性、背景和物体连贯性方面显著改进,即使使用简单提示词也能生成更具表现力和创意的视频。

此次更新首次支持原生 9:16 竖屏格式输出,专为移动端短视频创作优化。同时新增最高 4K 分辨率的升级功能,1080p 版本提供更清晰的编辑效果,4K 版本则适用于高端制作和大屏幕播放。这些功能已在 Gemini 应用、YouTube、Flow、Google Vids、Gemini API 和 Vertex AI 中上线。

Google

🍀在花频道 🍵茶馆聊天 📮投稿

via 科技圈🎗在花频道📮 - Telegram Channel
谷歌加码医疗AI开源生态:MedGemma 1.5强化医学影像能力,同步推出语音转写模型MedASR

近日,公司正式发布新一代开源医疗大模型 MedGemma 1.5,并在同期推出专为临床场景设计的开源语音识别模型 MedASR,进一步完善其在医疗垂直领域的技术栈。

作为Gemma系列的医疗专用版本,MedGemma 1.5 在前代基础上显著增强了对医学影像的理解与分析能力。该模型不仅能处理文本病历、检验报告和医学文献,还可结合X光、CT等常见影像模态的描述性数据,辅助进行初步筛查与诊断推理。这一升级使MedGemma从纯文本问答工具,迈向多模态临床决策支持系统,更贴近真实医疗工作流。

与此同时,MedASR 的推出直击医生文书负担痛点。该模型专为医疗语音场景优化,能高精度识别医患对话、查房记录、手术口述等专业内容,并自动转写为结构化文本,大幅提升电子病历录入效率。谷歌强调,两个模型均基于去标识化的临床数据训练,严格遵循隐私保护规范,并以开源形式发布,供全球研究者与开发者免费使用。

此次双模型发布,标志着谷歌在医疗AI领域从“封闭服务”向“开放赋能”战略的深化。继Gemini医疗助手通过HIPAA合规认证后,开源模型的推出将进一步降低医疗机构、初创公司及学术团队的创新门槛,推动AI在基层医疗、远程诊疗和科研分析等场景的普惠应用。

在AI医疗从“可用”走向“好用”的关键阶段,谷歌正以开源+合规+多模态的组合拳,构建一个兼具安全性、实用性与可扩展性的医疗AI生态底座。

via AI新闻资讯 (author: AI Base)
韩国AI"国家队"陷开源争议,三家入围企业被曝使用中国模型代码

据财联社报道,韩国政府去年6月启动的"自主AI基础模型"竞赛陷入技术路线争议。在入围决赛的五家企业中,已有三家被发现至少部分使用了外国开源AI模型代码,其中中国模型成为主要"效仿"对象。

这场为期三年、旨在打造韩国"AI国家队"的竞赛由科学技术信息通信部主导,Naver Cloud、Upstage、SK Telecom、NC AI和LG AI研究院五家企业入围。竞赛目标是到2027年选出两家本土企业,其AI模型性能需达到OpenAI或谷歌等行业领军者95%以上水平。

争议最早由Upstage引发。竞争对手Sionic AI首席执行官Ko Suk-hyun指出,Upstage的AI模型部分组件与智谱AI开源模型存在相似之处,且代码中仍保留智谱AI版权标记。Upstage随后举行直播验证,承认推理代码使用了智谱AI的开源组件,但强调模型本身是从空白状态自主开发训练的。

随后,Naver被指其视觉和音频编码器与阿里巴巴和OpenAI产品相似;SK Telecom的推理代码则被指与DeepSeek模型代码相似。两家企业均承认使用外部编码器,但强调模型核心引擎完全自主研发。

值得注意的是,竞赛规则本身并未明确禁止使用外国开源代码。哈佛大学教授Gu-Yeon Wei指出,"放弃开源软件就意味着放弃巨大利益",要求所有代码由本国编写并不现实。但部分韩国业界人士担忧,使用外国工具可能带来安全风险,并削弱培育本土AI模型的初衷。

韩国副总理兼科学技术信息通信部长官裵庆勋对争议持开放态度,称"目睹技术论战反而看到了韩国AI的光明前景"。首尔国立大学AI研究院院长Jae W. Lee表示,受质疑企业的模型核心任务似乎并未依赖外国工具。按原计划,韩国政府将本周从五家入围者中淘汰一家。

via AI新闻资讯 (author: AI Base)
编程智能体的新标准!MiniMax 发布 OctoCodingBench 基准测试

在人工智能领域的飞速发展中,编程智能体正逐渐成为开发者的重要助手。近日,AI 大模型公司 MiniMax 宣布推出一项全新的开源基准测试 ——OctoCodingBench,旨在评估编程智能体在代码仓库环境中对指令的遵循能力。这一基准测试的推出,将为智能体的评估和优化提供新的方向。

那么,为什么需要 OctoCodingBench 呢?目前的许多基准测试,例如 SWE-bench,主要关注智能体完成任务的能力,忽略了一个至关重要的方面:智能体在执行任务的过程中是否遵循了规定的规则。实际上,在真实的编程场景中,智能体不仅要生成正确的代码,还必须遵守一系列系统级行为约束、项目编码规范和工具使用协议。这些规则确保了代码的规范性与安全性,避免了在开发过程中的不必要错误。

OctoCodingBench 通过测试智能体对七种不同指令来源的遵循程度,提供了一个多维度的评估框架。这七种指令来源包括系统提示、系统提醒、用户查询、项目级约束、技能、记忆和工具架构。这种全面的评估方式能够更好地反映智能体的实际能力。

值得注意的是,OctoCodingBench 采用二元检查清单的评分机制,对每一项检查进行客观评定。这种方法使得评估结果更为准确,能够有效地区分任务完成率和规则遵循率。此外,OctoCodingBench 还支持多个脚手架环境,如 Claude Code、Kilo 和 Droid,这些都是实际生产环境中使用的工具。

发布的 OctoCodingBench 数据集包含72个精选实例,涵盖自然语言用户查询和系统提示等多种情境,同时还提供了2,422个评估检查项,帮助开发者全面了解智能体的表现。所有测试环境都可以通过公开的 Docker 镜像进行访问,极大地方便了开发者的使用与测试。

通过 OctoCodingBench,MiniMax 不仅为编程智能体的开发和评估设定了新标准,也推动了 AI 在软件开发领域的进一步应用。

地址:https://huggingface.co/datasets/MiniMaxAI/OctoCodingBench

via AI新闻资讯 (author: AI Base)
Vidu 发布 AI 一键生成 MV 功能,打造分钟级“虚拟制片厂”

国内领先的视频大模型 Vidu 今日宣布,其开放平台正式上线“一键生成 MV”功能。这一技术的推出,标志着视频创作从素材拼接迈向了全自动的端到端生成时代。用户现在只需提供背景音乐、参考图像以及简单的文本指令,系统即可在分钟级别内输出画质精美、叙事连贯的高质量 MV。

该功能的核心在于一套深度协同的多智能体(Multi-Agent)系统。在接收到用户指令后,系统内部的多个专用 AI 智能体会立即开启精密协作。首先,导演智能体会对音乐结构和歌词进行深度解析,规划出整体的叙事脉络;随后,分镜脚本智能体会将创意转化为详细的镜头描述,涵盖景别、运镜和时长等专业参数。

在视觉生成阶段,该系统表现出了极高的工业级稳定性。通过“多图参考生视频”技术,创作者最多可上传7张参考图作为视觉锚点,视觉生成智能体据此在长达五分钟的视频中精准维持角色、场景和美学风格的高度统一。最后,剪辑与合成智能体会负责镜头的转场卡点,并自动生成与歌词逐帧同步的动态字幕。

这种“全自动制片”模式无需人工干预,极大地降低了专业视频创作的门槛。对于创作者而言,Vidu 不再仅仅是一个生成工具,而是一个集成化的虚拟制片厂,让复杂的 MV 制作变得像发送指令一样简单。

划重点:

🎬 全自动多智能体协同:系统内置导演、分镜、视觉生成及剪辑四大智能体,实现从解析音乐到成片输出的全流程自动化。
🖼️ 工业级风格一致性:支持最多7张参考图定位,确保在长达5分钟的视频中,角色与场景风格不发生漂移。
🎵 音画同步精准卡点:AI 能自动识别背景音乐节奏并完成转场,同时生成逐帧同步的动态字幕,分钟级即可交片。

via AI新闻资讯 (author: AI Base)
爱诗科技发布全球首个通用实时世界模型 PixVerse R1,最高1080P 画质

继发布全球首个通用实时世界模型 PixVerse R1后,其技术内核与应用场景近日同步亮相 —— 该模型通过三大核心技术的环环相扣,实现 “让虚拟世界活起来” 的实时交互体验,同时在游戏、影视、直播等领域拓展出 “人人可共创” 的新可能。

技术:三大创新筑牢 “实时世界” 基础

PixVerse R1的核心能力,源于三项底层技术的协同突破:

Omni 原生多模态模型作为现实世界的 “计算基座”,它将文本、图像、音频、视频等多模态内容统一为连续 Token 流,可端到端生成物理逻辑一致、最高1080P 画质的数字世界,为多模态交互提供了统一的技术底座。

自回归流式生成机制赋予模型 “持久记忆”,解决了长时序内容的一致性痛点:不仅支持无限时长生成,还能告别画面突变、逻辑断裂的问题,实现叙事的 “流式交互”。

瞬时响应引擎 IRE注入即时反应的 “神经反射”:通过时间轨迹折叠、引导校正、自适应稀疏注意力三大创新,将采样步骤压缩至1-4步,计算效率提升数百倍,直接支撑起 “即时响应” 的核心体验。

应用:多场景解锁 “实时共创” 新体验

基于技术能力,PixVerse R1让 “每个人都是实时世界的创造者”,在三大领域落地新范式:

游戏领域:让游戏世界 “活起来”,打造动态可交互的虚拟环境;
影视领域:让电影 “可以玩起来”,打破单向观看模式,实现互动式内容体验;
直播领域:让直播 “万物可互动”,升级实时参与感与交互深度。

该模型以 “所想即所见,所说即所现” 为核心,推动虚拟世界从 “录好再播” 的回放式形态,转向 “因你而实时演化” 的共创形态,其官方体验地址为 realtime.pixverse.ai。

via AI新闻资讯 (author: AI Base)
Anthropic 的新 AI 编程助手 “Cowork”:一周半就能完成的智能创作

近日,人工智能公司 Anthropic 正式发布了其新款编程助手 “Cowork”,这一工具的开发过程几乎完全依赖于其自家 AI 模型 Claude。在短短一周半的时间内,Cowork 的首个版本就已问世,成为了 AI 编程工具的又一重要里程碑。

根据《商业内幕》的报道,Cowork 的设计旨在为非编程用户提供更加友好的 AI 支持。用户可以轻松授权 Cowork 访问计算机中的特定文件,通过简单的自然语言指令来完成各种任务,极大地降低了编程的门槛。Anthropic 的 Claude Code 项目负责人 Boris Cherny 透露,Cowork 的核心代码几乎全部由 Claude 自动生成,团队成员主要集中在讨论架构和产品方向,而具体的功能实现、漏洞修复和研究工作则是通过多个 Claude 实例并行完成的。

产品经理 Felix Rieseberg 表示,这种创新的开发方式让 Cowork 能够在极短的时间内完成首个版本。特别是在假日季节,用户们开始频繁使用 Claude 进行非编程工作,这也为 Cowork 的诞生提供了契机。不过,他也坦言,目前 Cowork 仍处于 Alpha 阶段,存在一些不完善之处。

目前,Cowork 仅对 Mac 端的 Claude Max 订阅用户开放,发布后迅速吸引了广泛的关注。Datasette 的联合创始人 Simon Willison 指出,Claude Code 的潜在价值尚未完全释放,而 Cowork 提供了一种更实用的切入方式。Reddit 的联合创始人 Alexis Ohanian 则对此表示,这是一个 “重大事件”。

然而,Anthropic 也提醒用户在使用 Cowork 时需要注意潜在风险。由于 Cowork 在获得文件访问权限后,可能执行删除本地文件等具有破坏性的操作,因此用户在下达指令时务必清晰明确。

在谈到 AI 投资的过热话题时,Anthropic 的首席执行官达里奥・阿莫代伊表示,专注于企业客户帮助公司建立了更可持续的商业模式,让他们在投资方面更加理性。

via AI新闻资讯 (author: AI Base)
消息称阿里千问上线两月MAU破亿,AI超级应用C端战略初见成效

据报道,阿里巴巴旗下AI应用千问上线仅两个月,月活跃用户数(MAU)已突破1亿大关,在学生和白领群体中呈现强劲增长势头。不过,截至发稿时阿里方面尚未对这一数据作出官方回应。

千问App于2025年11月启动公测,这标志着阿里巴巴从B端企业服务向C端用户市场的战略转型进入实质阶段。作为阿里全力进军AI to C市场的核心产品,千问被寄予打造"AI时代未来入口"的战略期望。

阿里巴巴智能信息事业群总裁吴嘉将千问明确定位为"会聊天能办事的个人AI助手"。他强调,千问的核心竞争力体现在两个维度:智力水平和办事能力。产品目标是构建一个真正理解用户需求、能够随时随地解决实际问题的AI助理。

若1亿MAU数据属实,这将是阿里在消费级AI应用市场取得的重要里程碑,也反映出国内用户对AI工具的接受度正在快速提升。从公测到破亿用户,千问的增长速度显示出超级AI应用在C端市场的巨大潜力。

via AI新闻资讯 (author: AI Base)
抗议Grok生成不雅儿童图像 美国教师工会退出X

据路透社报道,美国教师联合会(AFT)周二宣布,将退出X平台,原因是该社交媒体网站制作并传播“令人作呕”的儿童不雅图像。AFT表示,该组织代表180万名教育工作者,是美国规模最大的工会之一。

AFT主席兰迪·温加滕(Randi Weingarten)在接受路透社采访时表示,自从埃隆·马斯克(Elon Musk)在2022年收购X以来,X就已被极端分子和网络喷子严重侵蚀。但她指出,X的AI聊天机器人Grok近期生成并大量传播未经当事人同意的女性和儿童穿着比基尼或内衣的图像,使得该平台已“无法再使用”。

“Grok AI图像生成器毫无防护措施,这成了压垮骆驼的最后一根稻草,”她表示,“从明天起,我们将不再使用X。”

温加滕表示,从周三起,她的个人账号及工会账号将停止更新。这两个账号分别拥有约10万和7.5万名粉丝。

当被问及退出X是否会影响工会的声音传播时,温加滕表示,必须把儿童安全放在首位。

“这不是一个容易的决定,但这是正确的决定,”她说,“你必须划清界限。如果你站在‘人类阵营’这边,并且相信我们必须保护儿童,尤其是儿童安全,你就必须划出这条界线。”

截至发稿,X尚未就此置评。

相关文章:

美国民主党参议员呼吁苹果谷歌应用商店下架Grok与X应用

马斯克旗下Grok因涉性化图像在印尼、马来西亚遭封禁 系全球首例

英国通信管理局调查X 因其旗下Grok生成色情化的女性及儿童的AI图像

via cnBeta.COM - 中文业界资讯站 (author: 稿源:凤凰网科技)
🚗 2025年全球电动汽车销量增长20%,受政策及市场影响2026年增速预计放缓

咨询机构Benchmark Mineral Intelligence (BMI) 周三发布的数据显示,2025年全球电动汽车(含纯电动及插电混动)注册量达2070万辆,同比增长20%。受中国需求降温及全球电气化目标放宽影响,12月全球销量仅增长6%,创下2024年2月以来最低月度增幅。2025年中国市场销量增长17%至1290万辆,贡献了全球71%的产量。北美地区受美国10月结束电动汽车税收抵免政策影响,全年销量下降4%,12月单月跌幅达39%。欧洲及世界其他地区全年销量则分别增长33%和48%。

BMI预测,2026年全球电动汽车销量将增至2390万辆,但整体增速将放缓至15.7%。其中,中国市场增速预计回升至21%,欧洲增速将放缓至15%,而北美地区受美国销量预计下滑29%的影响,整体销量或将下降23%。BMI数据经理Charles Lester表示,美国政策转向及欧盟排放标准放宽已使全球电动汽车市场格局发生剧变。目前,欧洲竞争加剧与中国需求放缓正引发关于电气化进程与汽车制造业利润及就业关系的广泛讨论。

(路透社)

via 茶馆 - Telegram Channel
↩️🖼 智谱联合华为开源首个国产芯片训练的多模态 SOTA 模型 GLM-Image


科技圈🎗在花频道📮:

智谱与 MiniMax 招股书解读:三年合计支出 110 亿元,算力成本占比过半 智谱与 MiniMax 披露的招股书显示,过去三年多两家公司合计支出 110 亿元,其中约半数用于租赁算力。智谱七成收入来自企业级本地部署,但前五大客户每年均有变动;MiniMax 侧重个人用户,截至 2025 年 9 月其产品月活达 2760 万,业务毛利于今年前三季度转正。目前两家公司营收规模约为 OpenAI 的百分之一,仍需依赖持续融资以维持高额研发与算力投入。 晚点LatePost 🍀在花频道 🍵茶馆 📮投稿新鲜事

智谱联合华为开源首个国产芯片训练的多模态 SOTA 模型 GLM-Image

智谱 AI 联合华为发布开源图像生成模型 GLM-Image,这是首个在国产芯片上完成全流程训练的 SOTA 多模态模型。该模型采用「自回归+扩散解码器」混合架构,实现图像生成与语言模型的联合,在文字渲染权威榜单中达到开源 SOTA 水平。

GLM-Image 全流程训练均在昇腾 Atlas 800T A2 设备上完成,依托昇腾 NPU 和昇思 MindSpore AI 框架,通过动态图多级流水下发、高性能融合算子、多流并行等技术优化端到端训练流程。该模型在科普插画、多格图画、社交媒体封面、商业海报和写实摄影等场景表现出色,现已在智谱开放平台提供在线体验,并将上线 Z.ai 和智谱清言。

智谱

🍀在花频道 🍵茶馆聊天 📮投稿

via 科技圈🎗在花频道📮 - Telegram Channel
静安区AI黑马杀入全国前五!迈富时凭智能体中台3.0跻身《2025中国AI智能体百强》第四

在由中国科学院等权威机构联合发布的《 2025 中国AI智能体百强》榜单中,来自上海静安区的科技企业迈富时强势崛起,凭借其AI-Agentforce智能体中台3. 0 及全场景落地成果,高居榜单第四位,与字节跳动等互联网巨头并列,成为榜单中罕见的非平台型技术企业代表。

这一突破性成绩的背后,是迈富时对AI智能体“落地难”这一行业痛点的精准破解。其AI-Agentforce 3. 0 平台首创自然语言驱动的无代码智能体构建方式,企业用户无需编程基础,仅通过对话即可定义智能体角色、任务逻辑与交互规则,大幅降低AI应用门槛。同时,平台支持多智能体协同作业与多模态交互(文本、语音、图像融合),显著提升在复杂业务场景中的适应性与跨组织协同效率。

目前,迈富时已在零售、智能制造、供应链管理等领域打造多个标杆案例。例如,在某大型连锁零售企业,其部署的多智能体系统可自动协调库存预测、促销策划与门店补货,实现端到端自动化运营;在高端制造场景,智能体中台联动设备、质检与物流系统,构建柔性生产响应机制。

更值得关注的是,迈富时正积极推动AI智能体技术标准化,联合产业链伙伴构建开放生态,加速技术从“单点创新”走向“规模复制”。作为其成长沃土,上海市静安区表示将持续强化政策与资源支持,培育更多像迈富时这样的硬科技企业,以科技创新驱动区域经济高质量发展。

在AI智能体从概念走向产业主战场的 2026 年,迈富时的崛起印证了一个趋势:真正的竞争力,不在于模型参数规模,而在于能否让AI真正“用起来、跑起来、协同起来”。当无代码智能体走进工厂与商场,AI赋能实体经济的浪潮,才真正开始奔涌。

via AI新闻资讯 (author: AI Base)
虚实难辨!圣路易斯猴子出逃引发全城搜索,AI合成图成干扰“元凶”

近日,美国密苏里州圣路易斯市上演了一场“全城找猴”的闹剧。几只长尾黑颚猴在城市北部的一处公园附近意外出逃,然而比猴子踪迹更难捉摸的,是社交媒体上泛滥的AI生成图像。这些极具误导性的合成内容正严重干扰当地官方的搜寻工作。

自上周四猴子首次现踪以来,当地社交平台便被各种流言与伪造图片“淹没”。不少网民为了博取关注,利用 AI 技术合成自己“捕获”猴子的虚假画面并发布到网上,导致大量虚假报警电话涌入。圣路易斯市卫生部门发言人威利·斯普林格(Willie Springer)无奈地表示,人们似乎只是在“图个乐子”,但区分哪些是真实证据、哪些是 AI 合成已成为目前搜索工作的最大障碍。

截至目前,官方仍未查明这些猴子的来源、逃跑原因以及具体数量。由于受到惊吓的动物可能具有攻击性,相关部门紧急提醒居民保持距离。这次事件也再次向社会敲响了警钟:随着合成媒体技术的普及,虚假 AI 内容正悄无声息地侵蚀现实世界的公共管理秩序。

划重点:

🐒 真假猴戏难辨:大量 AI 生成的虚假捕获图片在社交平台疯传,严重消耗了搜救人员的精力与公共资源。
⚠️ 公共安全隐患:出逃猴子数量与来源不明,官方警告受惊动物可能产生攻击行为,呼吁民众切勿靠近。
🌐 AI 信任危机:该事件凸显了合成媒体对现实生活的负面冲击,虚假信息正让日常现实变得“浑浊不清”。

via AI新闻资讯 (author: AI Base)
河钢唐钢打造钢铁行业AI标杆:大模型驱动生产效率提升20%,核心软件实现国产化突破

近日,唐钢正式推出一体化生产排程大模型,通过深度融合历史生产数据与智能优化算法,实现从订单接收到成品交付的全流程智能调度。该系统可实时分析产线状态、物料库存与设备负荷,动态生成最优生产路径,整体生产效率提升20%,同时显著降低库存水平、提高订单准时交付率。

更关键的是,这一模型正向“绿色智造”演进。唐钢计划将能耗、碳排放、资源循环利用率等节能环保指标纳入排程优化目标,推动生产决策从“效率优先”向“高效+低碳”双轮驱动升级。

在核心技术自主化方面,唐钢取得重大突破。其自主研发的智慧转炉炼钢大模型成功打破国外长期垄断,实现炼钢核心控制软件的全面国产化。该模型通过高精度预测钢水成分与温度,动态调整吹氧、加料等工艺参数,不仅提升冶炼效率,还显著改善钢材纯净度与力学性能,为高端产品开发提供技术支撑。

目前,AI大模型已在唐钢的烧结、炼铁、炼钢、轧制等多个关键工艺环节规模化落地,形成覆盖“计划—执行—控制—优化”全链条的智能工厂体系。作为区域产业智能化的引领者,唐山市已推动 89 个人工智能应用场景在钢铁及相关领域落地,覆盖生产调度、质量管控、设备运维、能源管理、安全监控、物流协同、环保监测等七大方向,成效显著。

唐钢的实践表明,AI并非仅属于互联网或消费电子行业——在流程复杂、体量庞大的重工业中,大模型正成为实现高端化、智能化、绿色化转型的核心生产力。当钢铁厂装上“AI大脑”,中国制造的硬核底座,正在被重新定义。

via AI新闻资讯 (author: AI Base)
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]