https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
周大福与火山引擎携手推出 AI 智能助手,提升珠宝零售效率

近日宣布与火山引擎达成合作,推出全新的 “AI 阿福智能体家族”,旨在通过人工智能技术提升珠宝零售行业的运营效率。随着全球业务规模的不断扩展,周大福珠宝在运营中面临着越来越复杂的挑战,因此决定积极拥抱 AI 技术,以提高各个业务环节的效率。

自2024年末 AI Agent 平台上线以来,周大福珠宝已构建351个智能体,为公司内的市场、财务、IT、人力资源和销售等多个部门提供支持。超过24,000名员工与这些智能体进行了百万次对话,大幅释放了员工在繁杂事务上的精力,助力企业运营的优化。

周大福珠宝集团的首席数码官张宏光表示:“通过与火山引擎的合作,我们将 AI 深度融入到内部运营和顾客体验中,以技术驱动效率提升。” 在这次合作中,周大福珠宝推出的通用智能体 “阿福”,不仅具备知识问答、文案创作、文生图和多语言翻译等功能,还能够为员工提供珠宝行业的最新资讯和市场动态,成为了他们日常工作的得力助手。

此外,周大福珠宝还推出了多个专才版的 “AI 阿福”,如专注于财务、IT、HR 等专业场景的智能体。这些智能体能够自动解答常见问题,提升部门的工作效率。例如,“财务阿福” 可以帮助员工处理报销流程,而 “IT Helpdesk 阿福” 则为门店员工提供即时的技术支持。

在提升顾客体验方面,周大福珠宝与火山引擎联合推出了 AR 虚拟试戴服务,消费者可以在手机上选择喜欢的珠宝款式进行虚拟试戴,享受沉浸式的购物体验。同时,AI 面客智能导购助手将为全球电商业务提供个性化的智能服务,帮助消费者做出更好的购物选择。

未来,周大福珠宝将继续与火山引擎深化合作,通过创新的 AI 应用,帮助员工减少重复性工作,进一步专注于珠宝的设计和顾客体验。此举不仅标志着周大福珠宝在数字化转型上的重要一步,也为整个珠宝行业的未来发展注入了新的动力。

via AI新闻资讯 (author: AI Base)
X 平台推出 AI 图片编辑器,部分创作者撤离

近日,X 社交平台宣布上线一款基于 xAI Grok 技术的在线图片 AI 编辑功能,用户可以在发布帖子时,轻松找到编辑按钮,点击后即可输入提示词进行图片编辑。这一新功能旨在为用户提供更便捷的图片处理体验,吸引更多用户参与内容创作。

然而,这项新功能却引发了广泛的争议。许多习惯在 X 平台分享作品的创作者表示,这一功能可能会导致他们的原创内容在未经授权的情况下被轻易窃取或恶意篡改,影响到创作的安全性和原创性。此举让不少创作者感到不安,甚至有些人已经决定停止在该平台分享内容,转而选择其他平台进行创作和分享。

社区中的反对声音越来越大,部分用户担心,在这样一个允许轻松编辑和修改的环境中,自己的作品可能会被滥用或失去原本的创意价值。同时,这也引发了关于版权保护的讨论,许多人呼吁平台应加强原创内容的保护机制,以维护创作者的合法权益。

via AI新闻资讯 (author: AI Base)
清华开源TurboDiffusion,AI视频生成速度暴增200倍,消费级显卡也能秒出大片!

近日,清华大学TSAIL实验室联合生数科技正式开源视频生成加速框架TurboDiffusion,这一突破性技术将AI视频扩散模型的推理速度提升100至200倍,同时保持视觉质量几乎无损,标志着AI视频创作正式进入实时生成时代。

加速性能惊人:从分钟级到秒级生成

TurboDiffusion针对现有开源视频生成模型(如Wan2.1和Wan2.2系列的1.3B至14B参数模型)进行了深度优化。在单张RTX5090显卡上,端到端生成速度可达峰值200倍以上。例如:

-5秒长视频生成时间从184秒缩短至1.9秒(约97倍加速);

- 高分辨率720P视频在14B模型下,从数千秒降至数十秒。

即使在消费级RTX4090显卡上,也能流畅运行大型模型,无需依赖昂贵的A100或H100专业卡。这大大降低了AI视频生成的硬件门槛,让更多开发者与创作者能够轻松上手。

核心技术揭秘:多重优化组合拳

TurboDiffusion并非全新模型,而是高效推理框架,通过系统性创新实现近乎无损加速。主要技术包括:

-8位量化:采用SageAttention实现低比特注意力计算,利用Tensor Core加速;

- 稀疏线性注意力(SLA):仅保留关键注意力连接,进一步减少计算量;

- 时间步蒸馏(rCM):将传统上百步采样压缩至3-4步,结合分数正则化连续时间一致性蒸馏,确保质量稳定。

这些技术正交结合,仅需6步训练流程即可复现,极大提升了可操作性。项目完全开源,包括代码、预训练模型权重以及完整训练脚本,已在GitHub上获得广泛关注。

行业影响深远:开启实时AI视频新纪元

TurboDiffusion的发布,被业内视为视频生成领域的“DeepSeek时刻”。它不仅解决了高分辨率、长时序视频生成的延迟与成本痛点,还吸引了Meta、OpenAI等国际团队的注意。该框架推动AI视频从实验阶段向规模化应用转型,未来有望支持交互式创作、企业级批量生产等场景。

AIbase认为,这一开源项目将加速AI视频工具的普及,彻底改变内容创作格局。感兴趣的开发者可立即访问GitHub仓库(https://github.com/thu-ml/TurboDiffusion)体验。

via AI新闻资讯 (author: AI Base)
中文数据占比突破80%!国产大模型加速“去英文依赖”,文化理解成AI竞争新高地

当AI开始真正“读懂”中文,一场静默的技术革命正在发生。在国产大模型竞速赛中,中文高质量数据正成为决定胜负的关键变量。据行业调研,当前主流国产大模型训练数据中,中文内容占比普遍超60%,部分模型甚至高达80%,显著降低对英文语料的依赖。这一转变不仅提升模型对中国用户需求的理解精度,更让AI首次具备深度解析“上火”“湿气”“看车”等文化特有概念的能力。

从“能翻译”到“懂语境”:中文复杂性倒逼数据升级

“看车”一词,在4S店指“选车”,在停车场可能指“照看车辆”——这类高度依赖语境的表达,仅靠翻译式训练无法准确捕捉。清华大学孟庆国教授指出:“中文的隐喻、政策术语、方言习惯和文化符号,构成了独特的语义网络。只有扎根足够深的中文数据,模型才能真正‘本土化’。”

科大讯飞赵艳军进一步举例:中医的“上火”并非字面燃烧,而是指一系列内热症状;古诗“落花流水”既可表春景,也可喻情逝。若模型未在高质量中文语料中充分学习,便只能机械拆解,无法传递文化神韵。

3500TB高质量数据集落地,中国移动领跑基建

为夯实中文AI底座,产业界正加速行动。中国移动已建成覆盖30+行业、总量超3500TB的通用高质量中文数据集,涵盖政务、医疗、金融、教育等场景,为大模型提供结构化、去噪、合规的训练燃料。此外,高校、出版社与文化机构也在推动古籍、方志、戏曲等稀缺资源的数字化与标注。

数据孤岛与标准缺失仍是瓶颈

尽管进展显著,挑战依然突出:

- 数据孤岛:政府、企业、学术机构数据割裂,难以形成合力;

- 标注标准不一:同一术语在不同数据集中标签混乱,影响模型一致性;

- 隐私与安全:高价值中文数据涉及个人信息与国家敏感信息,需新型隐私计算技术护航。

专家呼吁,应尽快建立国家级中文数据标注规范,推动跨机构数据协作,并鼓励采用联邦学习、可信执行环境(TEE)等技术实现“数据可用不可见”。

AI+文化:从工具到传承者

AIbase认为,中文数据的战略价值远超技术层面——它关乎文化主权与数字文明话语权。当大模型能生动解读《红楼梦》的隐喻、精准生成符合平仄的宋词、向世界解释“和而不同”的哲学,AI便从工具升华为中华文明的数字化传承者。

在“人工智能+”与“文化数字化”双重国家战略交汇下,中文高质量数据的建设,正从技术命题转化为时代使命。而这场由数据驱动的AI本土化浪潮,才刚刚掀起第一朵浪花。

via AI新闻资讯 (author: AI Base)
腾讯混元推出 ETC 领域首款 AI 智能体 助力用户畅行无阻

近日,在智能交通领域,腾讯云与安徽驿路微行科技有限公司联合推出了 ETC 助手的全新功能 ——“助手 Agent”,这款基于腾讯混元大模型的 AI 智能体为 ETC 用户提供了更为便捷和高效的服务。用户可以通过文本或语音指令与智能体进行交互,获得准确的答复和服务支持。

据官方数据显示,自今年4月启动内测以来,助手 Agent 已成功服务超过百万用户,其问答准确率高达95%,问题解决率也达到了90%。这一成绩表明,助手 Agent 在为用户提供服务的过程中,表现出了卓越的智能和效率。

助手 Agent 的推出,标志着 ETC 助手在技术上的一大创新。通过融合多模态交互技术,用户不仅可以通过传统的文本输入方式提问,还能体验到 AI 增强的语音交互。用户只需简单地发出指令,例如 “开启畅行模式”,智能体就能迅速调高设备灵敏度,实现快速识别和高效通行,提升出行体验。

在助手 Agent 的智能化用户体验背后,是 ETC 助手为其构建的完善能力体系。在感知层,助手 Agent 能够通过105种状态监测算法实时采集设备运行数据,并借助语音交互与关键状态播报,确保 “服务找人” 有据可依。智能核心层则依托于行业规则和服务流程的通用知识库,构建了稳定可信的 ETC 基础服务能力。

此外,助手 Agent 在执行层不仅能作为行业百科为用户答疑解惑,还可以作为服务专家提供一站式支持。用户可以通过语音直接控制设备,实现 “所说即所得” 的自然交互方式,进一步提升了用户的使用体验。

腾讯混元的推出,不仅展示了在智能交通领域的技术创新,也为用户提供了更加人性化的服务解决方案。未来,腾讯混元将持续关注用户需求,进一步完善智能服务,助力人们的出行更加顺畅和便捷。

在今后的使用中,ETC 用户只需打开助手,便可享受到由混元大模型支持的智能服务,畅行无阻。腾讯混元的 “助手 Agent” 将成为每一位用户的得力助手,让出行更智能、更高效。

via AI新闻资讯 (author: AI Base)
Issue with loading conversation history

Status: Investigating

We are investigating the issue for the listed services.

Affected components
Conversations (Degraded performance)

via OpenAI status
英伟达重拳出击!非独家授权Groq芯片技术,并高调挖角其CEO,AI芯片格局或将重塑

全球AI芯片霸主英伟达(NVIDIA)正以惊人动作巩固其技术护城河。据CNBC与TechCrunch综合报道,英伟达已与AI芯片挑战者Groq达成一项非独家技术授权协议,并同步聘请Groq创始人兼CEO Jonathan Ross、总裁Sunny Madra及其他核心团队成员。尽管英伟达澄清“并非收购Groq公司”,但CNBC援引消息人士称,相关资产交易金额或高达 200 亿美元——若属实,将成为英伟达史上最大一笔技术并购。

Groq的LPU:能效比碾压GPU的“异类”

Groq近年来凭借其独创的LPU(Language Processing Unit)架构异军突起。与英伟达GPU通用并行架构不同,LPU采用全确定性、单指令流、超宽数据路径设计,专为大语言模型(LLM)推理优化。Groq宣称其芯片可实现 10 倍于GPU的推理速度,同时功耗仅为十分之一——这一性能在AI推理成本高企的当下极具颠覆性。

Groq创始人Jonathan Ross正是AI芯片界的“传奇人物”——他在谷歌任职期间主导开发了TPU(张量处理单元),为谷歌AI基础设施奠定基石。如今,他的创新基因或将注入英伟达下一代芯片架构。

200 亿美元豪赌?英伟达的“拿来主义”战略

若 200 亿美元交易属实,这笔投入远超英伟达以往任何收购(此前最大为 69 亿美元收购Mellanox)。此举释放明确信号:面对AI推理市场爆炸式增长,英伟达不再满足于GPU单一路径,正加速整合专用加速器技术。

值得注意的是,此次为“非独家授权”,意味着Groq仍可向其他厂商(如微软、亚马逊)提供LPU技术。但核心团队加入英伟达,或将使Groq后续创新动能大幅削弱,实质形成“技术输血、人才归核”的局面。

Groq的迅猛崛起与隐忧

截至 2025 年 9 月,Groq已完成7. 5 亿美元融资,估值达 69 亿美元,其平台已支持超 200 万开发者( 2024 年仅35. 6 万),增长超 5 倍。其“即时响应”推理能力在AI Agent、实时客服、终端设备等场景广受青睐。

然而,在英伟达构建的CUDA生态壁垒前,Groq始终面临“性能强、生态弱”的困境。此次技术授权,或为其找到商业化出口,也为英伟达补上推理能效短板。

行业影响:AI芯片进入“融合架构”时代

AIbase认为,此次合作标志着AI芯片竞争从“架构对抗”转向“优势融合”。未来,高性能AI系统或将采用“GPU训练 + LPU推理 + DPU通信”的异构架构。而英伟达凭借资本、生态与技术整合能力,正将潜在颠覆者转化为自身护城河的一部分——这或许是最高效的“消灭对手”方式。

当Groq的LPU技术融入英伟达的下一代Blackwell Ultra或 Rubin 架构,真正的“能效革命”才刚刚开始。而AI芯片的终局,可能不属于纯挑战者,而属于那个能把所有创新装进自己生态的巨头。

via AI新闻资讯 (author: AI Base)
2025年前11月中国大模型政企采购超21亿元!百度智能云领跑,中标95个项目夺双料第一

国产大模型正加速从技术演示走向规模化落地。根据对 2025 年 1 月至 11 月全国公开招标数据的综合统计,中国主流云厂商在大模型相关项目中累计中标 291 个,总金额突破 21 亿元,标志着AI大模型已成为政企数字化转型的核心基础设施。

在激烈竞争中,百度智能云以 95 个中标项目、7. 1 亿元中标金额,双双位居行业首位,展现出其在行业大模型落地能力、生态整合与商业化成熟度上的显著优势。

政企刚需驱动大模型采购潮

从已公开的中标项目看,大模型应用已深度渗透至政务、金融、能源、制造、交通、医疗等关键领域。典型场景包括:

- 政务智能客服与政策问答系统;

- 银行合规审查与风险预警模型;

- 电网设备故障预测与巡检报告生成;

- 工业企业知识库构建与技术文档智能管理。

这些项目普遍要求模型具备高安全性、行业知识深度、私有化部署能力及与现有IT系统无缝集成,恰好契合百度智能云“文心大模型+千帆平台+行业解决方案”的一体化交付模式。

百度领跑,凸显“技术-场景-交付”闭环优势

百度智能云的领先并非偶然:

- 文心大模型5. 0 于近期发布,强化原生多模态与推理能力;

- 千帆大模型平台已支持超 400 家企业私有化部署;

- 深耕智能云+大模型+行业Know-how,在能源、金融等领域形成标准化解决方案。

相比之下,阿里云、华为云、腾讯云等虽在部分区域或行业表现强劲,但在项目数量与金额总量上暂居其后。

21 亿元只是开始,大模型进入“实绩交付”时代

AIbase认为, 21 亿元中标额仅是大模型产业化的冰山一角。随着各地“人工智能+”行动计划落地, 2026 年政企大模型采购规模有望翻倍。而市场将不再仅关注参数与榜单,而是聚焦落地效率、ROI可衡量性与长期运维能力——这正是百度智能云当前建立的护城河所在。

当大模型从“炫技”走向“签单”,中国AI的下半场,才真正拉开序幕。

via AI新闻资讯 (author: AI Base)
声智科技推全球首款“多模态AI时尚耳机”!声视融合,Kickstarter首发开启随身感知新时代

可穿戴设备迎来“感知革命”。中国AI声学领军企业声智科技(SoundAI)宣布,其全球首款多模态AI时尚耳机将于海外知名众筹平台Kickstarter全球首发。该产品突破传统耳机仅限音频交互的局限,创新性融合视觉感知与声学交互,定位为用户的“随身感知工具”,让AI真正“看得见、听得清、回得准”。

声视融合:用眼睛看,用耳朵说

不同于普通AI耳机仅依赖麦克风阵列,声智此次产品搭载微型视觉传感器与自研多模态大模型,实现“视觉场景验证 + 声学结果交付”的闭环体验:

- 视觉端:通过轻量级摄像头或环境光感知,识别用户所处场景(如咖啡馆、会议室、街道);

- 声学端:基于场景智能优化降噪策略、语音唤醒灵敏度及TTS输出音色;

- 交互闭环:例如在嘈杂街道,耳机识别“户外”后自动增强语音收听清晰度;进入会议室则切换至“静音模式”,仅通过骨传导提示日程。

该设计有效解决纯语音AI在复杂环境中的误触发与响应失准问题,显著提升交互可靠性。

全栈声学底座,软硬一体赋能

产品依托声智科技自研的全栈声学技术体系,涵盖远场语音识别、声源定位、回声消除、个性化声纹建模等核心技术,并集成其多模态大模型推理引擎,可在端侧完成低延迟场景理解,保障用户隐私与响应速度。

时尚设计+全球首发,瞄准高端消费市场

作为“时尚耳机”,产品由国际设计团队操刀,兼顾美学与佩戴舒适性,目标用户为科技爱好者、商务人士与数字游民。选择Kickstarter首发,旨在借力全球早期用户反馈,快速迭代并建立海外品牌认知。

AIbase认为,声智科技此举标志着AI可穿戴设备从“语音助手”向“环境感知智能体”跃迁。当耳机不仅能听指令,还能“看懂”你所处的世界,人机交互的自然性与主动性将实现质的飞跃。而这场由声智掀起的“声视融合”浪潮,或将成为下一代智能硬件的关键入口。

via AI新闻资讯 (author: AI Base)
智谱与 MiniMax:大模型创业背后的隐秘真相!

智谱和 MiniMax,曾经被誉为 “大模型六小虎” 的两位成员,如今即将踏上上市之路。随着竞争愈演愈烈,这两家公司正在争夺成为 “首个大模型上市公司” 的桂冠,情况让人不禁想起曾经的 “AI 四小龙” 上市热潮。然而,这一次它们面临的市场环境和商业路径却截然不同。

首先,智谱与 MiniMax 在商业模式上的差异显而易见。智谱主要采用 MaaS(模型即服务)模式,依靠 API 调用来盈利,而 MiniMax 则通过 AI 原生产品提供订阅服务来获利。智谱更倾向于将自己塑造成一个 API 消费驱动的收入模型,而 MiniMax 则将自己定位为以 AI 产品为核心的轻型公司。这种商业定位的不同使得两者在气质和市场策略上有着明显差异。

在市场份额方面,智谱和 MiniMax 也各有侧重。智谱专注于国内市场,声称在中国独立通用大模型开发商中名列第一;而 MiniMax 则瞄准全球市场,标榜自己为全球第十大模型公司。尽管如此,两家公司的市场占有率仍然较低,显示出巨头的 “黑洞效应” 依然存在。

尽管两家公司都在实现高增长,智谱和 MiniMax 的收入增速逻辑却有所不同。智谱的收入复合增长率在 130% 以上,而 MiniMax 的增速更为惊人,预计达到 782.2%。智谱的收入构成显示出向云端部署的转变,而 MiniMax 则依赖于其 AI 原生产品的增长。

不过,高增速的背后也隐藏着 “流血上市” 的压力。智谱的亏损超过 62 亿人民币,而 MiniMax 的亏损也高达约 93 亿元。然而,从现金流的角度看,MiniMax 短期内的生存压力较小,拥有更强的资金支撑。

在人才战略方面,智谱与 MiniMax 同样各有特色。智谱强调科学家团队的重要性,而 MiniMax 则注重年轻化的组织结构,显示出不同的企业文化和人才管理思路。尽管两家公司的研发人员占比都很高,但人均产出能力却大相径庭,MiniMax 的人均产出是智谱的三倍。

最后,两家公司在算力支出上也都有明显的投入,显示出大模型创业的资金流向。在未来,智谱和 MiniMax 将继续在国际市场寻求增长,同时面临着法律诉讼和竞争带来的风险。

via AI新闻资讯 (author: AI Base)
全国首个 “云宇星空” 大模型发布,助力智能城市规划!

近日,上海市规划和自然资源局与商汤科技合作推出了全国首个专注于规划资源的大型 AI 模型 ——“云宇星空大模型(专业版)”。该模型以6000亿个参数为基础,深度整合了遥感影像、三维实景、规划图纸和政务文本,旨在打造一个真正懂得城市规划的 “AI 城市规划师”。

“云宇星空” 模型采用了 “1个行业基座大模型 +6个垂类智能体” 的架构,覆盖规划资源、政府治理及社会共创等多个领域,能够有效应对十个核心场景的需求。其训练数据依托全国首个规划资源专用语料库 “坤舆经略・语料库”,包括900多份规划文档、超过10万条基础问答和1000多位专家的对话记录,从而确保模型的专业深度与动态更新能力。

“云宇星空” 具备多项强大的功能。用户可以通过自然语言发出指令,例如 “调出徐汇滨江某地块的规划图”,系统会在秒级内自动聚合多源图层,极大地简化了传统复杂的 GIS 操作。此外,该模型还能够通过自然语言查询与规划资源业务数据库直接连接,快速提供统计信息,支持数据可视化分析,辅助决策过程。

更为令人惊讶的是,“云宇星空” 集成了商汤科技的多模态大模型,能够识别规划图纸中的各种要素,自动比对现状与规划之间的差异,从而提升合规审查的效率超过50%。此外,它还能基于逻辑和业务思维自动生成符合《城乡规划编制办法》的技术报告,实现从数据到结论的无缝对接。

值得一提的是,区别于一般的聊天机器人,“云宇星空” 拥有自主任务调度引擎,能够完成从识别违建到生成处置建议的复杂闭环任务。目前,这一强大模型已在上海多个规划项目中试运行,图纸审查效率提升了三倍,规划咨询响应时间从 “天级” 缩短至 “分钟级”。

随着 “云宇星空” 的发布,智能化城市规划的时代已然来临,未来将助力超大城市治理走向更加科学化、精细化、智能化的新时代。

via AI新闻资讯 (author: AI Base)
谷歌 GV 押注!AI 车队管理巨头 Motive 冲击上市,拟募资迎战对手

在 AI 浪潮的推动下,智能物流领域迎来重磅玩家的资本动作。获得谷歌母公司旗下GV(原 Google Ventures)鼎力支持的旧金山科技公司Motive,已正式向纽约证券交易所提交 IPO 申请。该公司计划以股票代码“MTVE”挂牌交易,这标志着其从秘密递表步入公开上市的新阶段。

Motive(曾用名 Keep Truckin)成立于2013年,核心业务是为物流、建筑及制造业提供软硬件结合的车队管理系统。其最引人瞩目的产品是搭载 AI 技术的车载摄像头,能够实时监测驾驶员行为并预警安全风险。官方数据显示,该系统已累计预防了17万起事故,挽救了1500多人的生命。截至今年9月,Motive的客户规模已逼近10万家。

尽管营收持续增长,但Motive仍处于亏损扩张阶段。财报显示,其今年前三季度的营收达到3.27亿美元,较去年同期增长显著,但净亏损也扩大至1.38亿美元。公司目前拥有超过4500名员工,其中包括专门负责优化 AI 算法的400人数据标注团队。

此次上市对Motive而言既是机遇也是挑战。它不仅要在回暖的 IPO 市场博得投资者青睐,还需应对与老对手 Samsara 之间愈演愈烈的专利诉讼战。摩根大通和花旗等多家知名投行正联手为本次发行保驾护航。

via AI新闻资讯 (author: AI Base)
:50+ Claude 技能库闪现 GitHub,教你的 AI 学会9大领域专业活儿

随着 AI 从“对话”向“协作执行”转型,Anthropic 的技术生态迎来重要里程碑。近日,一套全面的 “Claude 技能”(Claude Skills) 库已在 GitHub 正式开源发布。这标志着 Claude 不再仅仅是一个回答问题的助手,而是一个拥有标准化、可定制工作流的专业执行器。

50+ 技能矩阵:覆盖从文档到安全的全场景

这套技能集包含9大类别、50多项专业技能,旨在教导 Claude 以高度标准化的方式重复执行复杂任务。其覆盖范围包括:

● 文档处理:针对 Word、PDF、PowerPoint 的深度解析与自动化生成。
● 开发工具:集成 Playwright、AWS 和 Git,助力自动化测试与云端运维。
● 数据与商业:涵盖数据分析、市场营销、沟通技巧及项目管理流程。
● 创意与生产力:包括创意媒体制作、日常效率提升以及系统安全加固。

灵活集成:从网页端到 API 的全链路支持

“Claude 技能”在设计上追求极致的便携性与易用性。每个技能都由一个独立的文件夹和核心指令文件 SKILL.md 组成。用户可以根据需求,通过以下三种方式快速启用:

1. 网页端集成:直接在 Claude.ai 的设置中添加。
2. 本地化部署:将其存储在 Claude Code 的配置文件夹中,赋予本地开发助理更强战力。
3. 开发者调用:通过 API 接口,将这些标准化能力无缝嵌入到自有应用中。

开源驱动:定制属于你的 AI 专家

该代码库采用 Apache2.0许可证,意味着它对个人和企业用户完全开放,并鼓励社区贡献代码。虽然库中已提供了大量灵感来源,但其本质是“文件夹中的提示词集”,因此其真正的威力在于按需定制。用户可以根据自身的业务逻辑修改提示词,从而发挥 AI 在特定领域的最优表现。

随着“技能”逐渐成为 AI 应用的标准方法,这一开源库的发布不仅为 Claude 用户提供了现成的工具箱,也为整个 AI 行业定义了标准化工作流的新范式。

via AI新闻资讯 (author: AI Base)
OpenAI 探索新广告模式!ChatGPT 或将引入赞助内容

近日,知名科技媒体 The Information 报道称,OpenAI 正在积极研究如何在其人工智能产品 ChatGPT 中整合广告。根据内部人士的透露,该公司正考虑在用户询问与消费相关的问题时,优先显示赞助内容。比如,当用户询问哪款睫毛膏效果好时,他们可能会看到来自丝芙兰等品牌的推荐信息。这一举措旨在为广告客户提供新的营销机会,同时为用户提供更具针对性的产品信息。

与此同时,OpenAI 的团队也在设计多种广告展示原型,探索如何将广告巧妙地融入 ChatGPT 的界面中,以保持用户体验的流畅性与信任感。与传统社交媒体不同,OpenAI 认为 ChatGPT 拥有独特的优势,能够通过长期的对话积累用户的兴趣和需求。当用户表现出购买意向时,提供相关的赞助信息将显得尤为有效。

在广告内容的呈现方式上,OpenAI 正在考虑将赞助信息的权重提高,以确保这些内容在用户的回答中优先出现。同时,近期的设计方案也包括在主回答旁的侧边栏展示赞助内容,并清晰标示其为广告。重要的是,OpenAI 内部一致认为,必须避免广告内容干扰用户的体验,因此广告的展示将会在对话进行到一定阶段后才会出现,以确保不会让用户感觉到广告的侵扰。

例如,假如用户在规划一次巴塞罗那的旅行,ChatGPT 可能会自然推荐参观圣家堂,而不附带广告。当用户进一步点击相关链接时,系统可能会弹出包含付费导览商家的赞助信息。

OpenAI 发言人表示,他们在探索广告的同时,将继续致力于为用户提供更强大的智能功能,并尊重用户与 ChatGPT 之间建立的信任关系。

via AI新闻资讯 (author: AI Base)
反垄断重锤!意大利叫停 Meta 封杀第三方 AI 聊天的“霸王条款”

全球社交巨头Meta在欧洲市场再踢“铁板”。意大利竞争管理局(AGCM)近期正式发布命令,要求Meta立即暂停其在WhatsApp商业平台上禁止第三方 AI 聊天机器人接入的新政策。监管部门认为,这一做法涉嫌滥用市场支配地位,阻碍了 AI 市场的公平竞争。

此次争议的焦点源于Meta计划于2026年1月生效的一项政策调整。该政策规定,第三方通用 AI 机器人(如 ChatGPT 或 Claude)将无法通过WhatsApp的商务接口(API)提供服务。意大利监管机构指出,由于WhatsApp在即时通讯领域拥有统治地位,这种封锁行为可能会限制技术创新,剥夺消费者在常用应用中选择不同 AI 服务的权利。

面对质疑,Meta方面辩称WhatsApp并非“应用商店”,且其 API 并非为大规模分发第三方 AI 而设计,过多的流量会给系统带来巨大压力。Meta强调,AI 公司应该通过自己的网站或手机应用商店来寻找用户,而不是依赖WhatsApp的商务平台。

目前,除了意大利政府的重拳出击,欧盟委员会也已对该政策启动了相关调查。在 AI 算力与应用爆发的当下,社交巨头如何平衡自有 AI 产品与开放生态之间的利益,正成为全球反垄断监管的核心命题。

划重点:

🚫 叫停封杀政策:意大利监管机构强制Meta暂停禁止第三方 AI 接入WhatsApp的计划,防止其利用平台优势进行不正当竞争。
⚖️ 滥用地位质疑:官方认为Meta的行为可能损害消费者利益,限制 AI 聊天机器人市场的技术进步和准入机会。
🏛️ 多方压力并进:Meta虽然计划上诉并否认违规,但同时还面临着欧盟委员会发起的反垄断调查压力。

via AI新闻资讯 (author: AI Base)
生存还是毁灭?剑桥报告揭秘:半数英国小说家担心被 AI “抢饭碗”

随着生成式 AI 技术的狂飙突进,创意写作这一人类智慧的堡垒正面临前所未有的冲击。剑桥大学近期发布的一份重磅报告显示,英国出版界弥漫着深刻的焦虑:超过51% 的受访小说家认为,AI 最终将完全取代他们的创作工作。

这份由剑桥大学 Minderoo 科技与民主中心完成的研究,深度调研了数百位创意从业者。结果触目惊心:约59% 的作家确信自己的作品在未经授权或未获得报酬的情况下,被用于训练大型语言模型(LLM)。更现实的威胁在于经济层面,近四成作家的收入已经受到 AI 的直接影响,而高达85% 的人预计未来的收入将进一步缩水。

图源备注:图片由AI生成,图片授权服务商Midjourney

报告指出,类型文学作家(如浪漫、惊悚和犯罪小说)最易受到冲击,其中三分之二的受访者认为浪漫小说家面临“极端威胁”。尽管如此,业界并非完全抵制 AI,约33% 的作家正在使用 AI 处理非创作类任务,如资料检索等。然而,对于 AI 创作整本小说的行为,几乎所有(97%)作家都持极其负面的态度。

剑桥大学的研究人员警告称,如果缺乏有效的透明度监管和版权保护,文学市场可能会演变成“两极化”:人类创作的作品沦为高价奢侈品,而充斥市场的则是廉价、公式化的 AI 生成内容。这不仅是经济问题,更是关于人类原创性是否会被算法淹没的文化危机。

划重点:

😨 职业替代危机:超过半数的英国小说家认为 AI 最终将完全取代人类作家,类型文学创作者感受到的威胁最为迫切。
💰 版权与收入双重打击:近六成作品疑似被“白嫖”用于 AI 训练,绝大多数作家预计 AI 将导致行业整体收入大幅下滑。
⚖️ 呼吁监管透明化:业界强烈要求建立“先授权再使用”的模式,并要求科技公司对训练数据保持透明,以捍卫创作尊严。

via AI新闻资讯 (author: AI Base)
告别按月订阅,1min.AI 推出终身全能计划,一站式接管创作全流程

随着人工智能从专家工具转型为大众创作资源,全能型 AI 集成平台正在重塑内容生产秩序。近日,1min.AI 正式推出其高级商业计划的终身订阅版,以74.97美元的极具竞争力价格(建议零售价540美元),为创作者和企业主提供了一个一站式的浏览器内 AI 工作站。

该计划彻底打破了按月续费的传统模式,用户无需支付额外费用即可长期调用涵盖写作、图像、音视频编辑在内的全方位 AI 能力。

在核心功能上,1min.AI 实现了跨维度的工具聚合。用户可以同时与多个 AI 助手协作,完成从博客撰写、内容重写到社交媒体管理的闭环任务。针对视觉创作,该平台不仅支持图像生成与放大,还集成了背景移除、对象替换及3D 图像生成等高级编辑功能。同时,其深度集成的 PDF 处理工具让文档的摘要、翻译与交互变得无缝且高效。

音视频工作流同样是该计划的重头戏。1min.AI 支持高保真文本转语音、声音克隆以及专业级的录音增强与编辑。在视频领域,它能够提供转录、翻译、摘要服务,甚至具备直接从文本或图像生成视频内容的创新能力。

此外,该高级商业计划还充分考虑了团队协作需求,提供无限存储空间、丰富的提示库以及支持多达20名成员的团队管理工具。对于追求极简工作流、希望在一个平台上完成设计与制作全过程的现代团队而言,这一终身访问方案无疑提供了极高的投资回报率。

via AI新闻资讯 (author: AI Base)
阿里 Qwen 发布新一代图像编辑模型Qwen-Image-Edit-2511,人物一致性大幅提升

阿里巴巴旗下的Qwen团队近期在 AI 视觉领域再次发力,正式发布了全新升级的图像编辑模型 Qwen-Image-Edit-2511。针对以往 AI 在修图时容易导致“人脸变形”或“身份丢失”的痛点,该模型实现了质的飞跃,能够确保在进行创意修改的同时,精准保留原图人物的面部特征。

根据Qwen官方在Hugging Face上公布的信息,这款模型是此前版本的重大迭代。它不仅能处理单人肖像的精细编辑,在应对多人合照等复杂场景时也表现出色,可以同时维护多位角色的身份一致性。 无论是为照片中的人物更换服饰、调整背景,还是改变光影效果,模型都能在不改变人物“长相”的前提下完成自然过渡。

除了核心的身份保持技术,新版模型还增强了对相机视角、几何计算以及工业产品设计的操控能力。 值得一提的是,Qwen团队还将社区中广受欢迎的 LoRA(微调模型)技术直接集成到了基础模型中,这使得普通用户也能轻松获得专业级的编辑效果。

huggingface:https://huggingface.co/spaces/Qwen/Qwen-Image-Edit-2511

划重点:

👤 人物特征神还原:新模型解决了 AI 修图常见的“变脸”问题,能在创意编辑时完美保持人物身份一致性。
🛠️ 全能型编辑工具:不仅擅长人像处理,还强化了光影控制、工业设计和多物体协同编辑等综合能力。
🔓 开源且免费体验:模型采用Apache2.0协议开源,并提供网页端Demo供用户直接上手测试。

via AI新闻资讯 (author: AI Base)
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]