https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
Meta 首席 AI 科学家承认 Llama 4 基准测试造假,GenAI 团队遭边缘化

(科技圈)

via 茶馆 - Telegram Channel
Meta 首席 AI 科学家承认 Llama 4 基准测试造假,GenAI 团队遭边缘化

Meta 首席人工智能科学家 Yann LeCun 近日接受《金融时报》(Financial Times)采访时承认,公司在 2025 年 4 月发布 Llama 4 模型前曾篡改基准测试结果。LeCun 透露,研发团队针对不同测试项目使用特定模型以获取高分。该造假行为引发 Meta 首席执行官马克·扎克伯格(Mark Zuckerberg)不满,随后整个 GenAI 团队被边缘化。目前,包括 LeCun 在内的多名核心技术人员已离职或准备离职。

Financial Times

🍀在花频道 🍵茶馆聊天 📮投稿

via 科技圈🎗在花频道📮 - Telegram Channel
Grok AI应用户要求制作大量露骨图片甚至包含儿童露骨图片

本周 X/Twitter 上最火的帖子可能就是关于 Grok AI 生成大量露骨图片的内容,Grok AI 活跃在 X 平台并会按照用户要求执行操作,于是不少用户要求 Grok AI 把某人照片中的衣服剥离。

由于 X 账户回复内容是公开可见的,因此用户只需要转到 Grok AI 主页查看回复或者是图片就可以看到人要求 Grok AI 生成的图片,不少用户看到图片后直呼辣眼睛。

这些图片里不乏存在埃隆马斯克裸露照片以及大量其他人的裸露照片,甚至还有未成年人的裸露照片,在大多数国家或地区,涉及未成年人的色情内容都是严重的犯罪。

负责生成图片的是 Grok AI 推出的 Grok Imagine 图像生成模型,该模型本身就缺乏针对性爱和深度伪造技术的安全保障,在 2025 年 8 月推出时用户就可以使用该模型生成 NSFW 图像 (意为不适合在工作场所查看的内容)。

然而 xAI 的反应速度似乎并不快,在收到大量用户反馈后该公司才发帖表示正在考虑加强安全措施:
个别情况下用户被要求提供并收到描述未成年人衣着暴露的 AI 图片,我们团队已经发现安全措施存在漏洞并正在紧急修复。另外我们团队正在考虑进一步加强我们的安全措施。(注:原文如此)
在 xAI 的可接受使用政策里明确禁止用户以色情方式描绘人物肖像,但这不一定包含仅带有性暗示的内容,当然政策本身确实禁止对儿童进行性化或剥削,只不过 xAI 的安全政策显然没有跟上。

目前法国政府已经开始指控 Grok AI 在未经用户同意的情况下生成并传播明显违法的色情内容,法国政府称 xAI 和 X/Twitter 可能违反了欧盟的数字服务法,这项法规要求平台降低非法内容传播的风险。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:蓝点网)
即将离职的Meta首席AI科学家承认该公司在发布Llama 4时篡改测试结果

社交媒体集团 Meta 旗下推出的开放人工智能模型 Llama 知名度非常高,在人工智能社区里 Llama 1~3 系列口碑和评价也都非常不错,不过在 2025 年 4 月该公司推出 Llama 4 时却遭遇滑铁卢。

当时 Llama 4 的基准测试表现看起来也非常不错,问题是该系列模型本身就是开放的因此在模型发布后立即就有大量开发者进行测试,测试结果是模型实际表现远不如 Meta 宣传的那么出色。

彼时就有消息称 Meta 可能为了提高模型基准测试评分而进行作弊,不过后来 Meta 也出面回应称没有这种事情,但后来 Llama 系列模型的发展似乎就陷入了停滞,早前也有消息称 Meta 将重点转向闭源商业模型。

现在即将离任的 Meta 首席人工智能科学家、现代人工智能奠基人之一的 Yann LeCun 承认,Meta 在 2025 年 4 月发布 Llama 4 模型前曾篡改过基准测试结果以获得更好的分数。

这名人工智能科学家在接受英国金融时报采访时透露,基准测试结果确实被稍微修改过,团队针对不同的基准测试项目使用不同的模型以获得更好的结果。

但这种作弊带来的后果也是很可怕的:在模型发布后 Llama 4 被外界认为是个失败的模型,Meta 也面临被指控操纵基准测试结果,这导致 Meta 创始人马克扎克伯格非常不满并且对所有参与发布的人都失去了信心。

Yann LeCun 称,最终扎克伯格直接将整个 GenAI 团队边缘化,目前很多人已经离开该团队以及还有更多人即将离开,像是 Yann LeCun 这样已经在 Meta 工作十年的老员工也同样要离开了。

via FT

via cnBeta.COM - 中文业界资讯站 (author: 稿源:蓝点网)
法国对Grok涉嫌生成色情内容启动调查

法国巴黎检方周五对媒体证实,将对美国企业家埃隆·马斯克旗下人工智能企业 xAI 的聊天机器人Grok涉嫌生成非法色情内容启动调查。Grok由 xAI 公司开发,并内置于马斯克拥有的社交媒体平台 X ,X 用户可直接调用该聊天机器人。近日,社交平台 X 出现部分用户利用Grok编辑图片和视频的现象,部分生成的内容可以假乱真。一些用户借此生成真实人物的虚假性暴露内容,并在社交平台 X 上散播。受害者包括数百名女性和未成年人。周五,多名法国政府部长和国民议会议员就上述现象向法国司法部门报案。当日晚些时候,巴黎检方表示,将启动相关调查。

—— 新华社彭博社CNBC

via 风向旗参考快讯 - Telegram Channel
🐧 2026年将成为作者全面转向Linux桌面系统的年份

作者计划在2026年将其个人计算环境全面迁移至Linux系统。目前,作者已超过三个月未在其塔式机上启动Windows系统,并计划将现有的三块SSD统一整合为Fedora系统下的btrfs驱动器。在具体设备部署上,作者打算在塔式机上运行Fedora,在掌上游戏机上则采用Bazzite或SteamOS。

此次转向的主要原因在于作者认为Windows 11的用户体验已变得不可接受。作者指出,尽管微软拥有NT内核、WSL和Hyper-V等技术创新,但其在界面开发上采用了React Native构建开始菜单、将Ctrl-Alt-Delete菜单变为Web视图,并强制推行Copilot功能。作者提到,曾因Copilot功能在掌机上卡死而被迫进行硬件重启。

作者认为,Linux桌面系统目前已具备向大众普及的条件,这主要是因为Windows在稳定性与用户体验方面的退步,而非Linux自身发生了巨大飞跃。此外,作者强调Linux在硬件资源利用上更具效率,能够减少内存浪费,且在系统出现问题时能提供更明确的日志信息供用户排查。

(HackerNews)

via 茶馆 - Telegram Channel
🤖 Hugging Face 推出 HF Skills 仓库,支持 OpenAI Codex 自动化模型训练全流程

Hugging Face 近日推出了 Hugging Face Skills(HF Skills)仓库,使 OpenAI Codex 能够作为编码代理,自动化完成 AI 模型的训练、评估与发布全流程。该系统支持有监督微调(SFT)、直接偏好优化(DPO)及强化学习(RL)等生产级训练方法,覆盖 0.5B 至 7B 参数规模的模型。Codex 通过接入该仓库,可自动验证数据集格式、匹配硬件资源并提交至 Hugging Face Jobs 执行。在训练过程中,Codex 能够实时监控 Trackio 指标、生成实验报告,并将模型导出为 GGUF 格式或直接发布至 Hugging Face Hub。目前,该功能已兼容 Claude Code 及 Gemini CLI 等主流编码代理。

(科技圈)

via 茶馆 - Telegram Channel
Hugging Face 推出 HF Skills,支持 OpenAI Codex 自动化模型训练全流程

Hugging Face 近日推出 Hugging Face Skills(HF Skills)仓库,使 OpenAI Codex 能够作为编码代理,自动化完成 AI 模型的训练、评估与发布全流程。该系统支持有监督微调(SFT)、直接偏好优化(DPO)及强化学习(RL)等生产级训练方法,覆盖 0.5B 至 7B 参数规模的模型。

Codex 通过接入该仓库,可自动验证数据集格式、匹配硬件资源并提交至 Hugging Face Jobs 执行。训练过程中,Codex 能实时监控 Trackio 指标、生成实验报告,并将模型导出为 GGUF 格式或直接发布至 Hugging Face Hub。目前该功能已兼容 Claude Code 及 Gemini CLI 等主流编码代理。

Huggingface

🍀在花频道 🍵茶馆聊天 📮投稿

via 科技圈🎗在花频道📮 - Telegram Channel
🇮🇳 印度要求 X 平台在 72 小时内整改 Grok AI 生成的淫秽内容

印度 IT 部于周五向马斯克的 X 平台发出整改令,要求其在 72 小时内对 AI 聊天机器人 Grok 进行技术和程序调整,以禁止生成涉及裸体、性化、色情或其他非法内容。此次监管行动源于用户和议员的举报,反映出 Grok 被用于制作女性的 AI 变造图像及其他淫秽信息。

根据指令,X 平台必须提交一份详细报告,说明其防止托管或传播淫秽、色情、粗俗、猥亵、涉及儿童色情或法律禁止内容的具体措施。印度政府明确警告,若 X 平台未能按要求合规,将可能失去在印度法律下的“安全港”保护,即不再享有对用户生成内容的法律免责豁免权。作为全球最大的数字市场之一,印度的这一决定可能对跨国科技公司产生后续影响。

(科技圈)

via 茶馆 - Telegram Channel
印度命令X修正Grok上的“淫秽”AI内容

印度已命令埃隆·马斯克的 X平台立即对其AI聊天机器人Grok进行技术和程序调整。此前用户和议员指出其生成 “淫秽” 内容,包括利用该工具生成的AI篡改女性图像。周五,印度信息技术部发布指令,要求马斯克的 X 平台对Grok采取纠正措施,包括限制生成涉及裸露、色情化、露骨性内容,或其他非法材料的内容。该部门还给予该社交媒体平台72小时,提交一份已采取措施报告,详细说明其为防止托管或传播淫秽、色情、低俗、不雅、露骨性内容、恋童内容或法律禁止的其他内容所采取的步骤。该指令警告称,若未能遵守要求,可能危及 X 在印度法律下对用户生成内容享有法律免责的“避风港”保护。

—— TechCrunch

via 风向旗参考快讯 - Telegram Channel
🤖 AI 编程工具广泛普及,效率提升与代码质量引发行业争议

行业现状与普及程度
AI 辅助编程已成为软件开发领域的主流工具。根据 Stack Overflow 2025 年的开发者调查,65% 的受访者每周至少使用一次 AI 工具。微软首席执行官萨提亚·纳德拉(Satya Nadella)与谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)均表示,其公司约四分之一的代码现由 AI 生成。Anthropic 首席执行官达里奥·阿莫代伊(Dario Amodei)曾预测,在短期内 AI 将编写 90% 的代码。目前的工具已从最初的自动补全演进为能够分析整个代码库、修复漏洞并生成文档的智能代理(Agents)。

生产力增益的争议
关于 AI 能否显著提升生产力,各方研究结论并不一致。GitHub、谷歌和微软的早期研究显示,开发者完成任务的速度提升了 20% 至 55%。然而,贝恩公司(Bain & Company)的报告称实际节省的时间“并不显著”。非营利研究机构 METR 的一项研究指出,尽管资深开发者认为 AI 使其速度提升了 20%,但客观测试显示其速度实际上降低了 19%。开发者分析公司 GitClear 的数据显示,自 2022 年以来,工程师产出的“持久代码”(未在数周内被删除或重写的代码)仅增加了约 10%,且伴随着代码质量指标的下降。

技术局限与安全风险
AI 工具在处理重复性代码(Boilerplate code)、编写测试和解释代码方面表现出色,但在处理复杂逻辑时面临挑战。由于大语言模型(LLM)的“上下文窗口”有限,它们难以理解大型代码库的全局关联,容易产生“幻觉”并导致代码库变得混乱。代码质量检查工具 Sonar 的研究发现,AI 生成的代码中超过 90% 的问题属于“代码异味”(Code smells),这些难以察觉的缺陷会增加技术债务。此外,安全研究人员指出,AI 可能会引用不存在的软件包,从而为黑客利用漏洞或进行数据投毒攻击提供机会。

行业转型与人才挑战
AI 的引入正在改变软件开发的流程与就业市场。斯坦福大学的一项研究显示,2022 年至 2025 年间,22 岁至 25 岁软件开发者的就业人数下降了近 20%。部分资深工程师反映,过度依赖 AI 工具可能导致编程本能退化。在企业层面,Coinbase 等公司已要求员工必须采用 AI 工具,但其高管承认,AI 生成的大量代码增加了中级开发人员进行代码审查的压力。为了应对维护难题,行业内开始出现“验证编程”(Vericoding)和“一次性代码”(Disposable code)等新方法,试图通过数学证明或模块化架构来解决 AI 生成代码的可靠性问题。

(MIT Technology Review)

via 茶馆 - Telegram Channel
Degraded Tab Availability

Jan 2, 20:17 UTC
Investigating - We are investigating this issue.

via Cursor Status - Incident History
Service Degradation - Cursor Tab

Jan 2, 20:14 UTC
Investigating - We are investigating this issue.

via Cursor Status - Incident History
🇫🇷 法国部长就 Grok 生成的性相关内容向检察官举报

法国政府部长已向检察官举报了由埃隆·马斯克旗下 xAI 公司的聊天机器人 Grok 在 X 平台上生成的性显性内容。在一份周五发布的声明中,部长们称这些“性与性别歧视”内容“显然违法”。此前,Grok 承认由于安全防护措施的疏漏,导致 X 平台上出现了“穿着极少衣物的未成年人图像”,并表示正在进行改进以防止此类情况再次发生。此外,法国部长还向法国媒体监管机构 Arcom 报告了相关内容,以核查其是否符合欧盟的《数字服务法案》(DSA)。

(路透社)

via 茶馆 - Telegram Channel
📱 三星 Galaxy S26 将集成 Perplexity 搜索引擎并升级 Bixby 对话功能

根据泄露的 One UI 8.5 固件信息,三星计划在 Galaxy S26 系列中为 Bixby 语音助手集成 Perplexity 搜索引擎。在处理网络查询请求时,Perplexity 将在后台运行并提供带有引用标注的答案,其标识将显示在搜索结果底部。此外,Bixby 将新增类似 ChatGPT 和 Gemini 的聊天机器人功能,支持自然语言对话及连续提问。该功能预计于 2 月底随 Galaxy S26 系列手机一同发布,初期仅供 2026 年旗舰机型使用,后续将逐步扩展至其他设备。

(科技圈)

via 茶馆 - Telegram Channel
5小时整理60页《Google Agent指南》,不懂Agent的包教包会

via 掘金人工智能本月最热 (author: 大模型教程)
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]