https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
谷歌搜索 AI 概览准确率仅 90%,易受虚假信息影响

《纽约时报》近日报道,谷歌的 AI 概览(AI Overviews)准确率约为 90%。这一数据的背后是每年超过 5 万亿次的搜索量,意味着每小时可能会生成超过 5700 万条错误答案,平均每分钟接近 100 万条错误信息。

初创公司 Oumi 对谷歌搜索进行评估,采用 SimpleQA 基准分析了 4326 次搜索结果。结果显示,谷歌的 Gemini 2 在去年 10 月的准确率为 85%,而到今年 2 月,Gemini 3 这一数字提升至 91%。然而,Oumi 的评估方法主要依赖于 AI 工具,这可能导致数据偏差。此外,谷歌对同一搜索查询可能生成不同的概览,增加了结果的不确定性。

具体来看,AI 概览与原始信息来源不符的比例已从 Gemini 2 的 37% 上升至 Gemini 3 的 56%。这意味着用户在看到某些概览时,往往会发现与之不符的链接或者准确的概览中却引用了错误的信息。有记者甚至发布虚假博客后,谷歌在次日的概览中引用了相关内容,显示出 AI 概览容易被操纵。

此外,用户斯蒂芬・潘瓦西在搜索摔跤手胡克・霍根(Hulk Hogan)的死讯时,AI 概览明确表示 “没有可信报告显示霍根已去世”,但页面下方却出现了 “霍根之死谜团加深” 的文章标题。这一自相矛盾的现象引发了用户对 AI 生成内容的可靠性质疑。

面对这些问题,谷歌发言人对 Oumi 的测试方法提出了质疑,认为其评估并未能真实反映搜索行为。

划重点:

🔍 AI 概览的准确率约为 90%,每小时可能产生 5700 万条错误答案。

📈 Gemini 3 的准确率提升至 91%,但与原始信息不符的比例已升至 56%。

🤖 AI 概览易受虚假信息影响,用户对其可靠性产生质疑。


via AI新闻资讯 (author: AI Base)
腾讯正式发布“龙虾”QBotClaw:国内首个支持主流大模型API自由配置的AI浏览器

今日,腾讯正式发布国内首个AI驱动的浏览器产品“龙虾”QBotClaw,标志着浏览器正从单纯的网页访问工具演变为具备全场景感知与复杂任务执行能力的AI助理。

该产品核心亮点在于其极高的开放性,支持用户自由配置国内各大主流大模型的API Key,打破了以往AI浏览器与单一模型深度绑定的局限。首期上线的Mac版本已深度集成QQ浏览器Skill,Windows版本也预计于近期推出,旨在降低大模型使用门槛,实现“人人都能用上龙虾”的行业普惠目标。

在技术架构上,QBotClaw通过内置的X5use高精度识别技术为浏览器赋予了敏锐的视觉感知,结合上下文感知能力,用户仅需通过简单的指令即可让浏览器自主执行跨页面的复杂任务。除了完全兼容OpenClaw技能生态外,QBotClaw还打通了移动端与桌面端的壁垒,用户通过微信扫码绑定Clawbot后,即可实现对电脑端的远程“遥控”操作。

当前,全球大模型领域正处于从“对话式交互”向“智能体执行”进化的关键节点。腾讯此次推出QBotClaw,不仅是通过AI重构浏览器这一核心流量入口,更是试图利用其开放的API配置机制,构建一个兼容并包的AI应用生态。

via AI新闻资讯 (author: AI Base)
Anthropic推出新模型 暂时仅限科技巨头试用

Anthropic正将一款尚未公开发布的顶级AI模型武装给全球最重要的科技企业,以应对AI驱动的网络安全威胁。周二,Anthropic宣布成立了名为 “Project Glasswing” 的行业联合项目,联合亚马逊、苹果、微软、思科等公司提供工具,将旗下新一代前沿模型Claude Mythos Preview用于关键软件基础设施的漏洞扫描与修复。Anthropic表示,正是由于这一模型能力过于强大,目前暂无向公众开放的计划。在这一背景下,Project Glasswing被定位为先发防御行动,在同等能力向更广泛行为者扩散之前,优先用于防御目的。

—— 华尔街见闻CNBC彭博社

via 风向旗参考快讯 - Telegram Channel
Google力推在Gmail中使用Gemini 强调不会用用户邮件训练AI

Google正进一步将其生成式人工智能模型 Gemini 深度集成进 Gmail,希望用户在处理邮箱时更多依赖这一工具,同时重点向外界强调隐私与安全不会因此受损。

iframe (www.youtube.com)

目前,Gemini 已在 Gmail 中承担多种辅助功能,例如生成和润色邮件内容、提供回复建议、校对措辞、对收件箱进行优先级排序以及自动概括邮件内容等。Google在最新博文中表示,即便用户在 Gmail 中调用 Gemini,这些邮件数据依然是“完全安全且私密”的。

Google特别强调,旗下所谓“基础”人工智能模型(包括 Gemini 在内)不会使用用户的个人邮件内容进行训练。公司称,Gmail 在设计之初就以安全为前提,用户在 Gmail 里交给 Gemini 处理的任务,都是在一个隔离环境中完成的。

其次,从访问形态上看,Gemini 对邮箱数据的使用是“短暂”的:模型只在执行用户当前指令时短时间访问相关邮件数据,任务完成后即失去对收件箱内容的访问权限,从流程设计上降低了数据泄露的风险。

Gmail 产品副总裁 Blake Barnes 将这一过程比喻为:Gemini 暂时走进一间“私人房间”,房间里放着用户的私密数据,模型利用这些信息完成指定任务后便离开房间,随后不再接触这些信息。

在过去一段时间内,业界已有多起因 AI 模型处理不当而导致数据外泄的案例,这也是Google此番频频强调其做法“与同行不同”的背景。例如,此前有报道称,微软曾被发现意外将用户的机密邮件上传至 Copilot 以进行摘要处理,引发外界对隐私和数据使用方式的质疑。在这样的氛围下,Google显然不希望被归入同一类公司,因此一方面通过持续强化 Gemini 在 Gmail 中的功能吸引用户使用,另一方面又不断向用户保证其隐私和安全不必因此担忧。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:cnBeta.COM)
DLSS 5被全民抵制 71%玩家拒绝:效果再好也不开

自NVIDIA于上个月正式公布DLSS 5技术以来,围绕这场“AI与图形融合”革命的争议就从未停歇。为了一探玩家真实态度,PC Gamer近日发起了一项大规模读者调查。结果显示,绝大多数玩家对这项新技术持抵制态度。

调查数据显示,高达71%的受访读者表示,他们“无论如何都不会被说服开启DLSS 5”。更令人惊讶的是,其中37%的玩家——也是所有选项中占比最高的人群——明确表示:“无论该功能看起来有多好,从道德层面就反对它,永远不会启用。”

当然,并非所有人都对DLSS 5关上大门。调查中:

· 10%的读者表示已经完全被说服,准备好今年秋季该功能上线后第一时间开启。

· 另外9%的受访者愿意在特定游戏中启用DLSS 5。

· 剩余10%的玩家则表示,如果最终游戏效果比首批宣传素材中那种“明显的AI生成感”更好,他们愿意开启。

DLSS 5被NVIDIA CEO黄仁勋称为“图形的GPT时刻”,其核心技术是“将可控3D图形与生成式AI融合”,通过分析单帧画面的色彩与运动向量,实时推断并生成照片级的光照与材质。但批评者担心,这可能导致游戏角色形象趋于同质化的“AI脸”,侵蚀开发者的原始艺术意图。

对此,NVIDIA方面强调,DLSS 5为开发者提供了强度、色调映射、遮罩等精细控制选项,以确保“保留游戏艺术家原本的创作愿景”。不过,从《星空》的演示效果来看,这一承诺能否兑现仍有待观察。

按计划,DLSS 5将于2026年秋季正式上线,首批支持的游戏包括《刺客信条:影》《星空》《上古卷轴4:湮灭 重制版》《霍格沃茨之遗》《生化危机:安魂曲》《永劫无间》等来自Bethesda、Capcom、育碧、腾讯等大厂的作品。

NVIDIA目前展示的DLSS 5演示需要两块RTX 5090显卡协同运行——一块负责路径追踪渲染,另一块专门驱动DLSS 5组件。不过官方表示,实验室中已实现单块显卡运行,最终版本的硬件门槛有望大幅降低。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:3DMGame)
Anthropic挖走微软高管领导基础设施建设

Anthropic PBC 已聘请微软公司一名资深高管,负责建立相关基础设施,以支撑其人工智能服务日益增长的应用需求。埃里克·博伊德周二在领英发文称,他将出任 Anthropic 基础设施负责人。他写道:“人工智能正以惊人的速度发展,过去六个月,尤其是近两个月,Claude Code所展现的影响力,充分印证了人工智能的无限潜力。”博伊德此前负责管理微软人工智能平台,助力客户及内部团队部署大语言模型。在加入微软之前的16年里,他曾在雅虎担任管理职务。Anthropic首席技术官拉胡尔·帕蒂尔在领英说:“ 他在企业级基础设施管理方面的经验,将助力我们满足全球用户创下历史纪录的使用需求。”

—— 彭博社

via 风向旗参考快讯 - Telegram Channel
15 秒 1080P 音画同步!爱诗科技 PixVerse C1 发布:影视级大模型正式“炸场”

4月8日,爱诗科技正式发布了首个面向影视行业的专业大模型 —— PixVerse C1。这不仅是一款简单的视频生成工具,更是一套试图重塑影视工业流程的“全能创作引擎”。目前,该模型已同步上线PixVerse Web 端及 API 平台。

核心亮点:从“单镜头”到“自动分镜”的飞跃

PixVerse C1展现了远超前代产品的技术厚度,其核心能力直击影视制作痛点:

● 超长高清出片: 最高支持 15秒1080P 高清视频生成,彻底打破了短秒数生成的局限。
● 首尾帧控场: 支持文生、图生及参考生,特别强化了“首尾帧”控制能力,确保视频逻辑的连贯性。
● 原生音画同步: 出片即自带音效,实现了真正意义上的音画一体,无需后期二次配音。
● 智能分镜大师: 最令行业惊叹的是,PixVerse C1的所有能力均可跟随提示词指令自动分镜,极大地降低了分镜头脚本的转化难度。

行业背景:国产视频大模型的“垂直化”之路

在 Sora 尚未全面开放、全球视频生成技术加速迭代的背景下,爱诗科技选择深耕影视垂直赛道:

● 生产力导向: 与娱乐化工具不同,PixVerse C1更加强调画质的细腻程度(1080P)与生成的受控能力。
● 生态开放: 通过 Web 端和 API 平台的同步上线,爱诗科技正试图构建一个从独立创作者到大型影视公司的全覆盖生态。

同期动态:科技与能源市场的“冷暖交替”

在爱诗科技引爆视频生成领域的同时,全球市场正处于复杂的情绪波动中:

● 科技新势力: 银河航天近期在天津成立了新公司,注册资本500万,持续加码卫星通信制造领域。
● 地缘局势缓和: 据界面新闻报道,伊朗已接受临时停火提议,并披露了全部10项停战条款。这一信号极大缓解了全球能源市场的紧张情绪。
● 股市回暖: 受技术突破与局势趋稳利好,今日 恒生科技指数 跳空高开,展现出强劲的估值修复势头。

结语:AI 正在“执导”未来

当大模型不仅能画画,还能自动分镜、自动配音并生成1080P 高清影像时,影视行业的门槛正在被悄然重构。PixVerse C1 的发布,或许预示着一个“一人一机即剧组”的时代正加速到来。

via AI新闻资讯 (author: AI Base)
Google为Gemini增设安全措施 应对诉讼增多与AI风险加剧

人工智能安全方面的压力正开始直接体现在产品设计上。Google正在其Gemini聊天机器人内部推出新的心理健康保障措施,此举可能反映出整个AI生态系统(包括竞争对手OpenAI)面临的法律和监管审查日益增加。

此次更新正值一系列诉讼和公众担忧表明,与AI工具的互动在某些情况下可能导致有害的现实后果,这迫使开发者重新思考这些系统在敏感场景下的响应方式。

Google的策略侧重于更早、更明显的干预。当对话内容表明存在潜在的自杀或自残风险时,Gemini现在会显示危机热线信息,同时还有一个新的“可获得帮助”模块,旨在引导用户找到支持资源。

该公司还在调整聊天机器人的行为,以避免强化错误信念,转而尝试将主观体验与客观事实区分开来。这些变化正值有报道称用户与AI系统形成了强烈或扭曲的关系,有时与妄想思维或极端行为有关,这加大了公司实施更强有力保障措施的压力。

这一背景日益受到法律行动和政策关注的塑造。佛罗里达州一名男子家属在3月提起的诉讼称,该男子使用Gemini导致了其健康状况迅速恶化并最终自杀,尽管据报道该聊天机器人曾多次引导他联系危机资源。

与此同时,立法者已开始审查AI聊天机器人可能带来的潜在风险,尤其是对年轻用户的风险。Google还承诺在未来三年内投入3000万美元用于全球危机支持服务,这一举措可能预示着随着AI采用率的加速,该公司正努力在持续部署AI与履行可见的责任之间取得平衡。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:环球市场播报)
马斯克打官司要求撤换OpenAI掌门人 主张恢复该公司非营利组织身份

埃隆·马斯克正寻求将人工智能初创公司OpenAI的首席执行官兼董事会成员Sam Altman解除职务。这是这位亿万富翁针对ChatGPT开发商转型为营利性公司一事所发起的法律挑战的一部分。

马斯克在周二提交的一份法庭文件中表示,他提起诉讼的目标是“撤销OpenAI向营利性转型及其重组”。他称,这将包括解除Altman以及总裁Greg Brockman的领导职务。他同时寻求法院下令,恢复该公司作为非营利性研究组织的地位。

这位世界首富还在文件中表示,他希望本月晚些时候开始的陪审团审判中,与Altman及OpenAI对簿公堂,若他胜诉,获得的任何赔偿金应当拨付给该初创企业的慈善分支机构。

他在文件中称:“马斯克拟寻求的救济措施,严格对应其提起本诉讼的目的:防止一家公共慈善机构——他共同创立且在其成长期曾是主要支持者的机构——屈从于私人营利性利益。”

OpenAI周二在社交媒体帖文中表示,马斯克的诉讼“仍不过是一场骚扰行动,由自负、嫉妒以及想要拖慢竞争对手步伐的意图所驱动”。

相关文章:

马斯克回应OpenAI股票在二级市场遇冷:“毫不意外”

via cnBeta.COM - 中文业界资讯站 (author: 稿源:环球市场播报)
DeepSeek网页版升级:上线“专家模式” 擅长处理长程、复杂问题

昨日晚间,DeepSeek 网页端悄然上线了“快速模式”和“专家模式”两种交互模式,支持简洁搜索和长程、复杂问题处理。实测发现,此次升级推出的“快速模式”,更接近于此前版本DeepSeek的直接命名改变。相比之下,“专家模式”则新增了编程、法律、医学等领域的专业知识咨询能力。

在数理问题处理上,专家模式较快速模式有着更优的表现。当被问及7米长的甘蔗能否通过高2米宽1米的门时,快速模式给出的是“不能通过”,但专家模式则给出了“可以通过”的确定性答案,且给出了甘蔗横截面小可像“长矛一样将其穿过”的形象比喻。

在业内人士看来,最新上线的专家模式疑似用了更大、更强的模型——很可能就是 DeepSeek V4 正式版的某个形态。但由于其目前不支持文件上传,也没有多模态能力等,除长程、复杂问题应答能力更优化外,更多能力仍有待DeepSeek官方进一步释放。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:新浪科技)
英特尔宣布加入马斯克 Terafab 项目,协力打造太瓦级超级芯片工厂

英特尔(Intel)昨日正式宣布加入埃隆·马斯克(Elon Musk)旗下的 Terafab AI 芯片项目,与 SpaceX、特斯拉(Tesla)及 xAI 达成战略合作,共同推进这一目前全球规模领先的芯片制造计划。特斯拉官方随后通过 X 平台证实了这一消息,将 Terafab 定义为集逻辑芯片、存储与先进封装于一体的综合性半导体制造工程。

根据合作规划,Terafab 的核心目标是实现每年1太瓦(TW)的算力产出,旨在为下一代 AI 模型及机器人技术提供底层算力支撑。该项目最早由马斯克于2026年3月披露,选址于德克萨斯州奥斯汀市。按照设计构想,园区内将建设两座先进工厂:一座专注于驱动特斯拉电动汽车及人形机器人的算力需求,另一座则致力于构建专为太空环境设计的 AI 数据中心。

此次英特尔的深度参与,标志着 Terafab 正式进入多巨头协同阶段。通过整合英特尔的制造能力与马斯克旗下企业的应用场景,该项目试图打破当前算力供给的物理瓶颈。在当前全球大模型竞争向系统级工程演进的背景下,Terafab 的推进不仅体现了算力基础设施的垂直整合趋势,更预示着未来 AI 算力将从地面延伸至近地空间,重塑全球半导体产业布局与算力分配格局。

via AI新闻资讯 (author: AI Base)
GLM-5.1 发布:一个能独立工作的智能模型,持续作业长达 8 小时

在最新发布的 GLM-5.1中,这一开源模型展示了其卓越的智能水平,能够在长达8小时的任务中独立工作,完成复杂的工程项目。与之前仅能进行短时间交互的模型相比,GLM-5.1在代码能力和长程任务执行上都有显著提升。

该模型在全球开源模型中表现出色,在多个代码评测基准上取得了优异成绩。在 SWE-Bench Pro 基准测试中,GLM-5.1成功定位并修复高难度的工程 Bug,超越了现有的顶级模型,如 GPT-5.4和 Claude Opus4.6。这标志着其在专业软件开发领域的强大能力。

GLM-5.1的工作方式让人惊叹。它能够在晚上构建一个完整的 Linux 桌面系统,历时8小时,执行超过1200步,早在20分钟时便交出了初步成果。最终交付的系统功能完备,相当于四名开发人员一周的工作量。此外,它在向量数据库优化和真实机器学习负载的自我进化能力方面也表现突出,展现了 AI 在工程领域的潜力。

这款模型的最大亮点在于它能够自我评估和优化。GLM-5.1在面临复杂任务时,不仅能识别并解决问题,还能主动调整策略,以实现最佳结果。这种能力为 AI 在实际应用中的发展提供了新的方向。

GLM-5.1的发布标志着一个新的技术时代的开始,开发者们只需给予指令,便能期待它在长时间内的高效工作。

GitHub:https://github.com/zai-org/GLM-5
Hugging Face:https://huggingface.co/zai-org/GLM-5.1
ModelScope:https://modelscope.cn/models/ZhipuAI/GLM-5.1


划重点:

🌟 GLM-5.1能够在8小时内独立完成复杂任务,提升了代码能力。

💻 在多个代码评测基准上表现卓越,超越了许多顶尖模型。

🔧 具备自我评估与优化能力,展现了 AI 在工程领域的广泛应用潜力。


via AI新闻资讯 (author: AI Base)
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]