https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
OpenAI 联手高通联发科研发手机芯片,立讯精密斩获独家代工并定于2028年量产

知名行业分析师郭明錤近日透露,人工智能巨头 OpenAI 正计划深度介入硬件底层生态,联合移动芯片双雄高通(Qualcomm)与联发科(MediaTek)共同开发专用手机芯片,并选定立讯精密作为独家制造合作伙伴,该系列芯片预计将于2028年实现量产。这一战略动作标志着 OpenAI 正试图通过软硬件一体化垂直整合,重新定义移动终端的交互范式。

据悉,搭载该芯片的 AI 手机将彻底颠覆现有的“App 为中心”的交互逻辑,转向以 AI 智能体(AI Agent)为核心的系统架构。届时,用户无需频繁切换或手动打开特定应用程序,即可通过终端直接执行复杂任务。在技术实现上,该设备将依托端侧小模型与云端大模型的协同计算,在保障隐私与响应速度的同时,充分发挥云端算力的深度推演能力。

OpenAI 此番进军自研芯片领域,不仅是为了摆脱单一硬件供应商的制约,更是为了建立一套适配其模型生态的端侧运行环境。随着生成式 AI 迈入智能体时代,传统的移动操作系统架构正面临重塑。若该项目如期落地,将加速手机从“智能工具”向“原生 AI 终端”的本质进化,进一步压缩传统应用分发市场的生存空间,重塑全球移动半导体产业的竞争格局。

via AI新闻资讯 (author: AI Base)
谷歌计划投资 Anthropic,或将倾注 400 亿美元于 AI 竞争

谷歌计划向人工智能公司 Anthropic 投资 100 亿美元,并可能在未来追加 300 亿美元,以加强两者的合作关系。此次投资将以 Anthropic3500 亿美元的估值进行,这一数字与其今年 2 月融资时的水平相当。

在此之前,Anthropic 于 2 月成功完成了一轮 300 亿美元的融资,近期也从亚马逊获得了 50 亿美元的投资,估值同样为 3500 亿美元,且未来也有追加 200 亿美元的可能。Anthropic 因其 AI 编程工具 Claude Code 而受到了广泛关注,该工具能够显著提高软件开发的效率,迅速成为硅谷工程师的热门选择。

谷歌将在未来五年为 Anthropic 提供相当于 5 吉瓦的算力,并提供多达 100 万颗 TPU 芯片,以支持其扩展计算能力。TPU 是谷歌研发的一种高效能处理器,广泛应用于 AI 行业。谷歌早前已向 Anthropic 投资约 30 亿美元,因此此次投资将进一步巩固双方的合作。

尽管合作关系密切,谷歌高层对 Anthropic 在 AI 编程市场的迅速崛起感到担忧,二者在开发具备人类水平能力的 AI 方面可能会形成竞争。此外,Anthropic 正面临一些挑战,包括被美国国防部认定为 “供应链风险” 所引发的法律抗辩问题,以及外界对其与大型科技公司之间投资与算力交易模式的质疑。

目前,Anthropic 还在积极考虑于今年 10 月启动首次公开募股(IPO),以满足日益增长的产品需求。

via AI新闻资讯 (author: AI Base)
OpenAI CEO 奥尔特曼发布五大原则:致力于让 AGI 惠及全人类

OpenAI 的首席执行官萨姆・奥尔特曼(Sam Altman)发布了关于人工智能(AI)发展的五项核心原则,强调公司将确保人工智能技术能够惠及全人类。他认为,AI 拥有改变社会的潜力,未来的科技发展可能会带来更深远的变革,甚至超越历史上蒸汽机和电力的影响。

奥尔特曼在声明中指出,AI 的进步不仅取决于技术本身,更需要确保这一技术不会集中在少数企业或个人手中。他的目标是将真正的通用人工智能(AGI)交到尽可能多的人手中,避免技术的权力和资源被少数人掌控。

为了实现这一目标,OpenAI 提出了五大原则:

1.  民主化 :OpenAI 将抵制技术权力的集中,确保每个人都能使用 AI,并通过公平的程序参与 AI 决策的制定。

2.  赋能 :OpenAI 相信 AI 可以帮助每个人实现自己的目标,让人们的生活更加充实,推动社会整体进步。同时,他们承诺在开发和部署 AI 时,最大限度地减少潜在的危害。

3.  普惠繁荣 :OpenAI 希望每个人都能享受到更高质量的生活,利用强大的 AI 技术创造新的价值,特别是在科学发现方面。为此,政府可能需要探索新的经济模式。

4.  韧性 :面对 AI 带来的新风险,OpenAI 将与各方合作,逐步应对挑战。他们将通过迭代部署的方式,确保在技术发展和社会适应之间保持平衡。

5.  适应性:OpenAI 强调,在应对未来的不确定性时,必须根据新知识不断调整策略,并保持透明度。他们认识到在不同阶段,可能需要在赋能和韧性之间进行权衡。

奥尔特曼还回顾了 OpenAI 在发布 GPT-2 时的谨慎态度,强调了迭代部署策略的重要性。未来,OpenAI 将继续关注技术进步对社会的影响,努力学习和调整,以推动更积极的社会变革。

via AI新闻资讯 (author: AI Base)
郭明錤:OpenAI正在做手机 2028年量产

天风国际证券知名分析师郭明錤今天发文表示,最新产业调查显示,OpenAI正在与联发科、高通合作开发手机处理器。立讯为独家系统协同设计与制造商,预计将于2028年量产。AI智能体重新定义手机,用户的目的不再是使用一堆应用程序,而是通过手机执行任务并满足各种需求。这从根本上改变了对手机的认知。 郭明錤还给出了手机界面概念设计图,并与当前手机 (以iPhone为例) 进行对比。他还解释了OpenAI为什么要做手机?一、全面掌控: 唯有完全掌控操作系统与硬件,才能提供全方位的AI智能体服务。二、获取实时状态: 只有手机能拥有用户一切的“当下状态”,这是实时AI智能体推理服务最重要的输入信息。三、规模优势:在可预见的未来,手机仍是数量规模最大的终端设备。

—— 凤凰网科技

via 风向旗参考快讯 - Telegram Channel
亚毫米级精准对位:小米开源 VLA 大模型后训练全流程

小米近期宣布正式开源其视觉-语言-动作(VLA)大模型 Xiaomi-Robotics-0的真机后训练全流程。这一举措标志着小米在具身智能领域迈出重要一步,旨在让机器人能够更快速地通过少量数据掌握复杂的操作技能。

二十小时练就“穿针引线”

基于预训练基座,研发团队仅利用约20小时的任务数据进行真机后训练,便让机器人掌握了将耳机精准收纳进盒的高难度动作。该过程不仅要求极高的空间感知精度,还需克服极低表面粗糙度带来的位移干扰。

模型必须在亚毫米级的公差范围内完成对位,并能实时修正动作偏差。这种“连续丝滑”的执行能力,证明了 Xiaomi-Robotics-0在处理高精度装配任务时的卓越潜力。

开源生态推动生产力进化

为了让该模型真正成为“开箱即用”的工具,小米此次不仅开放了模型权重,还公布了技术报告与源代码。这种全链条的开源模式,极大降低了开发者进入具身智能领域的门槛。

此前,该模型在国际权威平台上已表现出色,位列全球下载榜前列。随着后训练流程的公开,全球开发者将能共同优化机器人的感知与执行逻辑,加速 AI 机器人走进现实生产生活的进程。

项目网站:https://robotics.xiaomi.com/xiaomi-robotics-0.html
开源代码:https://github.com/XiaomiRobotics/Xiaomi-Robotics-0

via AI新闻资讯 (author: AI Base)
重拳出击!滴滴首度公开安全AI模型,顺风车风险防控进入“人机协同”新阶段

在近期举办的顺风车安全治理开放日上,滴滴首次向外界展示了其在安全技术领域的最新进展。针对长期困扰行业的反作弊整治及未乘车收费等痛点,平台通过引入前沿的AI技术手段,取得了显著的阶段性治理成效。

智能化判责让违规行为无所遁形

为了应对顺风车场景中高频出现的各类纠纷,滴滴全面推行AI识别与智能判责系统。该系统能够实现风险的主动捕捉与自动处置,极大提升了响应速度。数据显示,在AI模型的辅助下,涉及“未乘车却产生费用”的投诉量大幅下降了97.5%,有效保障了用户的合法权益。

警企联动严厉打击黑产作弊

在打击非法作弊器方面,滴滴展现了零容忍的态度。2024年以来,平台积极配合警方开展专项治理行动,累计推动相关立案27起。通过技术溯源与线索摸排,目前已成功抓捕违法犯罪人员96人,从源头上震慑了试图破坏平台规则的黑产势力。

安全AI模型全面赋能风险防控

本次开放日的重头戏在于安全AI模型的正式亮相。目前,该模型已深度接入安全专家工作台。升级后的系统不仅使风险初步研判的效率提升了21%,其整体风险识别准确率更是达到了93.2%。这种“人机协同”的新模式,标志着平台对潜在安全隐患的预判和处置能力迈上了新台阶。

挑战犹存呼吁文明出行

尽管技术手段在不断优化,但顺风车复杂的出行环境仍给平台治理带来了一定挑战。滴滴方面表示,安全生态的构建需要每一位参与者的共同努力,并呼吁广大司乘用户严格遵守平台规范,通过制度与技术的双重保障,共同营造安全、文明的出行环境。

via AI新闻资讯 (author: AI Base)
Anthropic发布Project Deal:Claude完成186笔自主交易,交易额超4000美元

Anthropic于2026年4月24日低调发布名为“Project Deal”的内部实验研究,展示了AI代理在真实市场环境中的自主谈判与交易能力。该实验在基于Slack的办公室内市场进行,由Claude模型代表69名员工执行买卖职能。实验结果显示,在涉及真实资金往来的环境下,Claude代理在逾500件上架商品中成功促成186笔交易,总成交额突破4000美元。

技术层面,Anthropic通过并行市场测试对比了不同规格模型的表现,证实Opus模型在谈判博弈中的获利能力显著优于Haiku模型,且人类参与者在交互过程中未能察觉模型性能带来的策略差异。这一结果标志着“代理经济”已从理论模拟转向实操阶段,AI不仅能理解复杂的个性化指令,更能在多轮议价中实现利益最大化。

受此消息影响,传统电商平台eBay股价在当日收盘下跌约4.5%,市场对AI自主寻价能力冲击传统撮合交易模式的担忧日益凸显。业内分析认为,随着AI代理具备闭环交易能力,未来商业交互或将向“模型对模型”的形态演进。这种去中介化的技术趋势正倒逼传统电商平台重新评估其商业模式,AI不再仅仅是辅助搜索的工具,而正演变为具备独立决策能力的商业主体。

via AI新闻资讯 (author: AI Base)
路痴救星来了?高德发布首款AI全模态导航伴侣

在近日举行的发布会上,高德地图正式推出了全新的“AI伴行”产品,这标志着地图软件正在从传统的工具属性向智能化决策助手进化。作为行业内首款针对真实世界出行场景打造的全模态伴随式产品,“AI伴行”旨在为用户提供更具人性化、实时化的导航体验。

深度语义理解,解决“看不懂地图”的痛点

很多用户在步行导航时,常会遇到方向指示不够直观、即便盯着屏幕也找不到北的尴尬。高德“AI伴行”通过接入QwenPaw任务处理框架,赋予了导航系统强大的自然语言理解能力。它不仅能听懂用户的口语化需求,还能通过实时感知用户所处的位置及周边环境,主动识别街景并结合庞大的地图数据库,给出精确的行动建议。

全场景覆盖,复杂需求一语即达

除了基础的指路功能,该产品在处理复杂出行逻辑和景区导览方面也展现出显著优势。例如,在大型景区内,它可以化身为实时“私人导游”,根据位置变化提供讲解与路线规划。这种交互方式打破了以往机械的语音播报,用户只需通过“按住说话”的简单操作,即可与系统进行深度沟通,获得更具逻辑性的出行分析。

技术框架支撑与未来开放计划

“AI伴行”的诞生离不开四项核心技术能力的支撑,其底层逻辑重塑了人与地图的交互关系。目前,该功能已进入测试阶段,首批开启步行导航的用户将率先获得体验资格。高德方面表示,后续将根据测试反馈,逐步扩大开放范围,让更多用户体验到AI技术为日常出行带来的效率革命。

via AI新闻资讯 (author: AI Base)
“精英”底色凸显:调查显示 Claude 用户群体富裕程度远超竞品

根据 Epoch AI 与 Ipsos 最新的联合调查,Anthropic 旗下的 AI 助手 Claude 在美国展现出了极其独特的用户画像。数据显示,高达 80% 的 Claude 成年用户来自年收入超过 10 万美元的家庭,这一比例在所有主流 AI 助手中位居榜首。

高净值人群的垂直选择

相比之下,其他竞争对手的用户财富集中度明显较低。微软 Copilot 以 64% 的高收入用户比例位列第二,而行业领头羊 ChatGPT 与 Grok、Google Gemini 均持平于 56%,社交巨头旗下的 Meta AI 则仅为 37%,其用户构成与 Claude 形成了鲜明对比。

尽管用户“含金量”极高,但 Claude 在整体市场渗透率上仍处于追赶状态。在高收入群体中,ChatGPT 依然凭借 37% 的市场份额占据统治地位,而 Claude 的实际覆盖率仅为 6%,这意味着它目前更像是一款服务于特定精英阶层的垂直化工具。

技术鸿沟或加剧经济差距

值得警惕的是,这种用户分布的差异可能带来深层的社会影响。Anthropic 此前的研究表明,更强大的 AI 模型在复杂交易谈判中能为用户争取到更多利益,而使用弱势模型的用户往往在无意识中处于劣势。

如果高性能 AI 模型持续向高收入群体集中,这种“数字杠杆”可能会进一步扩大现有的经济差距。目前,仍有 44% 的高收入人群尚未接触人工智能,随着技术的深度渗透,AI 助手的使用偏好或将成为未来职业竞争力和财富积累的关键变量。

via AI新闻资讯 (author: AI Base)
AI 是一种压迫性技术

2026-04-26 22:05 by 夜袭动物园

Ali Alkhatib 认为 AI 是一个政治项目,其意图是将权力和能动性从个人和组织转移至中心化的权力结构。这些权力结构目前主要集中在少数科技巨头以及它们投入巨资的 AI 实验室手中。现代 AI 系统脱胎于暴力也是基于暴力:其第一种暴力形式是数据获取的暴力,AI 公司的爬虫无视任何规则抓取数据;第二种暴力形式发生在数据标注和清洗过程中;第三种暴力形式则是其数据集带有殖民主义的西方视角;第四种是利用 AI 工具对边缘群体施加暴力,比如 grok 的比基尼改图。AI 被认为能提高生产力,但实际过程中它却是被用于压榨员工。企业通过指出 AI 可取代员工迫使员工更努力工作,而不是要求加薪或改善工作条件,这种威胁削弱了员工的个人力量,让员工认为自己没有价值。自 ChatGPT 流行以来,制作虚假信息和操纵叙事比以往任何时候都认为,破坏了人类建立起来的可靠生产、验证和传播可信信息的基础设施,如果没有对 AI 输出的验证,使用者将是用信仰取代可信度。

https://tante.cc/2026/04/21/ai-as-a-fascist-artifact/

#评论

via Solidot - Telegram Channel
别再套用旧指令!OpenAI 发布 GPT-5.5 提示词指南:越简单越好

随着人工智能技术的飞速演进,OpenAI 近期为其最新的 GPT-5.5 模型发布了全新的提示词(Prompt)官方指南。这份指南传达了一个核心信号:开发者必须摒弃过去针对旧模型编写的冗长指令,转向更加精简、以结果为导向的沟通方式。

旧指令成为性能绊脚石

OpenAI 明确警告,将旧版本的提示词堆栈直接迁移到 GPT-5.5 可能会适得其反。过去由于模型推理能力有限,开发者往往需要提供极其详尽的步骤指导,但在更聪明的 GPT-5.5 面前,这些多余的描述反而会缩小模型的搜索空间,导致回答变得生硬且机械。

官方建议开发者从零开始构建指令,仅保留目标产出、成功标准和必要约束。与其事无巨细地指挥模型“第一步做什么、第二步做什么”,不如直接告诉它“解决这个问题,成功标准是什么”,让模型利用其增强的推理效率自行寻找最优路径。

角色定义重回核心地位

有趣的是,曾经在提示词社区引发争议的“角色定义”在 GPT-5.5 时代重新获得了官方认可。OpenAI 推荐了一套包含七个部分的提示词结构,并将“角色定义”置于首位,用于设定模型的身份背景和工作职能。

此外,为了降低流式输出时的感知延迟,指南还建议加入“开场白”机制,即在执行复杂任务前先发送一两句确认信息。这种针对 GPT-5.5 深度优化的策略,不仅能提升模型的逻辑准确性,还能显著改善最终用户的使用体验。

via AI新闻资讯 (author: AI Base)
DeepSeek核心专家加盟,元戎启行全面转向大模型技术路线

在北京车展这一汽车行业盛会上,前DeepSeek多模态技术的核心研究员阮翀以元戎启行首席科学家的身份正式亮相,这一动作标志着元戎启行在自动驾驶技术布局上的重大转向。

元戎启行首席执行官周光在现场明确表示,多模态大模型在 2026 年初已经迎来了突破性的进展。他指出,相较于上一代技术,以大模型为基座的自动驾驶路线在起点上就展现出了压倒性的优势。过去业内普遍采用的“小模型”架构存在难以克服的“跷跷板效应”——即优化了某一场景的性能,往往会损害另一场景的表现,导致无法实现全场景的安全覆盖。基于此,元戎启行已决定全面押注大模型路线。

首席科学家阮翀进一步详细介绍了公司的技术转型细节。目前,元戎启行正致力于从多个分散的小模型架构向统一的基座大模型架构过渡。在这一全新的架构下,系统被细化为驾驶、分析、评论三个具备特定功能的子模型,从而实现更精准的决策与处理。

技术效率的提升同样令人瞩目。得益于架构的优化,公司目前的单次模型迭代周期已大幅缩短,从原先的 100 多小时压缩至仅需 10 余小时。这种研发速度的量级提升,将为自动驾驶技术的快速演进和安全落地提供强有力的支撑。

via AI新闻资讯 (author: AI Base)
英伟达吴新宙:自动驾驶的“ChatGPT时刻”已至,L4 级量产不再是梦

在物理AI的广阔版图里,自动驾驶被视为最先能啃下的“硬骨头”。近期,英伟达全球副总裁吴新宙在北京的一场沟通会上,分享了这家计算巨头在智能驾驶领域的宏大蓝图,不仅拆解了支撑辅助驾驶的“五层蛋糕”体系,更明确给出了L4级自动驾驶落地的具体时间表。

“五层蛋糕”构建全栈生态

英伟达已不再满足于单纯的芯片供应商角色,而是试图通过“三台计算机”(车端推理、云端训练、仿真验证)构建一个完整的服务体系。吴新宙将其形象地称为“五层蛋糕”:从底层的硬件平台Hyperion,到操作系统、开放模型Alpamayo、仿真工具链,再到最顶层的云端基础设施。

这一体系的核心在于降低车企的开发门槛。特别是在从模块化转向“端到端”架构的过程中,英伟达利用其强大的仿真能力,每天可进行200万次场景验证,极大提升了模型训练效率。目前,英伟达正积极推动各大车厂接入Hyperion平台,以期实现标准化与规模化的飞跃。

视觉派的坚持与冗余策略

在技术路线的选择上,吴新宙是一位坚定的“视觉派”。他认为视觉传感器的像素密度和上限远超激光雷达,足以支撑高阶辅助驾驶。然而,针对要求更高的L3和L4级系统,英伟达依然将激光雷达视为不可或缺的安全冗余。他透露,英伟达正与欧美供应商合作,为高阶智驾方案寻找稳定的硬件支持。

L4落地的倒计时:2028年覆盖30城

对于行业内关于“直接跳过L3进入L4”的争论,吴新宙持务实态度。他认为L3在解放人力方面具有即时价值,而L4则需要庞大的云端运营能力支持。英伟达给出的路线图显示:2025年将交付与奔驰合作的量产项目;2027年联手谷歌开启L4试点;到2028年,英伟达计划携手Uber,在洛杉矶奥运会期间提供无人驾驶服务,并目标覆盖全球20至30个城市。

物理AI的延伸:从汽车到机器人

吴新宙观察到,物理AI的热度正从汽车向机器人领域蔓延。在他看来,汽车本质上就是一个机器人,未来的智驾和智舱“大脑”将走向高度集成。虽然机器人开发的复杂度更高,但自动驾驶的工程化经验将为其提供重要的技术底层。通过英伟达的全球化平台,这些前沿技术有望在物理世界的各个角落产生生产力的指数级增长。

via AI新闻资讯 (author: AI Base)
安卓首发:荣耀 YOYO 率先接入 DeepSeek-V4 大模型

智能手机领域的 AI 军备竞赛再次升级。荣耀官方最新宣布,其智能助理 YOYO 已正式接入 DeepSeek-V4大模型,成为安卓阵营中首个整合该顶尖 AI 技术的智能体。这一动作不仅标志着双方合作的深化,也意味着移动端 AI 体验迈入了更高阶的阶段。

据悉,此次升级涵盖了性能表现、上下文理解能力以及推理效率三大核心维度。接入 DeepSeek-V4后,YOYO 智能体在处理复杂指令和长文本对话时将展现出更强的逻辑性。通过对底层算法的优化,设备的响应速度与任务处理的精准度均得到了显著提升,能够更从容地应对多样化的用户交互场景。

在具体的体验门槛方面,荣耀官方给出了明确的指引。用户需确保 YOYO 智能体的版本号在90.10.28.041及以上,同时系统环境需处于 MagicOS8.0或更高版本。满足条件的机型即可申请抢先体验,感受新一代大模型带来的交互变革。

回顾过往,这并非双方的首次“联姻”。早在2025年初,荣耀 YOYO 助理2.0就已成功接入 DeepSeek 架构,而此前发布的自研70亿参数“魔法大模型”更是为其 AI 生态奠定了坚实基础。从最初的自动化尝试到如今深度融合高性能大模型,移动端 AI 正在从简单的指令执行者向真正的“智能管家”加速演进。

via AI新闻资讯 (author: AI Base)
AI 记者或是“傀儡”?OpenAI 关联组织疑资助虚假新闻网站

一场关于新闻真实性的风暴正席卷科技界。据调查显示,一家名为 Acutus 旗下的媒体《The Wire》被曝出其核心编辑团队可能并非人类,而是一群由人工智能驱动的虚假角色。

资金线索指向政治行动委员会

调查起源于一份异常的采访请求。倡导组织成员在接到自称 Michael Chen 的记者邀约后发现,这位记者的身份信息完全无法证实,且该网站绝大多数“员工”均呈现出明显的机器人特征。

令人震惊的是,追溯这一系列虚假账号的资金来源,线索最终指向了 OpenAI 的超级政治行动委员会。这不仅引发了公众对大模型公司干预舆论的担忧,也让 AI 在政治宣传中的角色变得更加扑朔迷离。

自动化媒体引发透明度危机

这类由 AI 运营的新闻站点正以极高的频率产出内容,试图通过算法渗透公共话语空间。由于背后缺乏真实的编辑审核与伦理约束,这种模式被质疑是某种形式的“模范共和国”试验,旨在通过技术手段操控信息流。

目前,OpenAI 方面尚未对该政治行动委员会的资金去向做出详细解释。随着技术的迭代,如何识别并监管这些隐藏在 AI 记者背后的真实意图,已成为当前数字化治理面临的紧迫挑战。

via AI新闻资讯 (author: AI Base)
爆文预订:告别 Token 焦虑!浏览器本地跑 Gemma 4,手绘流程图从此全免费

在移动端运行大模型已不再是新鲜事,但让浏览器具备强悍的 AI 处理能力正成为新的技术趋势。近日,开发者通过引入 Google 最新的 TurboQuant 算法,成功将 Gemma4模型搬进了浏览器。这意味着用户无需配置复杂的 API 环境,也不必支付任何订阅费用,就能在本地环境下实现流畅的 AI 交互。

核心技术:TurboQuant 带来的记忆革命

此次技术突破的核心在于 Google 研发的 TurboQuant 算法。它主要针对大模型的“临时记忆库”——KV Cache(键值缓存)进行了深度优化。

在传统模式下,模型在处理长对话或复杂任务时,缓存数据会迅速膨胀,导致系统卡顿。而 TurboQuant 能够将这些向量数据压缩至原来的六分之一,且支持在压缩状态下直接进行检索。这种“不解压直接搜”的特性,不仅让模型能够记住更长的上下文内容,还显著提升了计算效率。

实测体验:三十秒生成专业流程图

以集成了该技术的本地化绘图工具为例,用户只需在支持 WebGPU 的 Chrome134+ 桌面浏览器中打开网页,即可调用 Gemma4E2B 模型。

在实际测试中,生成一张结构完整的 Excalidraw 流程图仅需约32.9秒。数据显示,该模型在浏览器中的生成速度约为每秒24个 token,端到端响应灵敏。最显著的优势在于,由于整个运算过程完全在用户本地设备上完成,不消耗任何在线 Token,实现了真正意义上的“创作零成本”。

门槛与展望:本地化 AI 应用的新形态

尽管实现了“流量自由”,但本地运行仍有一定的硬件门槛。用户首次使用需要下载约3.1GB 的模型文件,且对浏览器的版本有明确要求。

这种基于 WASM(WebAssembly)和 TurboQuant 的方案,为轻量级 AI 应用提供了一个极具参考价值的范本。它证明了在不依赖高昂云端算力的情况下,通过算法优化,浏览器同样可以胜任复杂的流程图绘制与长文本处理任务。对于追求隐私安全与成本控制的用户而言,这种“即开即用、本地运行”的模式或将成为未来 AI 工具的主流形态。

via AI新闻资讯 (author: AI Base)
告别扁平化:谷歌全系应用图标大变脸,渐变色设计重塑视觉审美

谷歌公司正准备为其旗下的应用生态进行一次视觉上的“大手术”。继 2025 年末初步试水后,全新的渐变色图标设计现已确认将覆盖谷歌几乎所有的核心应用程序。

设计风格转向柔和生动

这次更新的核心在于抛弃了以往过于死板的纯圆型和四色拼接设计。新图标采用了更柔和的圆角处理,色彩从浅淡的粉彩色自然过渡到饱和的谷歌标志性原色,整体视觉感受更加灵动且具有现代感。

这种设计语言的转变不仅是为了美观,更是谷歌迈向“AI 优先”时代的象征。据了解,这种充满活力且多变的渐变风格,旨在呼应 Gemini 等 AI 驱动功能在各应用中的深度集成。

效率工具图标结构重组

除了色彩的变化,办公套件的图标结构也迎来了重大调整。谷歌文档、表格和幻灯片等应用彻底告别了沿用多年的“纵向纸张”造型,转而采用更符合现代屏幕使用习惯的横向布局,使图标在视觉上更加平衡。

值得一提的是,部分图标还找回了经典设计的影子。例如,谷歌聊天(Chat)的图标从四色气泡边框回归到类似 Hangouts 时期的绿色笑脸造型,这种复古与创新的融合,有望显著提升用户在多任务切换时的识别效率。

via AI新闻资讯 (author: AI Base)
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]