https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
美图RoboNeo升级,首创Agent Teams开启影像创作新范式

4月29日下午,美图公司宣布旗下影像AI Agent RoboNeo迎来重大升级,正式推出行业首创的影像创作Agent Teams。这一战略动作标志着美图将AI应用从单体工具升级为多Agent协同系统,旨在为自媒体人、内容团队及“一人公司”提供全链路、系统化的影像创作解决方案。

针对通用大模型在行业深耕中的“泛化局限”以及创作者在多工具切换间的“内耗”痛点,RoboNeo通过多AI Agent的角色化分工,实现了从创意灵感到素材生产、格式对齐及品牌资产沉淀的深度整合。在AI短剧、自媒体及电商内容创作等核心场景中,RoboNeo能够根据用户偏好与品牌风格自动调校,显著减少了改稿与参数调试等繁琐流程。

在当前AI行业从“单模态竞争”向“垂直应用生态”转型的趋势下,美图此次升级反映了影像创作领域正步入“AI原生工作流”阶段。通过将离散的创作环节整合为协同工作的Agent团队,美图不仅提升了AI对复杂业务场景的适配性,更在重塑行业生产力工具的标准,预示着AI Agent协同模式将成为未来内容生产的核心支撑力。

via AI新闻资讯 (author: AI Base)
腾讯混元推出0.4G手机端离线翻译模型,五一出境游无信号也能通全球

随着五一黄金周临近,腾讯混元团队近日发布了其专业翻译大模型的极致量化版本,为计划出国旅游的用户提供了硬核的语言解决方案。这款名为Hy-MT1.5-1.8B-1.25bit的模型仅有440MB,支持在手机本地流畅运行。

极致压缩技术实现手机离线直连

该模型通过先进的量化技术,将原本超过3GB的体积压缩至仅原来的八分之一,使其能轻松常驻普通手机的后台。即便在完全没有网络信号的偏僻景区或突发状况下,用户依然可以获得即时且高质量的翻译服务。

针对不同机型,团队推出了2-bit与1.25-bit两种方案。其中,1.25-bit版本采用了被学术顶会录用的“细粒度稀疏”策略,每4个参数中有3个用1-bit储存,确保在极小体积下仍能保持强大的翻译性能。

专业级翻译质量与隐私安全保障

虽然体积精简,但该模型在33种语言、5种方言及上千个翻译方向上展现了卓越的实力。在多项权威评测基准中,其翻译准确度不仅超越了谷歌翻译,更比肩参数量巨大的商用模型。

由于翻译过程完全在手机本地完成,用户无需担心个人敏感信息的采集或上传,极大提升了隐私安全性。目前该项目已全面开源并提供Demo,支持安卓用户体验“后台取词”等高效功能,且无需任何订阅费用。

体验链接:

Huggingface(海外用户):https://huggingface.co/AngelSlim/Hy-MT1.5-1.8B-1.25bit-GGUF/resolve/main/Hy-MT-demo.apk
魔搭社区(国内用户):https://modelscope.cn/models/AngelSlim/Hy-MT1.5-1.8B-1.25bit-GGUF/resolve/master/Hy-MT-demo.apk

via AI新闻资讯 (author: AI Base)
GPT Image 2超越Nano Banana2 登顶全球视觉模型榜首

近日,OpenAI 旗下的最新文生图模型 GPT Image2在权威评测中表现强劲。根据 SuperCLUE 发布的最新数据显示,该模型已正式超越谷歌的 Nano Banana2,成功摘得全球文生图模型评测的桂冠。据悉,该模型自4月21日上线以来,凭借在画质、理解力及细节还原度上的显著迭代,刷新了行业技术标准。

在本次评测涵盖的多个核心维度中,GPT Image2的表现堪称全面。特别是在长期困扰海外模型的汉字生成领域,该模型取得了93.07的高分,文字准确度更是获得满分评级。它不仅能够精准识别并生成复杂的汉字,还能实现文字与亚克力、青花瓷等不同材质纹理的深度融合,有效解决了文字“漂浮感”和乱码等技术难题。

除了文字处理能力的突破,该模型在复杂场景的复刻上也展现了极高的指令遵循度。从极具生活气息的老式面包店到充满动感的非遗打铁花,GPT Image2均能精准捕捉画面细节。此外,针对长提示词和逻辑推理需求,该模型能够准确产出科学原理图、专业海报等高难度内容,展现出卓越的图文一致性。

尽管评测报告也指出,GPT Image2在空间关系理解以及深层知识推理方面仍存在一定的优化空间,但其在现实复现和创作推理上的优势已足以令其在与谷歌、百度等竞品的角逐中脱颖而出。

业内专家认为,GPT Image2的上线不仅标志着 OpenAI 在视觉生成领域的再次领先,更预示着文生图技术正从简单的意象生成走向高精度、重逻辑的专业级应用阶段。随着模型的持续优化,AI 视觉创作的边界将进一步得到拓展。

via AI新闻资讯 (author: AI Base)
OpenAI预计ChatGPT订阅用户将达到1.22亿

OpenAI 在 1 月 16 日的博客中宣布推出一项名为 “ChatGPT Go” 的低价订阅服务,每月费用为 8 美元。该服务自去年 8 月起已在 171 个国家推出,旨在为更多用户提供接触 AI 的机会。OpenAI 还表示,将计划在美国对免费和 Go 版本进行广告测试,同时为保护用户隐私和确保广告与模型回答的独立性,制定了一系列原则。

根据《信息》报道,OpenAI 预计,今年的消费者订阅用户将达到 1.22 亿,这一数字如果成真,将显著改变这一消费级 AI 产品的用户互动规模。大规模的用户基础通常会引发潜在的安全问题,增加推理工作负载的延迟和成本压力。这使得团队需要更积极地采用缓存、批处理以及安全提示等措施,以应对可能出现的挑战。

与此同时,OpenAI 的公共原则强调不向广告商出售用户对话数据,并致力于保护用户的对话隐私。这些措施旨在解决当广告与对话 AI 结合时,常见的隐私和变现担忧。

观察人士应关注 OpenAI 在美国的首次广告测试范围和形式,以及有关广告个性化选择退出的指标。此外,任何第三方审计或红队报告也将是值得关注的重点。对于工程团队而言,需要留意 OpenAI 是否会在速率限制、服务级别协议(SLA)沟通及新的遥测工具方面进行调整,以便区分广告服务行为与模型响应行为。

via AI新闻资讯 (author: AI Base)
讯飞星火X2-Flash模型发布:深耕国产算力,256K长文本能力跃升

4月29日,科大讯飞正式发布了全新的星火X2-Flash模型,并同步开放API接口,标志着基于国产算力生态的大模型应用进入了全新的效能阶段。

该模型采用了当前主流的MoE(混合专家)架构,总参数量达到30B,最引人注目的特性是其支持高达256K的超长上下文。值得注意的是,星火X2-Flash完全基于华为昇腾910B集群训练完成,这展示了国产软硬件在深度学习训练领域的协同能力。

在核心性能上,星火X2-Flash在智能体(Agent)和代码生成能力方面实现了显著增强。根据第三方实测数据显示,该模型在处理深度研究报告、Skill管理与调用、以及系统控制执行等复杂任务时,其表现已经能够比肩业界万亿级参数的顶尖模型。

针对开发者关注的成本问题,星火X2-Flash表现优异。在相同的工作流测试中,其Token消耗量仅为目前主流大尺寸模型的三分之一,大幅度降低了构建复杂智能体应用的门槛。例如,在创建复杂的视频生成技能时,模型不仅能快速理解需求,还能细致地提供从技能结构到核心功能的详尽说明。

技术底层方面,星火X2-Flash率先在国产芯片上实现了DSA(稀疏注意力)与MTP(多Token预测)技术的结合。这一创新解决了长文本在国产算力平台上训练缓慢的痛点,使训练效率相比同规模集群提升了4.5倍。此外,针对智能体强化学习场景,该模型通过算法与工程的双重优化,将采样推理效率提升了2倍以上,有效缓解了长交互场景下的性能瓶颈。

目前,AstronClaw、Loomy等应用已率先完成接入。同时,该模型也实现了对OpenClaw、Claude Code等国际主流Agent框架的深度兼容,为全球开发者提供了更具性价比的国产算力方案。

via AI新闻资讯 (author: AI Base)
Anthropic 推出 “Claude for Creative Work”,助力创意工作高效协作

近日,人工智能公司 Anthropic 正式发布了名为 “Claude for Creative Work” 的新产品,旨在将其 AI 模型从传统的对话助手扩展到专业创意工作领域。公司明确表示,Claude 并不想取代人类的创意,而是作为 “协作伙伴”,帮助创作者加速构思、拓展能力,同时减少在重复性任务上的时间浪费。

为实现这一目标,Anthropic 推出了一系列与主流创意软件的集成工具,将 Claude 直接嵌入创作者熟悉的工具中。这些集成工具包括与 Adobe、Autodesk、Ableton、Blender 和 Splice 等知名创意平台的合作,Claude 能够直接与这些软件进行互动,并根据平台自身的数据提供更具上下文的辅助能力。

例如,在音乐制作软件 Ableton 中,Claude 可以调取官方文档,帮助用户掌握不同功能。在 Adobe Creative Cloud 中,Claude 则协助创作和编辑图像、视频等内容。与 Canva 旗下的 Affinity 合作后,Claude 主要用于自动化处理批量编辑和文件整理等工作。此外,在 Autodesk Fusion 中,Claude 支持 3D 建模,而在 Blender 中则为脚本编写和场景管理提供自然语言接口。

值得一提的是,Anthropic 还与 Blender 的合作被视为一大亮点,作为赞助方加入 Blender Development Fund,表明其对开源生态的长期承诺。除了产品集成外,Anthropic 还加强了在教育领域的投入,携手多所艺术与设计院校,推动围绕 “创意计算” 的课程与项目,为学生和教师提供 Claude 及其连接器的使用权限。

划重点:

🌟 Anthropic 推出 “Claude for Creative Work”,旨在提升创意工作的效率和协作性。

🎨 Claude 与多个主流创意软件集成,支持多种创作与编辑功能。

📚 公司加大在教育领域的投入,与多所高校合作推广 “创意计算” 课程。


via AI新闻资讯 (author: AI Base)
腾讯ima发布知识Agent“copilot” 可记住用户的背景、习惯与推进事项

腾讯ima推出知识Agent——copilot,支持用户创建专属Agent。据了解,Copilot内置深度个性化的记忆系统,包含四大模块:Copilot设定 (Soul)、用户档案 (User)、长期记忆 (Memory)、经验技巧 (Agent)。它能记住你的背景、习惯和任务推进方式,实现跨场景连续调用,减少重复输入。你可以在设置卡片中查看并对话式编辑记忆内容,系统会根据你的使用变化不断自我迭代,让Copilot真正“认识”你。

当你在浏览网页、打开文件、翻阅知识库或笔记时,Copilot会以浮窗形式悬停于ima应用内,自动感知当前内容,无需额外上传文件。

例如,直接问“这个网页讲了什么”,它就能立即基于当前页面给出回答;在知识库或笔记页面,你还可以直接指挥它:“帮我把这个网页的内容整理成笔记,并加入到我的知识库里。”

Copilot内置官方技能包(Skills),首期包括:知识库操作、笔记操作、创建 Skill、生成报告等,且均与ima产品深度结合。相比之前版本,知识库 Skill 已支持读取文件正文,能完成更复杂的跨文件信息读取与汇总。

你还可以用自然语言指挥它,比如“帮我把这个知识库按学科分类”。除了官方技能,用户也可自由添加自定义Skills。此外,Copilot支持配置各大模型的API Key,为高阶玩家提供强大扩展能力(使用自己的API不消耗平台算力)。

Copilot已上线Mac、Windows、iOS、安卓、鸿蒙全平台。为保证使用体验,功能采用 申请制,将按申请顺序陆续开放。新用户可获赠一笔算力福利,每日登录还可领取额外算力。

ima Copilot通过个性化记忆、场景感知、技能生态与拟人化交互,致力于成为真正理解你、伴随你、协助你处理各类事务的个人知识伙伴。无论你是学生、研究者还是内容创作者,都能从中找到提升效率与创造力的全新可能。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:快科技)
GPT Image 2文生图封神 超谷歌Nano Banana2成全球第一

OpenAI最新推出的GPT Image 2模型,在权威文生图评测中表现惊人,成功超越谷歌Nano Banana2,拿下全球第一的位置。这款模型在4月21日正式上线,经过多个月迭代升级,画质、理解力和细节还原能力都有巨大提升。

SuperCLUE评测数据显示,GPT Image 2在汉字生成、现实复现、图像质量等多个核心维度全部登顶,表现十分亮眼。

它的汉字生成能力达到93.07分,文字准确度满分,不管是青花瓷器上的篆书,还是亚克力材质上的金色字体,都能完美融合,没有悬浮感,彻底解决海外模型生成汉字乱码的问题。

汉字生成—图文贴合度

汉字生成—图文贴合度

在场景还原上,模型可以精准复刻老式面包店、非遗打铁花等复杂画面,细节真实自然。同时对长提示词和逻辑推理类需求理解到位,能准确生成科学原理图、海报设计等专业画面,指令遵循度极高。

实体场景复刻

相比前代产品,GPT Image 2在图文一致性和汉字生成上提升明显,全面超越上一代模型。和谷歌、百度等竞品对比,也在多个维度实现领先,尤其在创作推理和现实复现上优势突出。

目前模型仍有空间关系理解、知识推理等方面需要优化,但整体已经达到行业顶尖水平,标志着文生图技术进入全新阶段。

国内外头部模型一级维度分数对比

via cnBeta.COM - 中文业界资讯站 (author: 稿源:快科技)
告别反复切换!WorkBuddy深度集成腾讯文档,实现知识管理“取‑用‑存”一体化

腾讯AI办公领域迎来重要产品更新。今日,WorkBuddy宣布正式上线“资料库”功能,并率先与腾讯文档实现深度集成,成为业内首个与主流文档/知识库产品深度打通的AI办公智能体。

用户现可在WorkBuddy中直接调用、编辑和保存腾讯文档中的文件,全程无需下载、上传或切换应用,实现“知识生产-管理”闭环。该功能支持从“资料库”选中文档、向WorkBuddy下达修改指令、并直接保存回腾讯文档三步操作。

同时,手机端WorkBuddy小程序也同步支持此功能,满足移动办公需求。此次升级旨在打通个人知识管理的“最后一公里”,提升办公效率。WorkBuddy与腾讯文档的联动,标志着AI智能体在办公场景的集成应用进入新阶段。

via AI新闻资讯 (author: AI Base)
2D 素材秒变 3D 效果:Adobe Photoshop 引入 AI 旋转对象功能

Adobe 公司今日发布了 Photoshop 与 Lightroom 的重大版本更新,正式将生成式 AI 技术延伸至 3D 空间处理领域。本次更新最受关注的突破是引入了“旋转对象”工具,它打破了传统平面素材在空间编辑上的局限。

通过这项全新功能,用户可以在 3D 空间内实时旋转、倾斜或翻转 2D 素材。该技术不仅能改变物体的透视角度,还能根据环境自动调整画面的视觉逻辑,极大提升了合成创作的自由度。

智能光影自动匹配

为了解决素材旋转后与背景融合不自然的问题,Photoshop 同步推出了“协调”功能。用户只需一键点击,AI 便会自动计算环境光照方向,重构物体的光影细节,确保素材与背景完美匹配。

除了视觉编辑的进化,新版软件还针对专业工作流进行了深度优化。去年备受期待的“图层清理”工具现已正式落地,它能智能重命名图层并自动剔除冗余项,帮助创作者从繁琐的项目组织中解脱出来。

影像管理全面提速

云端编辑器 Lightroom 在本次更新中同样表现亮眼,其搜索系统现在支持更精准的自然语言查询。用户可以直接输入描述性词汇来寻找特定照片,传统的标签式检索体验将因此发生质变。

在底层性能方面,新版软件的交互滑块响应速度提升了最高 5 倍。配合新增的多款复古胶片预设,摄影师在处理海量素材时将获得更流畅、更具掌控力的后期编辑体验。

via AI新闻资讯 (author: AI Base)
国产大模型海外“屠榜”!混元Hy3 preview登顶全球大模型调用量榜单

在最新发布的OpenRouter全球大模型API调用量排行榜中,国产大模型的表现令人瞩目。腾讯最新推出的混元Hy3preview模型凭借极高的使用频次,成功超越一众国际竞品,摘得总榜桂冠。这一数据的出炉,不仅反映了开发者对该模型性能的认可,也标志着国产大模型在全球AI生态中的影响力正加速提升。

多项全能:工具调用与编程场景表现优异

除了在总调用量上领跑,混元Hy3preview在特定专业场景下的表现同样出色。根据分场景统计数据显示,该模型在“工具调用(Tool Use)”维度高居榜首,展现了强大的逻辑执行与外部协作能力;而在技术门槛极高的“编程(Coding)”领域,混元Hy3preview也稳居第二位。这种全方位的发展态势,使其成为了目前全球开发者眼中最具竞争力的AI工具之一。

行业共振:国产AI集体发力

值得注意的是,不仅是腾讯,国内其他大模型厂商也在同日释放了重要进展。阶跃星辰正式对外发布了其新一代图像生成编辑模型Step Image Edit2,并已在开放平台全面上线。随着这些高性能模型的密集发布与应用,大模型行业正从“参数竞赛”转向“应用实效竞赛”,国产AI在图像处理、复杂编程及自动化工具等核心赛道的优势正逐步扩大。

via AI新闻资讯 (author: AI Base)
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]