https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
GPT Image2 背后团队首度曝光: 13 人核心团队, 4 个月重塑AI绘图

近期,GPT Image2凭借极其惊艳的生成效果在社交媒体上引发轰动。随着项目的走红,这支低调的幕后团队也逐渐浮出水面。据了解,该核心团队仅由13人组成,在短短4个月内便完成了底层架构的彻底重写。尽管研究负责人陈博远并未透露具体的技术路线,但他将这一新模型描述为“图像领域的GPT”,预示着其在通用性上的巨大飞跃。

作为团队的灵魂人物,陈博远的成长历程颇具传奇色彩。他在读博期间便提出过“Diffusion Forcing”等创新范式,并曾在Google参与开发后续被Gemini2.0采用的指令微调技术。有趣的是,他在高中参加科研营时甚至还不懂Python。在加入OpenAI后,他不仅负责了GPT图像模型的所有训练工作,还是Sora视频生成团队的核心成员。在演示中,他通过生成精准渲染中、韩、孟加拉语等多种文字的海报,展示了模型卓越的语言处理能力。

除了文字渲染,GPT Image2在理解世界知识和指令遵循方面也达到了新高度。由中科大博士Jianfeng Wang负责的这一模块,解决了生图AI长期以来的痛点——例如,过去模型画的时钟几乎永远停在10:10,而新模型已能精准理解任意时间点及复杂的空间布局指令。他表示,该模型正在消除用户的创作意图与最终产出之间的鸿沟。

在生产力工具化方面,来自浙大竺可桢学院的Yuguang Yang演示了将长篇论文一键转化为高精度PPT和信息图表的能力。这得益于团队在多模态理解、MoE(混合专家模型)架构以及长程引导技术上的深度融合。

从最初的DALL-E到如今的GPT Image2,这支平均年龄极轻、背景多元的团队(包含多位2025年刚毕业的博士)完成了从“画得出”到“画得准”的进化。目前,团队成员纷纷将社交头像换成了极简的日系贴纸风格。这种带有几分戏谑色彩的自嘲,或许正是这群信奉“涌现式研究”的天才们改变世界的一种独特方式。

via AI新闻资讯 (author: AI Base)
字节跳动发布新一代3D生成大模型Seed3D 2.0,技术精度与真实感实现跨越式提升

在生成式AI领域,3D内容的构建正成为技术竞争的新高地。近日,字节跳动正式对外推出了精度更高的新一代3D生成大模型——Seed3D2.0。该模型的最新技术报告已同步公开,且相关API接口也已在火山引擎平台正式上线。

根据对比评测数据显示,Seed3D2.0在几何形状生成以及纹理材质建模这两项关键指标上,均成功取得了SOTA(当前最优)的成绩。这意味着该模型在处理复杂物体结构时,能够还原出更精细的锐利边缘和薄壁构造。而在PBR(基于物理的渲染)材质生成方面,其表现出的真实感与光影稳定性也显著优于现有的主流模型。

为了验证实际应用中的用户感官,字节跳动招募了60位拥有专业经验的3D建模师进行盲评。在纯几何结构的生成测试中,Seed3D2.0展现了压倒性的优势;而在带有纹理贴图的综合测试中,其相对于行业内其他主流模型的偏好率超过了69%,验证了其架构创新带来的质量飞跃。

从技术实现路径来看,Seed3D2.0引入了从粗到精(Coarse-to-Fine)的两阶段生成策略。这种方法通过将“整体结构”与“局部细节”解耦并分开优化,攻克了复杂拓扑结构难以还原的痛点。同时,模型采用了MoE(混合专家)架构来提升高分辨率下的材质细节,并引入视觉语言模型(VLM)先验,确保了在未知光照环境下的材质分解更具准确性。

除了基础的几何与纹理生成,该模型还展示了强大的实用化潜力。目前,Seed3D2.0已具备部件级分割补全、铰接资产生成以及基于多模态输入的场景组合能力。这些特性的加入,使得生成式3D模型不再停留于实验室阶段,而是能够更直接地应用于游戏开发、仿真场景构建等实际业务部署中。

via AI新闻资讯 (author: AI Base)
大模型购票时代开启:东航首家接入通义千问实现全流程AI服务

随着人工智能技术的深度演进,传统的航空出行服务正迎来颠覆性变革。今日,中国东方航空正式与阿里通义千问达成战略合作,通义千问也由此成为首个全面接入东航服务的国产大模型。这一举措标志着AI机票服务正式进入全流程时代,有望重塑现有的机票销售格局。

此次深度整合彻底改变了以往依赖OTA(在线旅行社)或反复切换APP的繁琐流程。在新的服务模式下,用户只需在通义千问的AI对话界面中,以自然语言输入自己的行程计划或个人偏好,AI便能代替人工完成复杂的查询与比对工作。它不仅能精准推荐最适配的东航航班,还能辅助用户直接在对话框内完成购票、选座以及值机等一系列操作。

值得注意的是,这种“直连”模式在售后保障上也更具优势。通过AI渠道完成的订单,将由东航官方直接提供退改签支持,规避了第三方平台可能存在的沟通滞后或加价风险。

据了解,双方的合作并未止步于交易层面。未来,该AI服务还将进一步打通会员体系,接入更多个性化的会员权益与服务。这不仅是航空公司数字化转型的一次大胆尝试,也预示着大模型正从单纯的“聊天工具”向具备实操能力的“全能助手”加速蜕变。

via AI新闻资讯 (author: AI Base)
字节跳动发布Seed3D2.0:几何与纹理双SOTA,API同步上线火山引擎

字节跳动Seed团队于2026年4月23日正式发布新一代3D生成大模型Seed3D2.0,标志着AI3D内容生成向“生产级可用”迈出关键一步。 该模型在几何精度与材质真实度上实现显著突破,核心指标均达到行业SOTA水平,有效解决了此前3D生成中边缘软化、拓扑失真及材质物理一致性缺失等行业痛点。

技术层面,Seed3D2.0引入了“粗到精”的两阶段DiT架构,通过将整体结构与几何细节解耦,极大提升了对锐利边缘和薄壁结构的还原能力。在纹理生成上,模型升级为统一的PBR生成架构,并结合MoE架构与VLM先验,实现了高分辨率下的物理属性精准分解。

评测数据显示,Seed3D2.0在几何生成与纹理生成的人类偏好率分别超过80%与69%,大幅领先现有主流模型。

此外,Seed3D2.0进一步拓展了下游应用边界,支持部件级拆解、关节化建模及复杂场景组合,生成的3D内容可无缝对接Isaac Sim等物理仿真引擎。

目前,该技术报告已公开,API也同步上线火山引擎。随着3D生成从单体模型迈向可交互、具身智能化的场景级构建,Seed3D2.0的发布不仅将加速工业制造与仿真训练的数字化进程,也为具身智能的规模化落地提供了关键的基础设施支撑。

项目主页:

https://seed.bytedance.com/seed3d_2_0

体验入口:

火山方舟体验中心-登录-选择视觉模型-3D生成-Doubao-Seed3D-2.0

via AI新闻资讯 (author: AI Base)
Google Cloud 默认安全缺陷导致用户产生巨额账单

Google Cloud 默认安全配置缺陷导致用户面临严重的财务风险。澳大利亚 AI 顾问 Jesse Davies 因历史项目中的 API 密钥泄露,在设置了 10 澳元预算上限的情况下,一夜之间产生超过 2.5 万澳元的账单。受此影响,攻击者通过公开 URL 调用容器环境变量中的明文密钥,绕过了多项安全防护措施。

更深层的风险在于,Google Cloud 在账户触发阈值时会自动上调信用额度且不予通知,导致损失进一步扩大。尽管 Google 最终免除了相关费用,但此类事件并非孤例,多名用户报告曾遭遇数万至十万美元不等的异常账单。网络安全公司 Truffle Security 指出,Gemini API 密钥格式单一且安全设置默认关闭,是此类攻击频发的核心诱因。

Tom's Hardware

🌸 在花频道茶馆讨论投稿通道

via 科技圈🎗在花频道📮 - Telegram Channel
印度男子用AI打造MAGA女网红狂骗美国寂寞男 吸引超百万粉丝

近日,美国科技媒体《连线》曝光一起震惊全网的AI造假事件:一位拥有数百万粉丝的 MAGA(让美国再次伟大)网红“艾米丽·哈特”,并非真实存在的美国女性,而是由一名22岁印度医学生萨姆利用AI技术完全捏造的虚拟人物

艾米丽·哈特被塑造成完美的保守派“理想形象”:金发碧眼、身材姣好,兼具护士的可靠与爱国者的热情。

其经常在平台分享的标志性内容包括穿比基尼冰钓、喝Coors Light啤酒、手持步枪射击,再加上佩戴MAGA帽子发表政治言论,精准击中美国保守派男性的情感与价值观需求。

幕后推手萨姆正接受骨科住院医师培训,因高昂学费压力,萌生用AI虚拟人物变现的想法。

他听从AI建议,选择MAGA保守派赛道,认为该群体受众忠诚、可支配收入高,随后通过AI生成虚拟形象,并借助Google Gemini、Grok等AI工具生成内容,仅4个月就收获超100万粉丝,粉丝们在评论区狂热示爱、表达政治支持。

萨姆在Fanvue等平台通过粉丝打赏、订阅和广告分成,每月赚取数千美元,远超印度当地收入水平。

他也试过自由派版本,但没有成功,更加讽刺的是,尽管MAGA粉丝让他赚得盆满钵满,这名印度男子依然看不起他们,其坦言道:“民主党人知道那是AI垃圾……MAGA 那帮人都是些蠢货——就是那种超级蠢的人,而且他们还真会上当。”

事件曝光后,引发轩然大波,大量粉丝感到被背叛,指责这是政治与情感的双重欺骗;各大社交平台紧急介入调查,Fanvue平台因允许AI内容陷入争议。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:快科技)
we are experiencing issues with marketplace / extensions

Apr 23, 04:20 UTC
Update - We are currently investigating this issue. We will provide updates as more information becomes available.

Apr 23, 04:17 UTC
Investigating - We are investigating this issue.

via Cursor Status - Incident History
灵光“分一亿激励计划”每日公布名单,单个创作者最高一万元

4月23日,灵光App正式公布"分一亿激励计划"首批优质闪应用入选名单,首批入选作品每个获得至少100元红包奖励。用户可打开灵光App,进入活动页面查看入选结果。

此次激励计划于4月20日启动,灵光App投入1亿元专项基金,分两档对优质闪应用和优秀创作者进行扶持:每天最高投入100万元,激励1万个优质闪应用每个100元;每周最高投入100万元,激励100名优秀创作者,每位10000元。用户在灵光App生成闪应用并发布至灵光圈,即可参与评选。

(图说:获奖的优质闪应用展示,上灵光圈可关注)

在评选机制上,灵光App从4月23日起,每个工作日在灵光圈活动首页展示「优质闪应用」评选结果,未入选的闪应用可继续参与后续轮次。首批“万元创作者”名单将于下周三公布,后续将于每周三公布上周100名「优秀创作者」名单。

据悉,自上线至今,灵光App用户在5个月时间时间成功搓出超3000万款闪应用。这些应用覆盖游戏、生活、娱乐、旅行等多个领域。20日,灵光APP对外宣布能力大升级,在多智能体协作、全模态生成和手机端原生能力上均有显著提升,并上线了灵光圈,打通了从生成到分享的完整链路。

灵光App方面表示,将持续推进消费级Coding Agent的落地,帮助所有人实现人人可Wish Coding,进而推动“一人应用"生态加速成型。

via AI新闻资讯 (author: AI Base)
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]