https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
GitHub Copilot 调整个人订阅方案并暂停新用户注册
GitHub 宣布调整 Copilot 个人版计划以维持服务稳定性。自 2026 年 4 月 20 日起,GitHub 暂停 Student、Pro 及 Pro+ 方案的新用户注册,仅 Copilot Free 保持开放。现有用户仍可在不同方案间升级,其中 Pro+ 额度为 Pro 的 5 倍以上。
模型支持方面,Opus 模型已从 Pro 方案移除,Pro+ 方案目前保留 Opus 4.7,但后续将移除 4.5 与 4.6 版本。GitHub 针对受影响用户提供退款通道,用户可在 4 月 20 日至 5 月 20 日期间申请 4 月份费用的退还。
The GitHub Blog
🌸 在花频道|茶馆讨论|投稿通道
via 科技圈🎗在花频道📮 - Telegram Channel
GitHub 宣布调整 Copilot 个人版计划以维持服务稳定性。自 2026 年 4 月 20 日起,GitHub 暂停 Student、Pro 及 Pro+ 方案的新用户注册,仅 Copilot Free 保持开放。现有用户仍可在不同方案间升级,其中 Pro+ 额度为 Pro 的 5 倍以上。
模型支持方面,Opus 模型已从 Pro 方案移除,Pro+ 方案目前保留 Opus 4.7,但后续将移除 4.5 与 4.6 版本。GitHub 针对受影响用户提供退款通道,用户可在 4 月 20 日至 5 月 20 日期间申请 4 月份费用的退还。
The GitHub Blog
🌸 在花频道|茶馆讨论|投稿通道
via 科技圈🎗在花频道📮 - Telegram Channel
Some users will is higher error rates on Codex
Status: Monitoring
We have applied the mitigation and are monitoring the recovery.
via OpenAI status
Status: Monitoring
We have applied the mitigation and are monitoring the recovery.
via OpenAI status
🔁 #Update #Codex
Forwarded From Agent Copilot
#Update #Codex
Codex macOS App 现已支持 Chronicle,可持续关注屏幕内容并为 Codex 提供上下文。
该功能需要手动开启且会快速消耗 token。
官方文档:https://developers.openai.com/codex/memories/chronicle
via AI Copilot - Telegram Channel
Forwarded From Agent Copilot
#Update #Codex
Codex macOS App 现已支持 Chronicle,可持续关注屏幕内容并为 Codex 提供上下文。
该功能需要手动开启且会快速消耗 token。
官方文档:https://developers.openai.com/codex/memories/chronicle
via AI Copilot - Telegram Channel
Elevated errors for ChatGPT conversations in Europe
Status: Monitoring
We have applied the mitigation and are monitoring the recovery.
via OpenAI status
Status: Monitoring
We have applied the mitigation and are monitoring the recovery.
via OpenAI status
美国国家安全局(NSA)正在使用Anthropic公司近期宣布但未向公众开放的高级人工智能模型“Mythos Preview”,引发外界关注。 数周前,NSA的上级机构美国国防部(五角大楼)才刚刚将Anthropic列为“供应链风险”,理由是该公司拒绝向五角大楼开放其模型的全部功能以供不受限制地使用。
Anthropic本月早些时候发布“Mythos”,将其定位为专注网络安全任务的前沿模型,但同时强调,这一模型在发起进攻性网络攻击方面能力过于强大,因此不适合公开向大众开放。 出于风险考量,公司目前仅向大约40家机构开放“神话”的访问权限,其中公开点名的只是其中约十来家合作方。
据报道,NSA应当属于未公开名单中的一员,目前主要将“Mythos”用于扫描各类系统和环境中可被利用的安全漏洞。 英国人工智能安全研究机构“AI Security Institute”也已证实获得该模型的访问权限,用于自身的安全评估与研究工作。
值得注意的是,在美国军方不断扩大对Anthropic工具使用范围的同时,五角大楼在法庭上却一再强调,这些工具本身可能危及国家安全。 双方争端的起点是Anthropic拒绝配合国防部,将其旗舰模型Claude用于大规模国内监控以及自主武器系统研发。
在NSA接入“Mythos”的同时,Anthropic与特朗普政府之间一度紧张的关系似乎也有所缓和。 上周五,该公司首席执行官达里奥·阿莫代(Dario Amodei)在白宫与总统办公厅主任苏西·怀尔斯(Susie Wiles)以及财政部长斯科特·贝森特(Scott Bessent)举行了会面。 据消息人士称,白宫方面将这次会面形容为“富有成效”。
相关文章:
联邦机构绕过特朗普的Anthropic禁令 测试其先进AI模型 “Claude Mythos”
via cnBeta.COM - 中文业界资讯站 (author: 稿源:cnBeta.COM)
Users unable to load ChatGPT and Codex
Status: Investigating
We are investigating the issue for the listed services.
Affected components
● Image Generation (Degraded performance)
● GPTs (Degraded performance)
● Connectors/Apps (Degraded performance)
● ChatGPT Atlas (Degraded performance)
● App (Degraded performance)
● Login (Degraded performance)
● Conversations (Degraded performance)
● Compliance API (Degraded performance)
● Agent (Degraded performance)
● Deep Research (Degraded performance)
● File uploads (Degraded performance)
● Voice mode (Degraded performance)
● Search (Degraded performance)
via OpenAI status
Status: Investigating
We are investigating the issue for the listed services.
Affected components
● Image Generation (Degraded performance)
● GPTs (Degraded performance)
● Connectors/Apps (Degraded performance)
● ChatGPT Atlas (Degraded performance)
● App (Degraded performance)
● Login (Degraded performance)
● Conversations (Degraded performance)
● Compliance API (Degraded performance)
● Agent (Degraded performance)
● Deep Research (Degraded performance)
● File uploads (Degraded performance)
● Voice mode (Degraded performance)
● Search (Degraded performance)
via OpenAI status
Elevated errors for uploading files
Apr 20, 13:31 UTC
Investigating - We are currently investigating an issue related to uploading files on Claude.ai and Claude API. Some users will see their uploads failing and they are advised to retry.
via Claude Status - Incident History
Apr 20, 13:31 UTC
Investigating - We are currently investigating an issue related to uploading files on Claude.ai and Claude API. Some users will see their uploads failing and they are advised to retry.
via Claude Status - Incident History
DeepSeek Web/APP 快速模式性能异常(DeepSeek Web/APP Instant Mode Performance Abnormal)
Apr 20, 20:40 CST
Investigating - We are currently investigating this issue.
via DeepSeek Service Status - Incident History
Apr 20, 20:40 CST
Investigating - We are currently investigating this issue.
via DeepSeek Service Status - Incident History
跨境电商智能化再进阶:吉宏股份与亚马逊云科技开启AI全域深度合作
近日,一场以“云聚算力·智算全球”为主题的合作启动会在业界引发关注。吉宏股份与亚马逊云科技正式宣布,双方将深化在AI全域应用领域的战略合作,这标志着跨境电商领域正迎来一场深刻的智能化变革。
此次合作的核心在于将亚马逊云科技的全栈AI能力,深度植入吉宏股份的电商全域业务场景中。双方高管与技术专家在会上共同发布了AI联合创新的阶段性成果,并明确了未来业务智能化升级的六大战略支点:
首先是重构用户体验与运营模式。通过对购物旅程的重新设计和运营逻辑的数字化翻新,提升整体商业效率。其次是变革开发范式,利用先进的技术架构赋能业务快速迭代。
值得关注的是,双方将重点打造**“吉宏Agent数字员工”。这一举措预示着AI将不再仅仅是辅助工具,而是作为具备自主执行能力的“员工”深度参与到跨境电商的日常运作中。此外,双方还将在自研算力与数据资产的整合、以及AI安全加固**方面展开深度协作,确保在智能化转型的同时,筑牢数据与业务安全的底座。
业界分析认为,此次启动会的召开意味着双方的协同已进入全新阶段。通过资源整合与技术共创,双方旨在共同探索跨境电商的创新应用场景,并向行业输出可借鉴的AI应用范式。这种深度的技术融合,不仅将加速吉宏股份自身的智能化进程,也将为整个跨境电商行业的技术演进提供新的思路。
via AI新闻资讯 (author: AI Base)
近日,一场以“云聚算力·智算全球”为主题的合作启动会在业界引发关注。吉宏股份与亚马逊云科技正式宣布,双方将深化在AI全域应用领域的战略合作,这标志着跨境电商领域正迎来一场深刻的智能化变革。
此次合作的核心在于将亚马逊云科技的全栈AI能力,深度植入吉宏股份的电商全域业务场景中。双方高管与技术专家在会上共同发布了AI联合创新的阶段性成果,并明确了未来业务智能化升级的六大战略支点:
首先是重构用户体验与运营模式。通过对购物旅程的重新设计和运营逻辑的数字化翻新,提升整体商业效率。其次是变革开发范式,利用先进的技术架构赋能业务快速迭代。
值得关注的是,双方将重点打造**“吉宏Agent数字员工”。这一举措预示着AI将不再仅仅是辅助工具,而是作为具备自主执行能力的“员工”深度参与到跨境电商的日常运作中。此外,双方还将在自研算力与数据资产的整合、以及AI安全加固**方面展开深度协作,确保在智能化转型的同时,筑牢数据与业务安全的底座。
业界分析认为,此次启动会的召开意味着双方的协同已进入全新阶段。通过资源整合与技术共创,双方旨在共同探索跨境电商的创新应用场景,并向行业输出可借鉴的AI应用范式。这种深度的技术融合,不仅将加速吉宏股份自身的智能化进程,也将为整个跨境电商行业的技术演进提供新的思路。
via AI新闻资讯 (author: AI Base)
上海人工智能实验室联合复旦大学、上海交通大学医学院附属瑞金医院及上海市病毒研究院,推出了一款名为 ViraHInter 的全新 AI 预测模型。这一模型的推出,标志着抗病毒药物研发进入了一个新的阶段,能够在无需进行湿实验的情况下,预测病毒将如何 “劫持” 人体内的蛋白质。
ViraHInter 是一种结合蛋白序列与结构双模态的 AI 模型。传统的蛋白相互作用预测方法,通常只分析氨基酸序列或三维结构,然而 ViraHInter 的突破之处在于其能够同时精准把握这两种信息。这一模型通过生成病毒与宿主蛋白复合物的全原子三维结构,详细描绘了每个原子的相互关系,为药物设计奠定了基础。同时,它利用蛋白语言模型,识别出在病毒快速变异中仍然保留的保守模式,从而提高预测的准确性。
在一系列的基准测试中,ViraHInter 的表现令人瞩目。其在病毒 - 人类蛋白相互作用的预测精度上达到了0.50,这一结果比 AlphaFold3高出4.5倍,远超其他预测方法。科研团队还利用这一模型对三种流感亚型进行了分析,成功锁定了33个共享的宿主因子,显示出 ViraHInter 在抗病毒药物研发中的巨大潜力。
更为重要的是,当面对新出现的病毒时,ViraHInter 展现出了强大的适应能力。在序列同源性严格受控的测试中,该模型的表现依旧优异,证明了其在应对新发病原体时的广泛应用潜力。这一发现将为抗流感和抗冠状病毒药物的研发新的靶点和方向。
via AI新闻资讯 (author: AI Base)
阿里上线 Qwen3.6-Max-Preview 预览版:智能体编程能力大幅提升
阿里上线 Qwen3.6-Max-Preview 旗舰模型预览版,核心聚焦智能体编程与世界知识能力的迭代。受架构优化驱动,该模型在 SciCode 与 SkillsBench 基准上分别实现 10.8 和 9.9 的分值增长,并在 SWE-bench Pro 等六项编程评测中位居首位。
与此同时,其世界知识与指令遵循表现同步增强,QwenChineseBench 评分提升 5.3 分。目前该模型已接入 Qwen Studio 及阿里云百炼 API,支持 preserve_thinking 功能并全面兼容 OpenAI 与 Anthropic 规范接口。
千问大模型
🌸 在花频道|茶馆讨论|投稿通道
via 科技圈🎗在花频道📮 - Telegram Channel
阿里上线 Qwen3.6-Max-Preview 旗舰模型预览版,核心聚焦智能体编程与世界知识能力的迭代。受架构优化驱动,该模型在 SciCode 与 SkillsBench 基准上分别实现 10.8 和 9.9 的分值增长,并在 SWE-bench Pro 等六项编程评测中位居首位。
与此同时,其世界知识与指令遵循表现同步增强,QwenChineseBench 评分提升 5.3 分。目前该模型已接入 Qwen Studio 及阿里云百炼 API,支持 preserve_thinking 功能并全面兼容 OpenAI 与 Anthropic 规范接口。
千问大模型
🌸 在花频道|茶馆讨论|投稿通道
via 科技圈🎗在花频道📮 - Telegram Channel
爱奇艺 “AI 艺人库” 计划引发争议 多位艺人否认授权
近日,爱奇艺在 2026 世界大会上宣布推出 “AI 艺人库” 计划,声称已有超过 100 位艺人入驻,包括张若昀、王楚然等知名演员。该计划旨在利用爱奇艺自研的 “纳逗 Pro” 影视制作平台,通过艺人的多模态数据创建专属数字分身,为影视创作提供高效和合规的数字化表演解决方案。
然而,这一计划刚发布便引发了广泛的质疑。多位艺人,包括张若昀、王楚然和于和伟,迅速通过社交媒体发声,表示他们并未签署任何与 AI 相关的授权协议。这一反转引发了公众对数字艺人和 AI 技术合规性的热烈讨论。
爱奇艺的 “AI 艺人库” 原本被认为是推动影视行业创新的重要举措,但艺人的否认使这一计划蒙上阴影。艺人们强调,自己的形象和表演未经同意便被使用,是对个人权益的侵犯。这一事件不仅引发了艺人群体的关注,也使得广大观众对 AI 技术在娱乐行业应用的合规性产生了深思。
在此背景下,关于如何有效保护艺人权益和确保数字技术合规的讨论愈发重要。随着 AI 技术的不断发展,如何平衡创新与保护个人权益,将成为影视行业亟需解决的问题。
via AI新闻资讯 (author: AI Base)
近日,爱奇艺在 2026 世界大会上宣布推出 “AI 艺人库” 计划,声称已有超过 100 位艺人入驻,包括张若昀、王楚然等知名演员。该计划旨在利用爱奇艺自研的 “纳逗 Pro” 影视制作平台,通过艺人的多模态数据创建专属数字分身,为影视创作提供高效和合规的数字化表演解决方案。
然而,这一计划刚发布便引发了广泛的质疑。多位艺人,包括张若昀、王楚然和于和伟,迅速通过社交媒体发声,表示他们并未签署任何与 AI 相关的授权协议。这一反转引发了公众对数字艺人和 AI 技术合规性的热烈讨论。
爱奇艺的 “AI 艺人库” 原本被认为是推动影视行业创新的重要举措,但艺人的否认使这一计划蒙上阴影。艺人们强调,自己的形象和表演未经同意便被使用,是对个人权益的侵犯。这一事件不仅引发了艺人群体的关注,也使得广大观众对 AI 技术在娱乐行业应用的合规性产生了深思。
在此背景下,关于如何有效保护艺人权益和确保数字技术合规的讨论愈发重要。随着 AI 技术的不断发展,如何平衡创新与保护个人权益,将成为影视行业亟需解决的问题。
划重点:
🌟 爱奇艺推出 “AI 艺人库” 计划,声称已有 100 多位艺人入驻。
⚠️ 多位艺人迅速否认签署任何与 AI 相关的授权,质疑计划的合规性。
🤔 该事件引发公众对 AI 技术在娱乐行业应用的合法性及艺人权益保护的讨论。
via AI新闻资讯 (author: AI Base)
爱奇艺上线“AI艺人库”惹争议:是降本增效的利器,还是行业“自掘坟墓”?
近日,国内长视频巨头爱奇艺正式推出了“AI艺人库”功能,这一动作在影视行业内激起了千层浪。该功能允许艺人通过授权,在平台上创建属于自己的数字虚拟形象。目前,已有部分一线当红演员率先入驻,开启了真人演员数字化的先河。
据悉,该项技术的核心在于将艺人的形象数据化。在严格保护艺人肖像权的前提下,爱奇艺计划将这些AI形象广泛应用于短剧制作、互动视频开发以及虚拟直播等多种新兴内容场景。对于平台而言,此举旨在解决传统影视拍摄中周期长、成本高、协调难等痛点,通过生成式AI技术实现实质性的降本增效。
然而,这一前卫的尝试并未获得业界的满场喝彩,反而引发了激烈的生存忧虑。不少行业观察者和从业者表达了担忧,认为这种趋势一旦失去控制,可能会导致数字人对真人演员的大规模替代。批评声音指出,这种技术导向的革新或许是在“自掘坟墓”,可能动摇影视行业以“人”为核心的情感创作根基。
目前,爱奇艺正处于生成式AI应用的探索前沿。如何在技术革新与保护行业生态之间寻找平衡,不仅是视频平台需要面对的考题,也将是整个影视工业在AI时代必须解答的难题。
via AI新闻资讯 (author: AI Base)
近日,国内长视频巨头爱奇艺正式推出了“AI艺人库”功能,这一动作在影视行业内激起了千层浪。该功能允许艺人通过授权,在平台上创建属于自己的数字虚拟形象。目前,已有部分一线当红演员率先入驻,开启了真人演员数字化的先河。
据悉,该项技术的核心在于将艺人的形象数据化。在严格保护艺人肖像权的前提下,爱奇艺计划将这些AI形象广泛应用于短剧制作、互动视频开发以及虚拟直播等多种新兴内容场景。对于平台而言,此举旨在解决传统影视拍摄中周期长、成本高、协调难等痛点,通过生成式AI技术实现实质性的降本增效。
然而,这一前卫的尝试并未获得业界的满场喝彩,反而引发了激烈的生存忧虑。不少行业观察者和从业者表达了担忧,认为这种趋势一旦失去控制,可能会导致数字人对真人演员的大规模替代。批评声音指出,这种技术导向的革新或许是在“自掘坟墓”,可能动摇影视行业以“人”为核心的情感创作根基。
目前,爱奇艺正处于生成式AI应用的探索前沿。如何在技术革新与保护行业生态之间寻找平衡,不仅是视频平台需要面对的考题,也将是整个影视工业在AI时代必须解答的难题。
via AI新闻资讯 (author: AI Base)
在人工智能开源领域,国产模型再次交出了一份惊艳的答卷。4月19日晚间,备受期待的千问3.6系列中等尺寸模型——Qwen3.6-35B-A3B正式面向全球开发者开源。
这款模型最核心的亮点在于其“以小博大”的极致效率。虽然总参数量高达350亿,但得益于先进的混合专家(MoE)架构,在实际运行推理时仅需激活30亿参数。这意味着开发者可以用更低的算力成本,获得远超同体量模型的智能输出能力。
在多项权威基准测试中,新模型的表现堪称“跨级挑战”。无论是在考察终端编程能力的Terminal-Bench2.0,还是针对真实世界Agent能力的评估中,其表现不仅大幅超越了前代产品,甚至能够与参数量更大的稠密模型一较高下。
除了硬核的编程与逻辑能力,该模型还引入了“多模态思考”模式。在处理复杂的视觉语言任务时,它能够像人类一样对图像进行空间智能分析和识别。在RefCOCO等复杂图像识别测试中,它取得的高分成绩证明了其在理解现实物理世界方面的巨大潜力。
为了让技术更快速地转化为生产力,该模型已实现与OpenClaw、Claude Code等主流Agent框架的深度兼容。这种高度的适配性,使其有望成为开发者本地部署“智能大脑”的首选底座,轻松应对长程且复杂的业务逻辑。
目前,感兴趣的开发者已经可以通过魔搭社区、Hugging Face或Qwen Studio直接下载并体验这一最新的开源成果。
via AI新闻资讯 (author: AI Base)
开发者注意!阿里云百炼平台API限流政策将迎来重要调整
为了进一步优化平台资源调度并确保整体服务的稳定性,阿里云官方于 4 月 20 日发布通知,宣布将对大模型服务平台“百炼”的多模态交互开发套件实施新的限流措施。
根据公告内容,此次调整将于 2026 年 4 月 28 日正式生效。届时,平台针对多模态交互网关的新建连接数(即默认API调用量)将统一调整为 10 QPS(每秒请求数)。
阿里云方面解释称,调整后的额度经过科学测算,能够支持每分钟新建 600 通会话或每小时处理3. 6 万通会话。这一规格足以覆盖绝大多数开发者的日常调试需求以及常规业务场景的稳定运行。
值得注意的是,本次政策调整具有一定的针对性。对于此前已经通过官方渠道申请并完成限流额度提升的客户,其既有权限将保持不变,不受此次默认值变更的影响。
此次动作反映出云服务商在应对日益增长的大模型调用需求时,正通过更精细化的流量管理手段,平衡个人开发者与企业级用户之间的资源分配。相关开发者需在 4 月 28 日前评估自身业务的调用频次,确保平稳过渡。
via AI新闻资讯 (author: AI Base)
为了进一步优化平台资源调度并确保整体服务的稳定性,阿里云官方于 4 月 20 日发布通知,宣布将对大模型服务平台“百炼”的多模态交互开发套件实施新的限流措施。
根据公告内容,此次调整将于 2026 年 4 月 28 日正式生效。届时,平台针对多模态交互网关的新建连接数(即默认API调用量)将统一调整为 10 QPS(每秒请求数)。
阿里云方面解释称,调整后的额度经过科学测算,能够支持每分钟新建 600 通会话或每小时处理3. 6 万通会话。这一规格足以覆盖绝大多数开发者的日常调试需求以及常规业务场景的稳定运行。
值得注意的是,本次政策调整具有一定的针对性。对于此前已经通过官方渠道申请并完成限流额度提升的客户,其既有权限将保持不变,不受此次默认值变更的影响。
此次动作反映出云服务商在应对日益增长的大模型调用需求时,正通过更精细化的流量管理手段,平衡个人开发者与企业级用户之间的资源分配。相关开发者需在 4 月 28 日前评估自身业务的调用频次,确保平稳过渡。
via AI新闻资讯 (author: AI Base)
阿里云优化百炼多模态开发套件 API 调用限流
阿里云宣布将对其百炼多模态交互开发套件的默认 API 调用限流进行调整。根据通知,此次调整将于 2026 年 4 月 28 日正式生效,新的默认限流将设置为每秒 10 次(QPS),以优化平台的资源调度和整体服务稳定性。
此次限流调整的具体规定为,新的限制将支持每分钟新建 600 通会话,每小时则可新建 36000 通会话。这一额度旨在满足大多数开发调试及日常业务场景的需求,确保用户在使用过程中获得更稳定的体验。
阿里云表示,已申请过限流调整的客户将不受本次变更的影响,可以继续按照原有协议进行 API 调用。此次措施是阿里云持续提升用户服务体验的一部分,旨在通过合理的资源分配,进一步推动智能交互技术的发展和应用。
via AI新闻资讯 (author: AI Base)
阿里云宣布将对其百炼多模态交互开发套件的默认 API 调用限流进行调整。根据通知,此次调整将于 2026 年 4 月 28 日正式生效,新的默认限流将设置为每秒 10 次(QPS),以优化平台的资源调度和整体服务稳定性。
此次限流调整的具体规定为,新的限制将支持每分钟新建 600 通会话,每小时则可新建 36000 通会话。这一额度旨在满足大多数开发调试及日常业务场景的需求,确保用户在使用过程中获得更稳定的体验。
阿里云表示,已申请过限流调整的客户将不受本次变更的影响,可以继续按照原有协议进行 API 调用。此次措施是阿里云持续提升用户服务体验的一部分,旨在通过合理的资源分配,进一步推动智能交互技术的发展和应用。
via AI新闻资讯 (author: AI Base)
阿里巴巴正式发布了 Qwen 系列新一代旗舰模型 ——Qwen3.6-Max-Preview。这一模型是该系列的早期预览版,用户可以在 QwenStudio 中与之进行交互对话,并通过阿里云百炼 API 以 qwen3.6-max-preview 的名称进行调用。与前一代 Qwen3.6-Plus 相比,Qwen3.6-Max-Preview 在智能体编程、世界知识和指令遵循等多个方面都有了显著提升。
根据阿里巴巴的介绍,Qwen3.6-Max-Preview 在六项主要编程基准测试中取得了最高分,这些基准包括 SWE-benchPro、Terminal-Bench2.0、SkillsBench、QwenClawBench、QwenWebBench 以及 SciCode。这些成绩标志着该模型在编程能力上迈出了重要一步。具体来说,在智能体编程能力方面,Qwen3.6-Max-Preview 在 SkillsBench 中提高了 9.9 分,在 SciCode 中提升了 10.8 分,而在 NL2Repo 和 Terminal-Bench2.0 中分别提升了 5.0 分和 3.8 分。
此外,Qwen3.6-Max-Preview 在世界知识的掌握上也有显著增强,SuperGPQA 的分数提升了 2.3 分,QwenChineseBench 则提高了 5.3 分。同时,该模型在指令遵循能力方面表现出色,ToolcallFormatIFBench 的分数提高了 2.8 分。这些提升使得 Qwen3.6-Max-Preview 成为了智能编程领域的重要创新。
尽管这是预览版本,阿里巴巴表示,Qwen3.6-Max-Preview 仍在积极开发中,后续版本将继续进行优化,力争在未来带来更为强大的功能和性能提升。
划重点:
🌟 Qwen3.6-Max-Preview 是阿里巴巴发布的最新旗舰模型,具有显著的编程能力提升。
📈 六项编程基准测试中,该模型均取得最高分,展示出强大的智能编程能力。
🔧 该模型仍在开发中,未来将继续优化以提供更优质的服务。
via AI新闻资讯 (author: AI Base)