https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
↩️ ChatGPT 推出“健康”专属体验
ChatGPT 推出“健康”专属体验
ChatGPT推出专门针对健康与保健的新功能。用户可在授权下连接电子病历与健康应用,基于个人信息获取更相关的建议,辅助理解化验结果、就诊准备及日常管理,作为辅助工具,不用于诊断或替代临床护理。
在隐私与安全方面,采用专用加密、隔离机制与独立记忆,健康对话不用于训练基础模型并支持多因素认证。ChatGPT健康与全球260多位医生合作开发,通过HealthBench框架评估回复质量。功能初期面向小部分用户开放,电子健康记录整合目前仅限美国用户。
OpenAI | 加入候补名单
🍀在花频道 🍵茶馆聊天 📮投稿
via 科技圈🎗在花频道📮 - Telegram Channel
科技圈🎗在花频道📮:
OpenAI 宣布推出 ChatGPT 智能体 OpenAI 今日宣布推出 ChatGPT 智能体功能,该功能整合了此前 Operator 和深度研究工具的能力,可在虚拟计算机环境中自主完成复杂任务。用户可要求其处理日程安排、竞品分析、制作演示文稿等工作流程。 新功能配备可视化浏览器、文本浏览器、终端和 API 访问等工具套件,支持网站交互、数据分析和文件处理。该功能已在多项学术评估中达行业领先水平。Pro 用户每月可使用 400 次,Plus 和 Team 用户为 50 次。该功能今日起向付费用户分…
ChatGPT 推出“健康”专属体验
ChatGPT推出专门针对健康与保健的新功能。用户可在授权下连接电子病历与健康应用,基于个人信息获取更相关的建议,辅助理解化验结果、就诊准备及日常管理,作为辅助工具,不用于诊断或替代临床护理。
在隐私与安全方面,采用专用加密、隔离机制与独立记忆,健康对话不用于训练基础模型并支持多因素认证。ChatGPT健康与全球260多位医生合作开发,通过HealthBench框架评估回复质量。功能初期面向小部分用户开放,电子健康记录整合目前仅限美国用户。
OpenAI | 加入候补名单
🍀在花频道 🍵茶馆聊天 📮投稿
via 科技圈🎗在花频道📮 - Telegram Channel
🩺 OpenAI 推出 ChatGPT 健康专属功能并整合电子病历
OpenAI 宣布推出专门针对健康与保健的 ChatGPT 新功能。该功能允许用户在授权前提下连接电子病历与健康应用,利用个人健康信息获取相关建议,辅助用户理解化验结果、准备就诊及进行日常健康管理。官方明确该功能定位为辅助工具,不用于医疗诊断或替代临床护理。在隐私保护方面,系统采用专用加密、隔离机制与独立记忆功能,且健康对话数据不会被用于训练基础模型,同时支持多因素认证。该功能由 OpenAI 与全球 260 多位医生合作开发,并使用 HealthBench 框架评估回复质量。目前,该功能仅面向小部分用户开放,其中电子健康记录的整合功能现阶段仅限美国用户使用。
(科技圈)
via 茶馆 - Telegram Channel
OpenAI 宣布推出专门针对健康与保健的 ChatGPT 新功能。该功能允许用户在授权前提下连接电子病历与健康应用,利用个人健康信息获取相关建议,辅助用户理解化验结果、准备就诊及进行日常健康管理。官方明确该功能定位为辅助工具,不用于医疗诊断或替代临床护理。在隐私保护方面,系统采用专用加密、隔离机制与独立记忆功能,且健康对话数据不会被用于训练基础模型,同时支持多因素认证。该功能由 OpenAI 与全球 260 多位医生合作开发,并使用 HealthBench 框架评估回复质量。目前,该功能仅面向小部分用户开放,其中电子健康记录的整合功能现阶段仅限美国用户使用。
(科技圈)
via 茶馆 - Telegram Channel
OpenAI 宣布推出专为健康与保健领域打造的新功能——ChatGPT 健康 (ChatGPT Health)。这是 ChatGPT 问世以来,首次针对特定隐私敏感领域构建的独立交互空间。该功能的初衷是解决用户健康数据零散、难以复用的痛点,帮助人们更高效地管理自己的健康指标。
目前,全球每周有超过2.3亿用户尝试通过 ChatGPT 寻求健康建议。为了提供更精准、更具个性化的反馈,ChatGPT Health允许用户安全地连接自己的电子医疗记录(EHR)以及主流健康应用,包括 Apple 健康、MyFitnessPal 和 Function 等。这意味着 ChatGPT 可以基于你真实的化验结果、睡眠数据或饮食习惯,协助你解读检查报告,并为即将到来的医生就诊准备针对性的问询清单。
隐私保护是此次升级的核心。OpenAI 建立了一个完全隔离的“健康”空间,该空间内的对话数据不仅经过专用加密,且明确承诺不会用于训练其基础模型。此外,该空间拥有独立的记忆系统,健康信息不会外流到用户的普通聊天对话中。
为了确保信息的专业度,OpenAI 在过去两年里与全球260多位执业医生合作,对模型进行了超过60万次的反馈训练。模型回复遵循由医生编写的 HealthBench 评估框架,优先强调安全性与临床标准。需要注意的是,该功能定位为医疗辅助工具而非诊断工具,其核心目标是补充而非替代专业的临床护理。目前,该功能正逐步向部分用户开放,用户可通过网页端或 iOS 应用加入候补名单。
划重点:
● 🔐 数据隔离与隐私加强:设立独立的“健康”对话空间,采用专用加密技术,且相关对话数据绝不用于 AI 模型训练。
● 🏥 深度连接健康生态:支持接入电子病历(EHR)及 Apple 健康等第三方应用,使 AI 能基于真实的化验结果和运动数据提供建议。
● 🩺 医生参与深度调优:联合全球260多位医生进行临床化训练,确保 AI 回复在专业解释、就诊建议等方面符合医学逻辑与安全性。
via AI新闻资讯 (author: AI Base)
💰 OpenAI 预留 500 亿美元用于股权激励池
据《信息报》(The Information)报道,OpenAI 已为其股权激励池预留了 500 亿美元。路透社援引该消息称,这笔资金将专门用于员工的股权激励发放。
(路透社)
via 茶馆 - Telegram Channel
据《信息报》(The Information)报道,OpenAI 已为其股权激励池预留了 500 亿美元。路透社援引该消息称,这笔资金将专门用于员工的股权激励发放。
(路透社)
via 茶馆 - Telegram Channel
Grok在X平台上每小时生成数千张裸露图像
第三方分析显示,马斯克旗下社交平台 X 已成为传播AI生成的非自愿脱衣图像的主要网站,本周早些时候,该平台每小时就会出现数千张此类图片。自去年12月下旬以来,越来越多的 X 平台用户利用该平台内置的人工智能聊天机器人 Grok,对他人发布的自拍照进行篡改。社交媒体与深度伪造技术研究员吉纳维芙·吴指出,在对Grok官方账号发布到 X 平台的图片进行的24小时监测中发现,该聊天机器人平均每小时生成约6700张带有性暗示或裸露性质的图像。吴还发现,在1月5日至1月6日的同一监测周期内,其余五个传播此类内容的主要网站,平均每小时新增的人工智能“脱衣” 图像仅为79张。
—— 彭博社
via 风向旗参考快讯 - Telegram Channel
第三方分析显示,马斯克旗下社交平台 X 已成为传播AI生成的非自愿脱衣图像的主要网站,本周早些时候,该平台每小时就会出现数千张此类图片。自去年12月下旬以来,越来越多的 X 平台用户利用该平台内置的人工智能聊天机器人 Grok,对他人发布的自拍照进行篡改。社交媒体与深度伪造技术研究员吉纳维芙·吴指出,在对Grok官方账号发布到 X 平台的图片进行的24小时监测中发现,该聊天机器人平均每小时生成约6700张带有性暗示或裸露性质的图像。吴还发现,在1月5日至1月6日的同一监测周期内,其余五个传播此类内容的主要网站,平均每小时新增的人工智能“脱衣” 图像仅为79张。
—— 彭博社
via 风向旗参考快讯 - Telegram Channel
据报道,人工智能公司 Anthropic 正筹备一轮新融资,拟以 3500 亿美元的估值募资 100 亿美元。另有知情人士证实了该融资规模与估值信息。这家 Claude 聊天机器人的开发企业,三个月前刚完成一轮 130 亿美元的 F 轮融资,彼时估值为 1830 亿美元。此次新融资若落地,该公司估值将实现近乎翻倍的增长。而在今年 3 月,Anthropic 还曾以 615 亿美元的估值完成过 35 亿美元融资。
知情人士称,本轮融资将由蔻图投资公司与新加坡主权财富基金新加坡政府投资公司牵头领投。Anthropic 预计将在未来几周内完成这轮最新融资,不过最终融资金额仍存在变动可能。
需要注意的是,此次融资与英伟达、微软近期承诺的 150 亿美元投资是两笔独立交易。在后一笔 “循环交易” 中,Anthropic 将向微软 Azure 云平台采购价值 300 亿美元的算力服务,而这些算力将基于英伟达的芯片运行。
Anthropic 此次筹募新资金,正值其凭借代码工具 Claude Code 持续赢得开发者青睐之际。该工具由 Claude Opus 4.5 大模型驱动,可实现代码编写自动化。与此同时,Anthropic 也正与主要竞争对手 OpenAI 同步筹备今年可能启动的首次公开募股(IPO)。据悉,OpenAI 也在洽谈一轮最高融资额 1000 亿美元、估值最高达 8300 亿美元的融资。
对此,Anthropic 方面拒绝置评。
via cnBeta.COM - 中文业界资讯站 (author: 稿源:环球市场播报)
Elevated error rates for Responses API
Status: Identified
We have identified that users are experiencing elevated errors for the impacted services. We are working on implementing a mitigation.
Affected components
● Responses (Degraded performance)
via OpenAI status
Status: Identified
We have identified that users are experiencing elevated errors for the impacted services. We are working on implementing a mitigation.
Affected components
● Responses (Degraded performance)
via OpenAI status
Alphabet 的市场价值在周三达到 3.88 万亿美元,超过了苹果公司的 3.84 万亿美元,这是自 2019 年以来谷歌母公司首次在市值上领先。Alphabet 股价当日上涨超过 2%,收于 322.03 美元。在 Ironwood 芯片和 Gemini 3 等人工智能项目的推动下,该公司股价在 2025 年实现了 65% 的增长。相比之下,苹果公司的股价因人工智能项目推迟而表现滞后,其计划在 2026 年推出“更具个性化的 Siri”。Alphabet 首席执行官 Sundar Pichai 指出,Google Cloud 业务需求强劲,其中超过 10 亿美元的订单规模已超过前两年的总和。
(财经快讯)
via 茶馆 - Telegram Channel
OpenAI 正式发布一款以健康场景为核心的新产品 ChatGPT Health,将其定位为用户在人工智能辅助下获取健康与医疗相关信息的“医疗盟友”。这一功能以 ChatGPT 内部的独立沙盒页签形式提供,拥有与普通对话区分开的对话记录与记忆功能,旨在为用户提供更安全、更个性化的健康咨询环境。
OpenAI 表示,ChatGPT Health 将鼓励用户接入个人医疗记录以及多种健康与健身应用,以便模型在更充分的背景信息基础上生成回答。官方举例称,用户可连接 Apple Health、Peloton、MyFitnessPal、Weight Watchers 以及 Function 等服务,由此让 ChatGPT 获取包括运动、睡眠、活动模式在内的健康与健身数据,并结合饮食记录和实验室检测结果,为用户提供更具针对性的建议。在医疗记录层面,OpenAI 建议用户授权上传检查结果、就诊小结和既往病史等内容,以便模型帮助解释相关信息。
在产品功能方面,OpenAI 称 ChatGPT Health 可以辅助用户理解近期的化验和检查结果、为看医生前的问诊沟通做准备、就饮食与锻炼计划提供建议,并帮助梳理不同医疗保险方案在费用与保障范围上的利弊,前提是用户在长期使用中形成了一定的健康行为和医疗利用“模式”。为实现与医疗机构系统的对接,OpenAI 还与 b.well 合作,由后者提供后端整合服务,使用户得以将来自约 220 万家医疗服务提供者的电子病历接入这一平台。
目前,ChatGPT Health 处于测试阶段,用户需要通过候补名单申请加入早期体验,之后该产品将逐步向所有用户开放,且与订阅等级无关。OpenAI 在博文中指出,根据其对匿名化对话数据的分析,每周已有逾 2.3 亿人向 ChatGPT 提出健康与保健方面的问题,这一需求被视为推出独立健康产品的重要背景。不过,OpenAI 同时在宣传中强调,ChatGPT Health“并非用于诊断或治疗”,而是为用户提供信息理解和决策辅助,真正的诊断和治疗仍应由专业医疗人员完成。
via cnBeta.COM - 中文业界资讯站 (author: 稿源:cnBeta.COM)
elevated errors on claude.ai
Jan 7, 19:07 UTC
Investigating - We are currently investigating this issue.
via Claude Status - Incident History
Jan 7, 19:07 UTC
Investigating - We are currently investigating this issue.
via Claude Status - Incident History
💰 Anthropic 计划以 3500 亿美元估值融资 100 亿美元
据知情人士透露,Claude 聊天机器人的开发商 Anthropic 计划以 3500 亿美元的投前估值筹集 100 亿美元资金。本次融资预计由新加坡政府投资公司(GIC)和 Coatue Management 领投,并可能在未来几周内完成。若此次融资达成,Anthropic 的估值将较四个月前近乎翻倍;此前该公司在 9 月份完成了 130 亿美元的融资,当时的估值为 183 亿美元。
(财经快讯)
via 茶馆 - Telegram Channel
据知情人士透露,Claude 聊天机器人的开发商 Anthropic 计划以 3500 亿美元的投前估值筹集 100 亿美元资金。本次融资预计由新加坡政府投资公司(GIC)和 Coatue Management 领投,并可能在未来几周内完成。若此次融资达成,Anthropic 的估值将较四个月前近乎翻倍;此前该公司在 9 月份完成了 130 亿美元的融资,当时的估值为 183 亿美元。
(财经快讯)
via 茶馆 - Telegram Channel
根据Similarweb发布的最新《全球AI追踪报告》(数据截至2025年12月),全球生成式AI市场正呈现显著的分化趋势。数据显示,ChatGPT去年同期的87.2%下滑到68.0%份额。Gemini市场份额从5.4%激增至18.2%。DeepSeek表现出强劲的增长势头,市场份额升至约4.0%。
报告进一步指出,AI工具的市场格局正从“一家独大”向“多强并存”转变,用户选择日趋多样化。数据表明,随着AI应用场景的细分,用户开始根据特定需求(如搜索整合、长文本处理或技术开发)选择不同的工具,推动了市场的多元化发展。
Similarweb | Search Engine Land
🍀在花频道 🍵茶馆聊天 📮投稿
via 科技圈🎗在花频道📮 - Telegram Channel
📊 全球生成式AI市场份额变动:ChatGPT占比下滑,Gemini与DeepSeek显著增长
根据Similarweb发布的截至2025年12月的《全球AI追踪报告》,全球生成式AI市场呈现显著的分化趋势。数据显示,ChatGPT的市场份额从去年同期的87.2%下滑至68.0%。与此同时,Gemini的市场份额从5.4%激增至18.2%,DeepSeek的市场份额也升至约4.0%。报告指出,AI工具的市场格局正从“一家独大”向“多强并存”转变。随着AI应用场景的细分,用户开始根据搜索整合、长文本处理或技术开发等特定需求选择不同的工具,这一行为推动了市场的多元化发展。
(科技圈)
via 茶馆 - Telegram Channel
根据Similarweb发布的截至2025年12月的《全球AI追踪报告》,全球生成式AI市场呈现显著的分化趋势。数据显示,ChatGPT的市场份额从去年同期的87.2%下滑至68.0%。与此同时,Gemini的市场份额从5.4%激增至18.2%,DeepSeek的市场份额也升至约4.0%。报告指出,AI工具的市场格局正从“一家独大”向“多强并存”转变。随着AI应用场景的细分,用户开始根据搜索整合、长文本处理或技术开发等特定需求选择不同的工具,这一行为推动了市场的多元化发展。
(科技圈)
via 茶馆 - Telegram Channel
🤖 《MIT科技评论》发布“幻觉修正”系列报道探讨人工智能预期重置
《MIT科技评论》于2025年12月16日推出了名为“幻觉修正”(Hype Correction)的专题系列文章,旨在重新审视并调整公众对人工智能(AI)的技术预期。文章指出,过去几年关于AI将解决气候变化、达到人类水平智能或彻底消除劳动的宣传过于密集,而当前的实际产出多表现为低质量内容、聊天机器人故障以及辅助撰写邮件等工具。该系列报道通过多个维度分析了AI现状:James O’Donnell 梳理了 OpenAI 首席执行官 Sam Altman 的言论;Alex Heath 剖析了 AI 泡沫的构成及后续观察点;Michelle Kim 探讨了 AI 取代律师等特定职业的论调,指出目前尚未实现且未来仍具不确定性;Edd Gent 评估了 AI 编程的实际效能,认为其表现尚无定论;David Rotman 则阐述了 AI 在材料发现领域实现突破前所需的现实工作。此外,报道还涉及了 AI 安全领域专家对技术威胁论的观点转变,以及生成式 AI 的热度可能掩盖了其他重要 AI 突破的问题。文章总结称,AI 行业正进入“后幻觉阶段”(post-hype phase),在面临巨额财务与环境成本的背景下,各界需冷静审视该技术的长期价值,真正的核心应用可能仍有待出现。
(MIT Technology Review)
via 茶馆 - Telegram Channel
《MIT科技评论》于2025年12月16日推出了名为“幻觉修正”(Hype Correction)的专题系列文章,旨在重新审视并调整公众对人工智能(AI)的技术预期。文章指出,过去几年关于AI将解决气候变化、达到人类水平智能或彻底消除劳动的宣传过于密集,而当前的实际产出多表现为低质量内容、聊天机器人故障以及辅助撰写邮件等工具。该系列报道通过多个维度分析了AI现状:James O’Donnell 梳理了 OpenAI 首席执行官 Sam Altman 的言论;Alex Heath 剖析了 AI 泡沫的构成及后续观察点;Michelle Kim 探讨了 AI 取代律师等特定职业的论调,指出目前尚未实现且未来仍具不确定性;Edd Gent 评估了 AI 编程的实际效能,认为其表现尚无定论;David Rotman 则阐述了 AI 在材料发现领域实现突破前所需的现实工作。此外,报道还涉及了 AI 安全领域专家对技术威胁论的观点转变,以及生成式 AI 的热度可能掩盖了其他重要 AI 突破的问题。文章总结称,AI 行业正进入“后幻觉阶段”(post-hype phase),在面临巨额财务与环境成本的背景下,各界需冷静审视该技术的长期价值,真正的核心应用可能仍有待出现。
(MIT Technology Review)
via 茶馆 - Telegram Channel
🚀 Claude Code 开发者分享高效工作流:多智能体并行与 AI 驱动开发的现状争议
核心工作流与技术实践
Claude Code 的创作者 Boris Cherny 近期分享了他的开发配置与工作模式。他提倡使用高度并行的工作流,通常同时运行 5 到 10 个智能体实例,每周产出 50 至 100 个拉取请求(PR)。该流程的核心在于利用“计划模式”(Plan mode)先行制定技术规范,随后由子智能体(sub-agents)执行具体任务或进行代码审查。此外,该工具支持通过特定指令(如“&”)将本地 CLI 任务“传送”至 Web 端处理,实现跨平台协作。为了提升 AI 的执行准确度,开发者建议在项目中维护 `CLAUDE.md` 文件,用于记录架构决策和编码规则等“隐性知识”。
AI 驱动的初创企业与生产力变革
讨论指出,AI 正在改变软件开发的交付速度。有开发者报告称,利用 Claude 等工具在数日或数月内完成了过去需要数周或数年才能开发出的产品,包括实时战略游戏和企业级 CRM 系统。目前已出现完全由 1 至 2 人组成的 AI 驱动型初创公司,部分创始人选择隐瞒 AI 的使用程度,以规避负面评价或竞争风险。有观点预测,随着 AI 能够快速生成定制化解决方案,传统通用型 SaaS 软件的市场空间可能被压缩,软件行业的利润率或将面临下行压力。
技术局限性与成本争议
尽管生产力数据显著,但 Claude Code 在实际应用中仍面临技术挑战。用户反馈该工具存在 UI 闪烁、并发处理导致的内部 JSON 文件损坏以及终端刷新等 Bug。在复杂代码库中,AI 仍可能产生逻辑错误或冗余代码,要求开发者必须进行严格的人工审查。此外,高强度使用 AI 智能体带来了高昂的成本支出,部分重度用户报告每日 API 信用额度消耗达 1000 美元。怀疑论者认为,目前的 AI 更多是作为“快速键盘”存在,在处理核心架构和复杂逻辑问题时,人类的监督与干预依然是不可逾越的瓶颈。
(HackerNews)
via 茶馆 - Telegram Channel
核心工作流与技术实践
Claude Code 的创作者 Boris Cherny 近期分享了他的开发配置与工作模式。他提倡使用高度并行的工作流,通常同时运行 5 到 10 个智能体实例,每周产出 50 至 100 个拉取请求(PR)。该流程的核心在于利用“计划模式”(Plan mode)先行制定技术规范,随后由子智能体(sub-agents)执行具体任务或进行代码审查。此外,该工具支持通过特定指令(如“&”)将本地 CLI 任务“传送”至 Web 端处理,实现跨平台协作。为了提升 AI 的执行准确度,开发者建议在项目中维护 `CLAUDE.md` 文件,用于记录架构决策和编码规则等“隐性知识”。
AI 驱动的初创企业与生产力变革
讨论指出,AI 正在改变软件开发的交付速度。有开发者报告称,利用 Claude 等工具在数日或数月内完成了过去需要数周或数年才能开发出的产品,包括实时战略游戏和企业级 CRM 系统。目前已出现完全由 1 至 2 人组成的 AI 驱动型初创公司,部分创始人选择隐瞒 AI 的使用程度,以规避负面评价或竞争风险。有观点预测,随着 AI 能够快速生成定制化解决方案,传统通用型 SaaS 软件的市场空间可能被压缩,软件行业的利润率或将面临下行压力。
技术局限性与成本争议
尽管生产力数据显著,但 Claude Code 在实际应用中仍面临技术挑战。用户反馈该工具存在 UI 闪烁、并发处理导致的内部 JSON 文件损坏以及终端刷新等 Bug。在复杂代码库中,AI 仍可能产生逻辑错误或冗余代码,要求开发者必须进行严格的人工审查。此外,高强度使用 AI 智能体带来了高昂的成本支出,部分重度用户报告每日 API 信用额度消耗达 1000 美元。怀疑论者认为,目前的 AI 更多是作为“快速键盘”存在,在处理核心架构和复杂逻辑问题时,人类的监督与干预依然是不可逾越的瓶颈。
(HackerNews)
via 茶馆 - Telegram Channel
据《韩国经济日报》报道,高通(Qualcomm)首席执行官克里斯蒂亚诺·阿蒙(Cristiano Amon)表示,公司正就2纳米工艺芯片的代工制造与三星电子进行洽谈。阿蒙指出,在多家半导体代工企业中,高通首先选择了与三星电子讨论利用其最新的2纳米工艺进行生产,目前相关设计工作已经完成,并计划在不久的将来投入商业化应用。
对于上述消息,高通方面未在非工作时间立即作出回应,三星电子则表示不对特定客户发表评论。三星电子共同首席执行官兼芯片业务负责人全永铉(Jun Young-hyun)上周曾表示,近期与主要客户达成的供应协议已使公司代工业务具备发展基础。此外,三星电子曾于2025年7月与特斯拉签署了一项价值165亿美元的协议。
(路透社)
via 茶馆 - Telegram Channel
大学教授实测AI眼镜“作弊”:30分钟斩获92.5分 碾压95%的学生
近日,香港科技大学张军教授、孟子立教授团队的一场实验引发热议。一款搭载ChatGPT-5.2模型的乐奇Rokid AI眼镜,在《计算机网络原理》期末考中,30分钟交卷斩获92.5分,成绩碾压95%的人类考生!
这场实验完全复刻真实考试场景,硬件选中开发自由度更高的乐奇Rokid AI眼镜,软件搭载响应速度与知识储备顶尖的ChatGPT-5.2模型。
考试过程中,AI眼镜通过内置摄像头拍摄题目,传输至大模型,0.8秒内完成推理生成答案,再反向回显至镜片供抄录。
最终表现亮眼:选择题与单页短答题全满分,跨页逻辑题虽有细微计算偏差,但推理连贯性与步骤完整性远超多数学生。
此前英国雷丁大学研究也有印证,94%的AI生成答卷能通过人工审核,且平均成绩高于真实学生。
这场实验的关键在于揭示了传统教学评估的核心矛盾:以知识点记忆、标准步骤推导为核心的笔试,恰好是AI最擅长的领域。
当机器比人类更擅长 “交标准答案”,传统考试的衡量意义被大幅削弱。
面对冲击,高校已开始探索改革路径,比如纽约大学推出AI口试系统,通过追问推演思路评估真实理解;部分院校引入展示型作业与现场答辩,要求学生解释决策依据。
还有机构采用“过程性档案袋”,记录从提问到解题的完整轨迹,将评估重心从“结果”转向“思考过程”。
via cnBeta.COM - 中文业界资讯站 (author: 稿源:快科技)
近日,香港科技大学张军教授、孟子立教授团队的一场实验引发热议。一款搭载ChatGPT-5.2模型的乐奇Rokid AI眼镜,在《计算机网络原理》期末考中,30分钟交卷斩获92.5分,成绩碾压95%的人类考生!
这场实验完全复刻真实考试场景,硬件选中开发自由度更高的乐奇Rokid AI眼镜,软件搭载响应速度与知识储备顶尖的ChatGPT-5.2模型。
考试过程中,AI眼镜通过内置摄像头拍摄题目,传输至大模型,0.8秒内完成推理生成答案,再反向回显至镜片供抄录。
最终表现亮眼:选择题与单页短答题全满分,跨页逻辑题虽有细微计算偏差,但推理连贯性与步骤完整性远超多数学生。
此前英国雷丁大学研究也有印证,94%的AI生成答卷能通过人工审核,且平均成绩高于真实学生。
这场实验的关键在于揭示了传统教学评估的核心矛盾:以知识点记忆、标准步骤推导为核心的笔试,恰好是AI最擅长的领域。
当机器比人类更擅长 “交标准答案”,传统考试的衡量意义被大幅削弱。
面对冲击,高校已开始探索改革路径,比如纽约大学推出AI口试系统,通过追问推演思路评估真实理解;部分院校引入展示型作业与现场答辩,要求学生解释决策依据。
还有机构采用“过程性档案袋”,记录从提问到解题的完整轨迹,将评估重心从“结果”转向“思考过程”。
via cnBeta.COM - 中文业界资讯站 (author: 稿源:快科技)