https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
韩国力推“主权AI”遭遇尴尬:本土大模型被曝深度引用中国代码
韩国在追求人工智能自主化的道路上正面临一场意想不到的舆论风波。据《华尔街日报》消息,韩国政府为摆脱对中美科技巨头的依赖,正倾力支持本土“主权AI”的发展。然而,近期多项调查发现,被寄予厚望的本土大模型在核心代码层面与中国及美国的开源模型存在高度相似性,引发了业界对“国产大模型”纯度的激烈讨论。
在这场由政府发起的 AI 开发竞赛中,五家入围决赛的企业中有三家被指出使用了外国开源代码。其中,初创公司 Upstage 受到公开质疑,其模型模块被指与中国智谱 AI 的开源模型高度雷同,代码中甚至保留了原作者的版权标记。随后,韩国科技巨头 Naver 和 SK 电讯也相继卷入风波,两家公司的模型分别被指在视觉编码器和推理代码上,与阿里巴巴及 DeepSeek 的产品存在相似之处。
面对质疑,相关公司解释称,完全从零开始编写每一行代码在当前的技术环境下并不现实。Naver 等公司强调,虽然使用了部分外部标准化工具,但决定模型学习与训练的核心引擎仍属于自主研发。尽管争议不断,韩国政府方面表现得相对宽容。韩国科学部长表示,这种激烈的技术辩论反而预示着韩国 AI 产业的活跃与前景。目前,官方计划继续按原定方案评选优胜模型,旨在2027年前打造出性能达到全球领先水平的本土 AI 工具。
划重点:
● 🇰🇷 自主化受阻: 韩国为确保技术主权发起 AI 竞赛,力求在2027年前开发出能与 OpenAI 等巨头竞争的本土模型,但深陷外部代码依赖争议。
● 💻 引用中国代码: 包括 Upstage、Naver 和 SK 电讯在内的多家决赛入围公司,被曝在其模型中引用了智谱 AI、阿里巴巴或 DeepSeek 的开源元素。
● 🛡️ 技术路线争论: 专家认为放弃开源红利并非明智之举,而反对者则担心过度依赖外国工具会带来安全风险并削弱“主权 AI”的初衷。
via AI新闻资讯 (author: AI Base)
韩国在追求人工智能自主化的道路上正面临一场意想不到的舆论风波。据《华尔街日报》消息,韩国政府为摆脱对中美科技巨头的依赖,正倾力支持本土“主权AI”的发展。然而,近期多项调查发现,被寄予厚望的本土大模型在核心代码层面与中国及美国的开源模型存在高度相似性,引发了业界对“国产大模型”纯度的激烈讨论。
在这场由政府发起的 AI 开发竞赛中,五家入围决赛的企业中有三家被指出使用了外国开源代码。其中,初创公司 Upstage 受到公开质疑,其模型模块被指与中国智谱 AI 的开源模型高度雷同,代码中甚至保留了原作者的版权标记。随后,韩国科技巨头 Naver 和 SK 电讯也相继卷入风波,两家公司的模型分别被指在视觉编码器和推理代码上,与阿里巴巴及 DeepSeek 的产品存在相似之处。
面对质疑,相关公司解释称,完全从零开始编写每一行代码在当前的技术环境下并不现实。Naver 等公司强调,虽然使用了部分外部标准化工具,但决定模型学习与训练的核心引擎仍属于自主研发。尽管争议不断,韩国政府方面表现得相对宽容。韩国科学部长表示,这种激烈的技术辩论反而预示着韩国 AI 产业的活跃与前景。目前,官方计划继续按原定方案评选优胜模型,旨在2027年前打造出性能达到全球领先水平的本土 AI 工具。
划重点:
● 🇰🇷 自主化受阻: 韩国为确保技术主权发起 AI 竞赛,力求在2027年前开发出能与 OpenAI 等巨头竞争的本土模型,但深陷外部代码依赖争议。
● 💻 引用中国代码: 包括 Upstage、Naver 和 SK 电讯在内的多家决赛入围公司,被曝在其模型中引用了智谱 AI、阿里巴巴或 DeepSeek 的开源元素。
● 🛡️ 技术路线争论: 专家认为放弃开源红利并非明智之举,而反对者则担心过度依赖外国工具会带来安全风险并削弱“主权 AI”的初衷。
via AI新闻资讯 (author: AI Base)
1月13日,完全禁止AI生成内容的插画网站TEGAKI(手描き,意为手绘)正式上线。这一类Pixiv的创意平台因其"AI禁入"特色引发日本创作者热捧,上线首日注册用户超5000人,远超预期的50人,直接导致网站崩溃。截至发稿,TEGAKI已进入维护状态,重新开放时间未定。
TEGAKI由独立工程师兼艺术家Tochi开发,定位为人类创作艺术的"安全港湾",无论传统艺术还是数字艺术,完全禁止AI生成或辅助创作的图像。为确保内容纯粹性,平台配备了严格的认证系统,创作者需提交延时视频和工作文件证明作品确系手绘。
在防AI学习方面,TEGAKI采取了多重防护措施:禁止GPTBot、CCBot和Google-Extended等主流AI爬虫访问,在所有页面设置元标签阻止AI学习,阻止可疑批量访问,并通过禁用右键和拖动功能防止图像下载。
值得注意的是,Tochi强调TEGAKI并非"否定AI技术本身"。网站在开发、维护和运营辅助过程中也使用了AI代码。"科技只是工具,我认为如何使用它取决于每个人自己,"Tochi表示,开发TEGAKI的初衷是为喜欢手绘和传统创作方法的人们创建交流平台,提供安全环境。
这一事件折射出AI生成内容对传统创作领域的冲击,以及艺术创作者对保护原创作品和创作空间的强烈诉求。TEGAKI的火爆也显示出,在AI艺术泛滥的当下,纯人类创作内容仍具有独特价值和市场需求。
via AI新闻资讯 (author: AI Base)
韩国“主权AI”遭遇信任危机:国产大模型被曝使用中、美开源代码,技术自主之路何其艰难?
据《华尔街日报》 1 月 14 日报道,韩国政府斥巨资推动的“本土大模型竞赛”陷入争议漩涡:五家决赛入围企业中,至少三家被指在其模型中使用了来自中国和美国公司的开源代码,包括智谱AI、阿里巴巴、OpenAI及DeepSeek等,引发关于“国产AI是否真正自主”的激烈辩论。
这场始于 2024 年 6 月的国家级项目,旨在三年内打造性能达到国际领先模型95%水平的纯韩国技术大模型,以减少对中美科技巨头的依赖,保障国家经济与安全利益。获胜者将获得政府提供的优质数据、人才资金及关键AI芯片使用权。然而,理想丰满,现实骨感——当技术全球化与开源协作成为行业常态,“从零造轮子”的自主路线显得愈发不切实际。
争议焦点集中于入围企业Upstage。竞争对手Sionic AI CEO高锡贤公开指控其模型部分模块与中国智谱AI的开源代码高度相似,甚至残留版权标记,质疑其“套壳中国模型却申领 taxpayer 资金”。尽管Upstage紧急召开直播发布会,展示完整训练日志证明核心模型为自研,并解释仅在推理框架(非训练核心)中使用了全球广泛采用的智谱开源组件,高锡贤随后道歉,但风波已起。
随后,Naver与SK电讯亦被卷入。Naver被指其视觉与音频编码器与阿里通义千问及OpenAI产品存在相似性;SK电讯则被发现推理代码与DeepSeek开源库雷同。两家公司均强调:模型的核心训练引擎完全自研,外部组件仅用于标准化的输入/输出处理,属于行业通用实践。
对此,学界观点两极。哈佛大学教授魏裕炎指出:“拒绝开源软件等于放弃技术红利,完全自研每一行代码既不现实也无必要。”首尔国立大学AI研究所所长李在武也证实,受质疑模型的核心参数训练过程确为从零开始,未直接复制外国模型权重。
然而,反对者担忧:即便仅使用外围代码,也可能引入潜在后门或依赖风险,削弱“主权AI”的战略意义。目前,韩国科学部尚未就竞赛规则中“是否允许使用外国开源代码”作出明确界定,但部长裴庆勋表示欢迎技术辩论,称“这正是韩国AI未来的光明所在”。
在全球加速构建“AI主权”的浪潮下,韩国困境折射出一个普遍难题:在高度互联的AI生态中,真正的“技术独立”边界究竟在哪里? 是代码逐行自研,还是核心算法与数据主权可控?这场风波或许没有简单答案,但它无疑为各国敲响警钟——AI自主化,远不止一场模型竞赛,而是一场涵盖技术伦理、产业政策与全球协作的系统性工程。
via AI新闻资讯 (author: AI Base)
据《华尔街日报》 1 月 14 日报道,韩国政府斥巨资推动的“本土大模型竞赛”陷入争议漩涡:五家决赛入围企业中,至少三家被指在其模型中使用了来自中国和美国公司的开源代码,包括智谱AI、阿里巴巴、OpenAI及DeepSeek等,引发关于“国产AI是否真正自主”的激烈辩论。
这场始于 2024 年 6 月的国家级项目,旨在三年内打造性能达到国际领先模型95%水平的纯韩国技术大模型,以减少对中美科技巨头的依赖,保障国家经济与安全利益。获胜者将获得政府提供的优质数据、人才资金及关键AI芯片使用权。然而,理想丰满,现实骨感——当技术全球化与开源协作成为行业常态,“从零造轮子”的自主路线显得愈发不切实际。
争议焦点集中于入围企业Upstage。竞争对手Sionic AI CEO高锡贤公开指控其模型部分模块与中国智谱AI的开源代码高度相似,甚至残留版权标记,质疑其“套壳中国模型却申领 taxpayer 资金”。尽管Upstage紧急召开直播发布会,展示完整训练日志证明核心模型为自研,并解释仅在推理框架(非训练核心)中使用了全球广泛采用的智谱开源组件,高锡贤随后道歉,但风波已起。
随后,Naver与SK电讯亦被卷入。Naver被指其视觉与音频编码器与阿里通义千问及OpenAI产品存在相似性;SK电讯则被发现推理代码与DeepSeek开源库雷同。两家公司均强调:模型的核心训练引擎完全自研,外部组件仅用于标准化的输入/输出处理,属于行业通用实践。
对此,学界观点两极。哈佛大学教授魏裕炎指出:“拒绝开源软件等于放弃技术红利,完全自研每一行代码既不现实也无必要。”首尔国立大学AI研究所所长李在武也证实,受质疑模型的核心参数训练过程确为从零开始,未直接复制外国模型权重。
然而,反对者担忧:即便仅使用外围代码,也可能引入潜在后门或依赖风险,削弱“主权AI”的战略意义。目前,韩国科学部尚未就竞赛规则中“是否允许使用外国开源代码”作出明确界定,但部长裴庆勋表示欢迎技术辩论,称“这正是韩国AI未来的光明所在”。
在全球加速构建“AI主权”的浪潮下,韩国困境折射出一个普遍难题:在高度互联的AI生态中,真正的“技术独立”边界究竟在哪里? 是代码逐行自研,还是核心算法与数据主权可控?这场风波或许没有简单答案,但它无疑为各国敲响警钟——AI自主化,远不止一场模型竞赛,而是一场涵盖技术伦理、产业政策与全球协作的系统性工程。
via AI新闻资讯 (author: AI Base)
Elevated error rates on Opus 4.5
Jan 14, 08:34 UTC
Investigating - We are currently investigating this issue.
via Claude Status - Incident History
Jan 14, 08:34 UTC
Investigating - We are currently investigating this issue.
via Claude Status - Incident History
消息称,人工智能巨头 OpenAI 正在加速布局硬件领域。据供应链知情人士爆料,OpenAI 首席执行官奥尔特曼(Sam Altman)正与前苹果首席设计官 Jony Ive 联手,秘密研发一款旨在挑战苹果 AirPods 地位的全新 AI 音频设备。
据爆料者“智慧皮卡丘”透露,该项目的内部代号为 “Sweetpea”。在产品形态上,这款设备展现了极具颠覆性的设计逻辑,其主体采用金属材质,外形酷似圆润的鹅卵石。不同于传统的入耳式耳机,Sweetpea 内部包含两个胶囊状的组件,用户可以将其取出并佩戴在耳后。这种“前所未见”的独特工业设计,被认为是 Jony Ive 离开苹果后在 AI 硬件上的重要尝试。
在性能配置方面,该设备预计将搭载最前沿的2纳米工艺智能手机级芯片,三星的 Exynos 芯片目前被视为首选,同时 OpenAI 可能还同步开发了定制化芯片。由于大量采用了与高端智能手机性能对标的材料与核心组件,该产品的制造价格预计将维持在较高水平。
目前,代工厂富士康已被要求为该系列产品的生产做准备。根据规划,OpenAI 计划在2028年第四季度前推出包括耳机和触控笔在内的共五款硬件产品,而 “Sweetpea” 耳机则是优先级最高的首发项目。预计该产品最早将于今年9月正式发布,第一年的目标产量设定在4000万至5000万台之间。市场预期,这款设备将具备通话、音频播放以及跨应用控制功能,甚至有望实现脱离手机的独立运行。
划重点:
● 🎧 跨界联手: OpenAI CEO 奥尔特曼联合前苹果设计大师 Jony Ive,共同打造代号为 “Sweetpea” 的新型 AI 音频设备,目标直指 AirPods。
● 💎 独特设计: 设备主体采用金属鹅卵石造型,内置两个可佩戴在耳后的胶囊状组件,硬件形态与传统耳机有显著区别。
● 🚀 顶级配置: 预计采用2纳米制程芯片,首年产量目标高达5000万台,并可能具备独立于手机运行的高级 AI 功能。
via AI新闻资讯 (author: AI Base)
特斯拉CEO马斯克在社交媒体平台X宣布,特斯拉将于2月14日后停止销售FSD(全自动驾驶)功能的买断版本,此后该功能将仅以月度订阅形式提供。这标志着特斯拉在商业模式上的重大转变。
FSD功能自2016年推出以来已历经多次迭代升级,从最初的Autopilot辅助驾驶逐步演进为更高级的智能驾驶系统。2025年2月,特斯拉在中国市场开始分批推送FSD智能辅助驾驶功能,软件版本为2024.45.32.12。需要强调的是,该功能仍属于L2级辅助驾驶,需要驾驶员持续监督。
马斯克对FSD的推广一直持积极态度。去年6月,他曾公开呼吁欧洲监管机构尽快批准FSD技术落地,称延迟审批"令人非常沮丧"甚至"危及人们的安全"。在此前的财报电话会议上,马斯克表示特斯拉只有在需求量非常大的情况下才会考虑FSD授权,并强调FSD的安全水准必须远高于普通人类驾驶员。
从买断制转向订阅制,可能帮助特斯拉建立更稳定的经常性收入来源,同时降低用户的初始购买门槛。不过,这一变化也意味着已购买FSD买断版的车主将成为"最后一批"永久拥有该功能的用户,新用户则需要持续支付订阅费用才能使用FSD功能。
via AI新闻资讯 (author: AI Base)
🎥 Google 发布 Veo 3.1 视频生成工具,支持 4K 分辨率与竖屏格式
Google 宣布推出 Veo 3.1 升级版,该工具支持基于参考图像生成视频内容。新版本显著提升了角色身份、背景及物体的连贯性,即使使用简单提示词也能生成更具表现力的视频。此次更新首次支持原生 9:16 竖屏格式输出,并新增最高 4K 分辨率的升级功能,以满足移动端短视频创作及高端大屏播放的需求。目前,Veo 3.1 已在 Gemini 应用、YouTube、Flow、Google Vids、Gemini API 和 Vertex AI 同步上线。
(科技圈)
via 茶馆 - Telegram Channel
Google 宣布推出 Veo 3.1 升级版,该工具支持基于参考图像生成视频内容。新版本显著提升了角色身份、背景及物体的连贯性,即使使用简单提示词也能生成更具表现力的视频。此次更新首次支持原生 9:16 竖屏格式输出,并新增最高 4K 分辨率的升级功能,以满足移动端短视频创作及高端大屏播放的需求。目前,Veo 3.1 已在 Gemini 应用、YouTube、Flow、Google Vids、Gemini API 和 Vertex AI 同步上线。
(科技圈)
via 茶馆 - Telegram Channel
Google 宣布推出 Veo 3.1 Ingredients to Video 升级版,该工具可基于参考图像生成视频内容。新版本在保持角色身份一致性、背景和物体连贯性方面显著改进,即使使用简单提示词也能生成更具表现力和创意的视频。
此次更新首次支持原生 9:16 竖屏格式输出,专为移动端短视频创作优化。同时新增最高 4K 分辨率的升级功能,1080p 版本提供更清晰的编辑效果,4K 版本则适用于高端制作和大屏幕播放。这些功能已在 Gemini 应用、YouTube、Flow、Google Vids、Gemini API 和 Vertex AI 中上线。
🍀在花频道 🍵茶馆聊天 📮投稿
via 科技圈🎗在花频道📮 - Telegram Channel
谷歌加码医疗AI开源生态:MedGemma 1.5强化医学影像能力,同步推出语音转写模型MedASR
近日,公司正式发布新一代开源医疗大模型 MedGemma 1.5,并在同期推出专为临床场景设计的开源语音识别模型 MedASR,进一步完善其在医疗垂直领域的技术栈。
作为Gemma系列的医疗专用版本,MedGemma 1.5 在前代基础上显著增强了对医学影像的理解与分析能力。该模型不仅能处理文本病历、检验报告和医学文献,还可结合X光、CT等常见影像模态的描述性数据,辅助进行初步筛查与诊断推理。这一升级使MedGemma从纯文本问答工具,迈向多模态临床决策支持系统,更贴近真实医疗工作流。
与此同时,MedASR 的推出直击医生文书负担痛点。该模型专为医疗语音场景优化,能高精度识别医患对话、查房记录、手术口述等专业内容,并自动转写为结构化文本,大幅提升电子病历录入效率。谷歌强调,两个模型均基于去标识化的临床数据训练,严格遵循隐私保护规范,并以开源形式发布,供全球研究者与开发者免费使用。
此次双模型发布,标志着谷歌在医疗AI领域从“封闭服务”向“开放赋能”战略的深化。继Gemini医疗助手通过HIPAA合规认证后,开源模型的推出将进一步降低医疗机构、初创公司及学术团队的创新门槛,推动AI在基层医疗、远程诊疗和科研分析等场景的普惠应用。
在AI医疗从“可用”走向“好用”的关键阶段,谷歌正以开源+合规+多模态的组合拳,构建一个兼具安全性、实用性与可扩展性的医疗AI生态底座。
via AI新闻资讯 (author: AI Base)
近日,公司正式发布新一代开源医疗大模型 MedGemma 1.5,并在同期推出专为临床场景设计的开源语音识别模型 MedASR,进一步完善其在医疗垂直领域的技术栈。
作为Gemma系列的医疗专用版本,MedGemma 1.5 在前代基础上显著增强了对医学影像的理解与分析能力。该模型不仅能处理文本病历、检验报告和医学文献,还可结合X光、CT等常见影像模态的描述性数据,辅助进行初步筛查与诊断推理。这一升级使MedGemma从纯文本问答工具,迈向多模态临床决策支持系统,更贴近真实医疗工作流。
与此同时,MedASR 的推出直击医生文书负担痛点。该模型专为医疗语音场景优化,能高精度识别医患对话、查房记录、手术口述等专业内容,并自动转写为结构化文本,大幅提升电子病历录入效率。谷歌强调,两个模型均基于去标识化的临床数据训练,严格遵循隐私保护规范,并以开源形式发布,供全球研究者与开发者免费使用。
此次双模型发布,标志着谷歌在医疗AI领域从“封闭服务”向“开放赋能”战略的深化。继Gemini医疗助手通过HIPAA合规认证后,开源模型的推出将进一步降低医疗机构、初创公司及学术团队的创新门槛,推动AI在基层医疗、远程诊疗和科研分析等场景的普惠应用。
在AI医疗从“可用”走向“好用”的关键阶段,谷歌正以开源+合规+多模态的组合拳,构建一个兼具安全性、实用性与可扩展性的医疗AI生态底座。
via AI新闻资讯 (author: AI Base)
据财联社报道,韩国政府去年6月启动的"自主AI基础模型"竞赛陷入技术路线争议。在入围决赛的五家企业中,已有三家被发现至少部分使用了外国开源AI模型代码,其中中国模型成为主要"效仿"对象。
这场为期三年、旨在打造韩国"AI国家队"的竞赛由科学技术信息通信部主导,Naver Cloud、Upstage、SK Telecom、NC AI和LG AI研究院五家企业入围。竞赛目标是到2027年选出两家本土企业,其AI模型性能需达到OpenAI或谷歌等行业领军者95%以上水平。
争议最早由Upstage引发。竞争对手Sionic AI首席执行官Ko Suk-hyun指出,Upstage的AI模型部分组件与智谱AI开源模型存在相似之处,且代码中仍保留智谱AI版权标记。Upstage随后举行直播验证,承认推理代码使用了智谱AI的开源组件,但强调模型本身是从空白状态自主开发训练的。
随后,Naver被指其视觉和音频编码器与阿里巴巴和OpenAI产品相似;SK Telecom的推理代码则被指与DeepSeek模型代码相似。两家企业均承认使用外部编码器,但强调模型核心引擎完全自主研发。
值得注意的是,竞赛规则本身并未明确禁止使用外国开源代码。哈佛大学教授Gu-Yeon Wei指出,"放弃开源软件就意味着放弃巨大利益",要求所有代码由本国编写并不现实。但部分韩国业界人士担忧,使用外国工具可能带来安全风险,并削弱培育本土AI模型的初衷。
韩国副总理兼科学技术信息通信部长官裵庆勋对争议持开放态度,称"目睹技术论战反而看到了韩国AI的光明前景"。首尔国立大学AI研究院院长Jae W. Lee表示,受质疑企业的模型核心任务似乎并未依赖外国工具。按原计划,韩国政府将本周从五家入围者中淘汰一家。
via AI新闻资讯 (author: AI Base)
国内领先的视频大模型 Vidu 今日宣布,其开放平台正式上线“一键生成 MV”功能。这一技术的推出,标志着视频创作从素材拼接迈向了全自动的端到端生成时代。用户现在只需提供背景音乐、参考图像以及简单的文本指令,系统即可在分钟级别内输出画质精美、叙事连贯的高质量 MV。
该功能的核心在于一套深度协同的多智能体(Multi-Agent)系统。在接收到用户指令后,系统内部的多个专用 AI 智能体会立即开启精密协作。首先,导演智能体会对音乐结构和歌词进行深度解析,规划出整体的叙事脉络;随后,分镜脚本智能体会将创意转化为详细的镜头描述,涵盖景别、运镜和时长等专业参数。
在视觉生成阶段,该系统表现出了极高的工业级稳定性。通过“多图参考生视频”技术,创作者最多可上传7张参考图作为视觉锚点,视觉生成智能体据此在长达五分钟的视频中精准维持角色、场景和美学风格的高度统一。最后,剪辑与合成智能体会负责镜头的转场卡点,并自动生成与歌词逐帧同步的动态字幕。
这种“全自动制片”模式无需人工干预,极大地降低了专业视频创作的门槛。对于创作者而言,Vidu 不再仅仅是一个生成工具,而是一个集成化的虚拟制片厂,让复杂的 MV 制作变得像发送指令一样简单。
划重点:
● 🎬 全自动多智能体协同:系统内置导演、分镜、视觉生成及剪辑四大智能体,实现从解析音乐到成片输出的全流程自动化。
● 🖼️ 工业级风格一致性:支持最多7张参考图定位,确保在长达5分钟的视频中,角色与场景风格不发生漂移。
● 🎵 音画同步精准卡点:AI 能自动识别背景音乐节奏并完成转场,同时生成逐帧同步的动态字幕,分钟级即可交片。
via AI新闻资讯 (author: AI Base)
继发布全球首个通用实时世界模型 PixVerse R1后,其技术内核与应用场景近日同步亮相 —— 该模型通过三大核心技术的环环相扣,实现 “让虚拟世界活起来” 的实时交互体验,同时在游戏、影视、直播等领域拓展出 “人人可共创” 的新可能。
技术:三大创新筑牢 “实时世界” 基础
PixVerse R1的核心能力,源于三项底层技术的协同突破:
Omni 原生多模态模型作为现实世界的 “计算基座”,它将文本、图像、音频、视频等多模态内容统一为连续 Token 流,可端到端生成物理逻辑一致、最高1080P 画质的数字世界,为多模态交互提供了统一的技术底座。
自回归流式生成机制赋予模型 “持久记忆”,解决了长时序内容的一致性痛点:不仅支持无限时长生成,还能告别画面突变、逻辑断裂的问题,实现叙事的 “流式交互”。
瞬时响应引擎 IRE注入即时反应的 “神经反射”:通过时间轨迹折叠、引导校正、自适应稀疏注意力三大创新,将采样步骤压缩至1-4步,计算效率提升数百倍,直接支撑起 “即时响应” 的核心体验。
应用:多场景解锁 “实时共创” 新体验
基于技术能力,PixVerse R1让 “每个人都是实时世界的创造者”,在三大领域落地新范式:
● 游戏领域:让游戏世界 “活起来”,打造动态可交互的虚拟环境;
● 影视领域:让电影 “可以玩起来”,打破单向观看模式,实现互动式内容体验;
● 直播领域:让直播 “万物可互动”,升级实时参与感与交互深度。
该模型以 “所想即所见,所说即所现” 为核心,推动虚拟世界从 “录好再播” 的回放式形态,转向 “因你而实时演化” 的共创形态,其官方体验地址为 realtime.pixverse.ai。
via AI新闻资讯 (author: AI Base)
近日,人工智能公司 Anthropic 正式发布了其新款编程助手 “Cowork”,这一工具的开发过程几乎完全依赖于其自家 AI 模型 Claude。在短短一周半的时间内,Cowork 的首个版本就已问世,成为了 AI 编程工具的又一重要里程碑。
根据《商业内幕》的报道,Cowork 的设计旨在为非编程用户提供更加友好的 AI 支持。用户可以轻松授权 Cowork 访问计算机中的特定文件,通过简单的自然语言指令来完成各种任务,极大地降低了编程的门槛。Anthropic 的 Claude Code 项目负责人 Boris Cherny 透露,Cowork 的核心代码几乎全部由 Claude 自动生成,团队成员主要集中在讨论架构和产品方向,而具体的功能实现、漏洞修复和研究工作则是通过多个 Claude 实例并行完成的。
产品经理 Felix Rieseberg 表示,这种创新的开发方式让 Cowork 能够在极短的时间内完成首个版本。特别是在假日季节,用户们开始频繁使用 Claude 进行非编程工作,这也为 Cowork 的诞生提供了契机。不过,他也坦言,目前 Cowork 仍处于 Alpha 阶段,存在一些不完善之处。
目前,Cowork 仅对 Mac 端的 Claude Max 订阅用户开放,发布后迅速吸引了广泛的关注。Datasette 的联合创始人 Simon Willison 指出,Claude Code 的潜在价值尚未完全释放,而 Cowork 提供了一种更实用的切入方式。Reddit 的联合创始人 Alexis Ohanian 则对此表示,这是一个 “重大事件”。
然而,Anthropic 也提醒用户在使用 Cowork 时需要注意潜在风险。由于 Cowork 在获得文件访问权限后,可能执行删除本地文件等具有破坏性的操作,因此用户在下达指令时务必清晰明确。
在谈到 AI 投资的过热话题时,Anthropic 的首席执行官达里奥・阿莫代伊表示,专注于企业客户帮助公司建立了更可持续的商业模式,让他们在投资方面更加理性。
via AI新闻资讯 (author: AI Base)
据报道,阿里巴巴旗下AI应用千问上线仅两个月,月活跃用户数(MAU)已突破1亿大关,在学生和白领群体中呈现强劲增长势头。不过,截至发稿时阿里方面尚未对这一数据作出官方回应。
千问App于2025年11月启动公测,这标志着阿里巴巴从B端企业服务向C端用户市场的战略转型进入实质阶段。作为阿里全力进军AI to C市场的核心产品,千问被寄予打造"AI时代未来入口"的战略期望。
阿里巴巴智能信息事业群总裁吴嘉将千问明确定位为"会聊天能办事的个人AI助手"。他强调,千问的核心竞争力体现在两个维度:智力水平和办事能力。产品目标是构建一个真正理解用户需求、能够随时随地解决实际问题的AI助理。
若1亿MAU数据属实,这将是阿里在消费级AI应用市场取得的重要里程碑,也反映出国内用户对AI工具的接受度正在快速提升。从公测到破亿用户,千问的增长速度显示出超级AI应用在C端市场的巨大潜力。
via AI新闻资讯 (author: AI Base)
据路透社报道,美国教师联合会(AFT)周二宣布,将退出X平台,原因是该社交媒体网站制作并传播“令人作呕”的儿童不雅图像。AFT表示,该组织代表180万名教育工作者,是美国规模最大的工会之一。
AFT主席兰迪·温加滕(Randi Weingarten)在接受路透社采访时表示,自从埃隆·马斯克(Elon Musk)在2022年收购X以来,X就已被极端分子和网络喷子严重侵蚀。但她指出,X的AI聊天机器人Grok近期生成并大量传播未经当事人同意的女性和儿童穿着比基尼或内衣的图像,使得该平台已“无法再使用”。
“Grok AI图像生成器毫无防护措施,这成了压垮骆驼的最后一根稻草,”她表示,“从明天起,我们将不再使用X。”
温加滕表示,从周三起,她的个人账号及工会账号将停止更新。这两个账号分别拥有约10万和7.5万名粉丝。
当被问及退出X是否会影响工会的声音传播时,温加滕表示,必须把儿童安全放在首位。
“这不是一个容易的决定,但这是正确的决定,”她说,“你必须划清界限。如果你站在‘人类阵营’这边,并且相信我们必须保护儿童,尤其是儿童安全,你就必须划出这条界线。”
截至发稿,X尚未就此置评。
相关文章:
美国民主党参议员呼吁苹果谷歌应用商店下架Grok与X应用
马斯克旗下Grok因涉性化图像在印尼、马来西亚遭封禁 系全球首例
英国通信管理局调查X 因其旗下Grok生成色情化的女性及儿童的AI图像
via cnBeta.COM - 中文业界资讯站 (author: 稿源:凤凰网科技)
咨询机构Benchmark Mineral Intelligence (BMI) 周三发布的数据显示,2025年全球电动汽车(含纯电动及插电混动)注册量达2070万辆,同比增长20%。受中国需求降温及全球电气化目标放宽影响,12月全球销量仅增长6%,创下2024年2月以来最低月度增幅。2025年中国市场销量增长17%至1290万辆,贡献了全球71%的产量。北美地区受美国10月结束电动汽车税收抵免政策影响,全年销量下降4%,12月单月跌幅达39%。欧洲及世界其他地区全年销量则分别增长33%和48%。
BMI预测,2026年全球电动汽车销量将增至2390万辆,但整体增速将放缓至15.7%。其中,中国市场增速预计回升至21%,欧洲增速将放缓至15%,而北美地区受美国销量预计下滑29%的影响,整体销量或将下降23%。BMI数据经理Charles Lester表示,美国政策转向及欧盟排放标准放宽已使全球电动汽车市场格局发生剧变。目前,欧洲竞争加剧与中国需求放缓正引发关于电气化进程与汽车制造业利润及就业关系的广泛讨论。
(路透社)
via 茶馆 - Telegram Channel
科技圈🎗在花频道📮:
智谱与 MiniMax 招股书解读:三年合计支出 110 亿元,算力成本占比过半 智谱与 MiniMax 披露的招股书显示,过去三年多两家公司合计支出 110 亿元,其中约半数用于租赁算力。智谱七成收入来自企业级本地部署,但前五大客户每年均有变动;MiniMax 侧重个人用户,截至 2025 年 9 月其产品月活达 2760 万,业务毛利于今年前三季度转正。目前两家公司营收规模约为 OpenAI 的百分之一,仍需依赖持续融资以维持高额研发与算力投入。 晚点LatePost 🍀在花频道 🍵茶馆 📮投稿新鲜事
智谱联合华为开源首个国产芯片训练的多模态 SOTA 模型 GLM-Image
智谱 AI 联合华为发布开源图像生成模型 GLM-Image,这是首个在国产芯片上完成全流程训练的 SOTA 多模态模型。该模型采用「自回归+扩散解码器」混合架构,实现图像生成与语言模型的联合,在文字渲染权威榜单中达到开源 SOTA 水平。
GLM-Image 全流程训练均在昇腾 Atlas 800T A2 设备上完成,依托昇腾 NPU 和昇思 MindSpore AI 框架,通过动态图多级流水下发、高性能融合算子、多流并行等技术优化端到端训练流程。该模型在科普插画、多格图画、社交媒体封面、商业海报和写实摄影等场景表现出色,现已在智谱开放平台提供在线体验,并将上线 Z.ai 和智谱清言。
智谱
🍀在花频道 🍵茶馆聊天 📮投稿
via 科技圈🎗在花频道📮 - Telegram Channel