https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
日本全新手绘平台 TEGAKI 上线,强力禁用 AI 生成内容!
近日,日本新兴手绘创作平台 TEGAKI(手描き,意为手绘)正式上线,吸引了众多艺术创作者的关注。这一平台的独特之处在于,它明确禁止任何 AI 生成或辅助创作的内容。TEGAKI 的推出迅速引起了热烈反响,首日注册用户超过5000人,远超预期的50人,导致网站一度崩溃,不得不进入维护状态,重新开放时间尚未确定。
TEGAKI 由独立工程师兼艺术家 Tochi 开发,旨在为热爱手绘和传统艺术创作的用户提供一个安全的交流平台。为了确保内容的纯粹性,TEGAKI 采用了一套严格的认证系统,要求创作者提交延时视频和工作文件,以证明他们的作品确实是手绘完成的。此外,TEGAKI 在防止 AI 学习方面也采取了多重措施,包括禁止主流 AI 爬虫访问,并通过元标签限制 AI 的学习能力,避免可疑的批量访问行为。
Tochi 强调,TEGAKI 并不是要否定 AI 技术本身,而是希望为传统创作提供一个保护空间。他表示,科技本身只是工具,如何使用取决于每个人的选择。TEGAKI 的设计理念旨在让创作者可以在一个无 AI 干扰的环境中自由表达自己的艺术创作。
via AI新闻资讯 (author: AI Base)
近日,日本新兴手绘创作平台 TEGAKI(手描き,意为手绘)正式上线,吸引了众多艺术创作者的关注。这一平台的独特之处在于,它明确禁止任何 AI 生成或辅助创作的内容。TEGAKI 的推出迅速引起了热烈反响,首日注册用户超过5000人,远超预期的50人,导致网站一度崩溃,不得不进入维护状态,重新开放时间尚未确定。
TEGAKI 由独立工程师兼艺术家 Tochi 开发,旨在为热爱手绘和传统艺术创作的用户提供一个安全的交流平台。为了确保内容的纯粹性,TEGAKI 采用了一套严格的认证系统,要求创作者提交延时视频和工作文件,以证明他们的作品确实是手绘完成的。此外,TEGAKI 在防止 AI 学习方面也采取了多重措施,包括禁止主流 AI 爬虫访问,并通过元标签限制 AI 的学习能力,避免可疑的批量访问行为。
Tochi 强调,TEGAKI 并不是要否定 AI 技术本身,而是希望为传统创作提供一个保护空间。他表示,科技本身只是工具,如何使用取决于每个人的选择。TEGAKI 的设计理念旨在让创作者可以在一个无 AI 干扰的环境中自由表达自己的艺术创作。
划重点:
🎨 TEGAKI 是日本全新上线的手绘创作平台,明确禁止 AI 生成内容。
🚀 上线首日注册用户超过5000人,造成网站崩溃,进入维护状态。
🛡️ 创作者需提交工作证明以确保内容纯粹,同时采用多重防护措施阻止 AI 学习。
via AI新闻资讯 (author: AI Base)
苹果 Siri 大升级:全新功能即将上线,情感支持与旅行助手齐飞
近日,有消息称,苹果正在对其语音助手 Siri 进行重大升级,预计在今年春季正式推出。这次升级将采用谷歌的 Gemini 技术,旨在让 Siri 变得更加智能和个性化。根据最新的报道,用户将可以享受到一系列新的功能,包括情感支持、旅行行程预订和故事讲述等,让人对未来的 Siri 充满期待。
具体来说,改版后的 Siri 将能够以更自然的对话形式回答各种实际问题和通用知识。想要了解母亲的航班动态或是寻找合适的午餐预订,Siri 将会通过邮件和信息应用中的相关数据,及时为用户提供准确的答案。此外,Siri 还能够讲述故事和提供情感支持,为用户的日常生活带来更多温暖和陪伴。
更有趣的是,新版 Siri 还将帮助用户完成更多任务,比如在备忘录应用中创建包含特定信息的文档,如烹饪食谱等。这意味着,Siri 不仅是一个简单的助手,更会成为用户生活中的得力帮手。苹果计划在今年 6 月的全球开发者大会(WWDC)上公布 Siri 的更多新功能,包括记忆用户的过往对话,并基于用户的日历等信息主动提供建议。
苹果的这次升级,旨在让 Siri 更好地理解用户的个人情境,具备屏幕感知能力,并支持更深层次的应用操作权限。未来,Siri 将不仅仅是一个语音助手,而是用户生活中的一个智能伙伴。
虽然苹果仍在测试新版 Siri,并未在该产品上标识谷歌或 Gemini 的相关信息,但可以肯定的是,苹果会对 Gemini 模型进行微调,以确保 Siri 的响应风格符合其一贯的用户体验标准。期待在 iOS 26.4 系统的更新中,Siri 能够给我们带来耳目一新的体验。
via AI新闻资讯 (author: AI Base)
近日,有消息称,苹果正在对其语音助手 Siri 进行重大升级,预计在今年春季正式推出。这次升级将采用谷歌的 Gemini 技术,旨在让 Siri 变得更加智能和个性化。根据最新的报道,用户将可以享受到一系列新的功能,包括情感支持、旅行行程预订和故事讲述等,让人对未来的 Siri 充满期待。
具体来说,改版后的 Siri 将能够以更自然的对话形式回答各种实际问题和通用知识。想要了解母亲的航班动态或是寻找合适的午餐预订,Siri 将会通过邮件和信息应用中的相关数据,及时为用户提供准确的答案。此外,Siri 还能够讲述故事和提供情感支持,为用户的日常生活带来更多温暖和陪伴。
更有趣的是,新版 Siri 还将帮助用户完成更多任务,比如在备忘录应用中创建包含特定信息的文档,如烹饪食谱等。这意味着,Siri 不仅是一个简单的助手,更会成为用户生活中的得力帮手。苹果计划在今年 6 月的全球开发者大会(WWDC)上公布 Siri 的更多新功能,包括记忆用户的过往对话,并基于用户的日历等信息主动提供建议。
苹果的这次升级,旨在让 Siri 更好地理解用户的个人情境,具备屏幕感知能力,并支持更深层次的应用操作权限。未来,Siri 将不仅仅是一个语音助手,而是用户生活中的一个智能伙伴。
虽然苹果仍在测试新版 Siri,并未在该产品上标识谷歌或 Gemini 的相关信息,但可以肯定的是,苹果会对 Gemini 模型进行微调,以确保 Siri 的响应风格符合其一贯的用户体验标准。期待在 iOS 26.4 系统的更新中,Siri 能够给我们带来耳目一新的体验。
via AI新闻资讯 (author: AI Base)
据可靠消息,公司正在开发一款代号为 “Sweetpea” 的全新AI音频设备,计划于 2026 年 9 月正式发布,并设下惊人的首年出货目标—— 4000 万至 5000 万台,意图一举打入全球主流消费市场。
这款设备采用极具辨识度的椭圆形金属外壳与双胶囊式后挂结构,兼顾美学与佩戴稳定性。其内部搭载一颗先进的 2 纳米制程AI芯片,并集成包括肌电信号(EMG)传感窗口在内的多模态交互组件,暗示其或将支持通过微表情、面部肌肉活动甚至无声指令进行人机交互,远超传统语音助手的能力边界。
尤为引人注目的是,前苹果首席设计官Jony Ive深度参与了Sweetpea的工业设计。这标志着OpenAI不仅追求技术突破,更将用户体验与产品质感置于核心位置,试图打造一款兼具科技感与奢侈品属性的AI入口级硬件。
在制造端,富士康已确认成为Sweetpea的独家生产商。据悉,OpenAI最初倾向选择立讯精密,但出于供应链多元化与产能保障的战略考量,最终转向富士康。双方合作或将长期深化——消息人士透露,富士康有望在 2028 年前承接多达五款OpenAI硬件设备的制造订单。
若Sweetpea如期发布并实现千万级出货,OpenAI将完成从纯软件公司向“AI+硬件”生态巨头的关键跃迁。这款设备或将成为其超级智能体(AGI)战略的物理载体,让用户通过自然、无缝的方式接入OpenAI的AI服务网络。当大模型走出云端、嵌入日常穿戴,通用人工智能的普及或许比想象中来得更快。
via AI新闻资讯 (author: AI Base)
韩国力推“主权AI”遭遇尴尬:本土大模型被曝深度引用中国代码
韩国在追求人工智能自主化的道路上正面临一场意想不到的舆论风波。据《华尔街日报》消息,韩国政府为摆脱对中美科技巨头的依赖,正倾力支持本土“主权AI”的发展。然而,近期多项调查发现,被寄予厚望的本土大模型在核心代码层面与中国及美国的开源模型存在高度相似性,引发了业界对“国产大模型”纯度的激烈讨论。
在这场由政府发起的 AI 开发竞赛中,五家入围决赛的企业中有三家被指出使用了外国开源代码。其中,初创公司 Upstage 受到公开质疑,其模型模块被指与中国智谱 AI 的开源模型高度雷同,代码中甚至保留了原作者的版权标记。随后,韩国科技巨头 Naver 和 SK 电讯也相继卷入风波,两家公司的模型分别被指在视觉编码器和推理代码上,与阿里巴巴及 DeepSeek 的产品存在相似之处。
面对质疑,相关公司解释称,完全从零开始编写每一行代码在当前的技术环境下并不现实。Naver 等公司强调,虽然使用了部分外部标准化工具,但决定模型学习与训练的核心引擎仍属于自主研发。尽管争议不断,韩国政府方面表现得相对宽容。韩国科学部长表示,这种激烈的技术辩论反而预示着韩国 AI 产业的活跃与前景。目前,官方计划继续按原定方案评选优胜模型,旨在2027年前打造出性能达到全球领先水平的本土 AI 工具。
划重点:
● 🇰🇷 自主化受阻: 韩国为确保技术主权发起 AI 竞赛,力求在2027年前开发出能与 OpenAI 等巨头竞争的本土模型,但深陷外部代码依赖争议。
● 💻 引用中国代码: 包括 Upstage、Naver 和 SK 电讯在内的多家决赛入围公司,被曝在其模型中引用了智谱 AI、阿里巴巴或 DeepSeek 的开源元素。
● 🛡️ 技术路线争论: 专家认为放弃开源红利并非明智之举,而反对者则担心过度依赖外国工具会带来安全风险并削弱“主权 AI”的初衷。
via AI新闻资讯 (author: AI Base)
韩国在追求人工智能自主化的道路上正面临一场意想不到的舆论风波。据《华尔街日报》消息,韩国政府为摆脱对中美科技巨头的依赖,正倾力支持本土“主权AI”的发展。然而,近期多项调查发现,被寄予厚望的本土大模型在核心代码层面与中国及美国的开源模型存在高度相似性,引发了业界对“国产大模型”纯度的激烈讨论。
在这场由政府发起的 AI 开发竞赛中,五家入围决赛的企业中有三家被指出使用了外国开源代码。其中,初创公司 Upstage 受到公开质疑,其模型模块被指与中国智谱 AI 的开源模型高度雷同,代码中甚至保留了原作者的版权标记。随后,韩国科技巨头 Naver 和 SK 电讯也相继卷入风波,两家公司的模型分别被指在视觉编码器和推理代码上,与阿里巴巴及 DeepSeek 的产品存在相似之处。
面对质疑,相关公司解释称,完全从零开始编写每一行代码在当前的技术环境下并不现实。Naver 等公司强调,虽然使用了部分外部标准化工具,但决定模型学习与训练的核心引擎仍属于自主研发。尽管争议不断,韩国政府方面表现得相对宽容。韩国科学部长表示,这种激烈的技术辩论反而预示着韩国 AI 产业的活跃与前景。目前,官方计划继续按原定方案评选优胜模型,旨在2027年前打造出性能达到全球领先水平的本土 AI 工具。
划重点:
● 🇰🇷 自主化受阻: 韩国为确保技术主权发起 AI 竞赛,力求在2027年前开发出能与 OpenAI 等巨头竞争的本土模型,但深陷外部代码依赖争议。
● 💻 引用中国代码: 包括 Upstage、Naver 和 SK 电讯在内的多家决赛入围公司,被曝在其模型中引用了智谱 AI、阿里巴巴或 DeepSeek 的开源元素。
● 🛡️ 技术路线争论: 专家认为放弃开源红利并非明智之举,而反对者则担心过度依赖外国工具会带来安全风险并削弱“主权 AI”的初衷。
via AI新闻资讯 (author: AI Base)
1月13日,完全禁止AI生成内容的插画网站TEGAKI(手描き,意为手绘)正式上线。这一类Pixiv的创意平台因其"AI禁入"特色引发日本创作者热捧,上线首日注册用户超5000人,远超预期的50人,直接导致网站崩溃。截至发稿,TEGAKI已进入维护状态,重新开放时间未定。
TEGAKI由独立工程师兼艺术家Tochi开发,定位为人类创作艺术的"安全港湾",无论传统艺术还是数字艺术,完全禁止AI生成或辅助创作的图像。为确保内容纯粹性,平台配备了严格的认证系统,创作者需提交延时视频和工作文件证明作品确系手绘。
在防AI学习方面,TEGAKI采取了多重防护措施:禁止GPTBot、CCBot和Google-Extended等主流AI爬虫访问,在所有页面设置元标签阻止AI学习,阻止可疑批量访问,并通过禁用右键和拖动功能防止图像下载。
值得注意的是,Tochi强调TEGAKI并非"否定AI技术本身"。网站在开发、维护和运营辅助过程中也使用了AI代码。"科技只是工具,我认为如何使用它取决于每个人自己,"Tochi表示,开发TEGAKI的初衷是为喜欢手绘和传统创作方法的人们创建交流平台,提供安全环境。
这一事件折射出AI生成内容对传统创作领域的冲击,以及艺术创作者对保护原创作品和创作空间的强烈诉求。TEGAKI的火爆也显示出,在AI艺术泛滥的当下,纯人类创作内容仍具有独特价值和市场需求。
via AI新闻资讯 (author: AI Base)
韩国“主权AI”遭遇信任危机:国产大模型被曝使用中、美开源代码,技术自主之路何其艰难?
据《华尔街日报》 1 月 14 日报道,韩国政府斥巨资推动的“本土大模型竞赛”陷入争议漩涡:五家决赛入围企业中,至少三家被指在其模型中使用了来自中国和美国公司的开源代码,包括智谱AI、阿里巴巴、OpenAI及DeepSeek等,引发关于“国产AI是否真正自主”的激烈辩论。
这场始于 2024 年 6 月的国家级项目,旨在三年内打造性能达到国际领先模型95%水平的纯韩国技术大模型,以减少对中美科技巨头的依赖,保障国家经济与安全利益。获胜者将获得政府提供的优质数据、人才资金及关键AI芯片使用权。然而,理想丰满,现实骨感——当技术全球化与开源协作成为行业常态,“从零造轮子”的自主路线显得愈发不切实际。
争议焦点集中于入围企业Upstage。竞争对手Sionic AI CEO高锡贤公开指控其模型部分模块与中国智谱AI的开源代码高度相似,甚至残留版权标记,质疑其“套壳中国模型却申领 taxpayer 资金”。尽管Upstage紧急召开直播发布会,展示完整训练日志证明核心模型为自研,并解释仅在推理框架(非训练核心)中使用了全球广泛采用的智谱开源组件,高锡贤随后道歉,但风波已起。
随后,Naver与SK电讯亦被卷入。Naver被指其视觉与音频编码器与阿里通义千问及OpenAI产品存在相似性;SK电讯则被发现推理代码与DeepSeek开源库雷同。两家公司均强调:模型的核心训练引擎完全自研,外部组件仅用于标准化的输入/输出处理,属于行业通用实践。
对此,学界观点两极。哈佛大学教授魏裕炎指出:“拒绝开源软件等于放弃技术红利,完全自研每一行代码既不现实也无必要。”首尔国立大学AI研究所所长李在武也证实,受质疑模型的核心参数训练过程确为从零开始,未直接复制外国模型权重。
然而,反对者担忧:即便仅使用外围代码,也可能引入潜在后门或依赖风险,削弱“主权AI”的战略意义。目前,韩国科学部尚未就竞赛规则中“是否允许使用外国开源代码”作出明确界定,但部长裴庆勋表示欢迎技术辩论,称“这正是韩国AI未来的光明所在”。
在全球加速构建“AI主权”的浪潮下,韩国困境折射出一个普遍难题:在高度互联的AI生态中,真正的“技术独立”边界究竟在哪里? 是代码逐行自研,还是核心算法与数据主权可控?这场风波或许没有简单答案,但它无疑为各国敲响警钟——AI自主化,远不止一场模型竞赛,而是一场涵盖技术伦理、产业政策与全球协作的系统性工程。
via AI新闻资讯 (author: AI Base)
据《华尔街日报》 1 月 14 日报道,韩国政府斥巨资推动的“本土大模型竞赛”陷入争议漩涡:五家决赛入围企业中,至少三家被指在其模型中使用了来自中国和美国公司的开源代码,包括智谱AI、阿里巴巴、OpenAI及DeepSeek等,引发关于“国产AI是否真正自主”的激烈辩论。
这场始于 2024 年 6 月的国家级项目,旨在三年内打造性能达到国际领先模型95%水平的纯韩国技术大模型,以减少对中美科技巨头的依赖,保障国家经济与安全利益。获胜者将获得政府提供的优质数据、人才资金及关键AI芯片使用权。然而,理想丰满,现实骨感——当技术全球化与开源协作成为行业常态,“从零造轮子”的自主路线显得愈发不切实际。
争议焦点集中于入围企业Upstage。竞争对手Sionic AI CEO高锡贤公开指控其模型部分模块与中国智谱AI的开源代码高度相似,甚至残留版权标记,质疑其“套壳中国模型却申领 taxpayer 资金”。尽管Upstage紧急召开直播发布会,展示完整训练日志证明核心模型为自研,并解释仅在推理框架(非训练核心)中使用了全球广泛采用的智谱开源组件,高锡贤随后道歉,但风波已起。
随后,Naver与SK电讯亦被卷入。Naver被指其视觉与音频编码器与阿里通义千问及OpenAI产品存在相似性;SK电讯则被发现推理代码与DeepSeek开源库雷同。两家公司均强调:模型的核心训练引擎完全自研,外部组件仅用于标准化的输入/输出处理,属于行业通用实践。
对此,学界观点两极。哈佛大学教授魏裕炎指出:“拒绝开源软件等于放弃技术红利,完全自研每一行代码既不现实也无必要。”首尔国立大学AI研究所所长李在武也证实,受质疑模型的核心参数训练过程确为从零开始,未直接复制外国模型权重。
然而,反对者担忧:即便仅使用外围代码,也可能引入潜在后门或依赖风险,削弱“主权AI”的战略意义。目前,韩国科学部尚未就竞赛规则中“是否允许使用外国开源代码”作出明确界定,但部长裴庆勋表示欢迎技术辩论,称“这正是韩国AI未来的光明所在”。
在全球加速构建“AI主权”的浪潮下,韩国困境折射出一个普遍难题:在高度互联的AI生态中,真正的“技术独立”边界究竟在哪里? 是代码逐行自研,还是核心算法与数据主权可控?这场风波或许没有简单答案,但它无疑为各国敲响警钟——AI自主化,远不止一场模型竞赛,而是一场涵盖技术伦理、产业政策与全球协作的系统性工程。
via AI新闻资讯 (author: AI Base)
Elevated error rates on Opus 4.5
Jan 14, 08:34 UTC
Investigating - We are currently investigating this issue.
via Claude Status - Incident History
Jan 14, 08:34 UTC
Investigating - We are currently investigating this issue.
via Claude Status - Incident History
消息称,人工智能巨头 OpenAI 正在加速布局硬件领域。据供应链知情人士爆料,OpenAI 首席执行官奥尔特曼(Sam Altman)正与前苹果首席设计官 Jony Ive 联手,秘密研发一款旨在挑战苹果 AirPods 地位的全新 AI 音频设备。
据爆料者“智慧皮卡丘”透露,该项目的内部代号为 “Sweetpea”。在产品形态上,这款设备展现了极具颠覆性的设计逻辑,其主体采用金属材质,外形酷似圆润的鹅卵石。不同于传统的入耳式耳机,Sweetpea 内部包含两个胶囊状的组件,用户可以将其取出并佩戴在耳后。这种“前所未见”的独特工业设计,被认为是 Jony Ive 离开苹果后在 AI 硬件上的重要尝试。
在性能配置方面,该设备预计将搭载最前沿的2纳米工艺智能手机级芯片,三星的 Exynos 芯片目前被视为首选,同时 OpenAI 可能还同步开发了定制化芯片。由于大量采用了与高端智能手机性能对标的材料与核心组件,该产品的制造价格预计将维持在较高水平。
目前,代工厂富士康已被要求为该系列产品的生产做准备。根据规划,OpenAI 计划在2028年第四季度前推出包括耳机和触控笔在内的共五款硬件产品,而 “Sweetpea” 耳机则是优先级最高的首发项目。预计该产品最早将于今年9月正式发布,第一年的目标产量设定在4000万至5000万台之间。市场预期,这款设备将具备通话、音频播放以及跨应用控制功能,甚至有望实现脱离手机的独立运行。
划重点:
● 🎧 跨界联手: OpenAI CEO 奥尔特曼联合前苹果设计大师 Jony Ive,共同打造代号为 “Sweetpea” 的新型 AI 音频设备,目标直指 AirPods。
● 💎 独特设计: 设备主体采用金属鹅卵石造型,内置两个可佩戴在耳后的胶囊状组件,硬件形态与传统耳机有显著区别。
● 🚀 顶级配置: 预计采用2纳米制程芯片,首年产量目标高达5000万台,并可能具备独立于手机运行的高级 AI 功能。
via AI新闻资讯 (author: AI Base)
特斯拉CEO马斯克在社交媒体平台X宣布,特斯拉将于2月14日后停止销售FSD(全自动驾驶)功能的买断版本,此后该功能将仅以月度订阅形式提供。这标志着特斯拉在商业模式上的重大转变。
FSD功能自2016年推出以来已历经多次迭代升级,从最初的Autopilot辅助驾驶逐步演进为更高级的智能驾驶系统。2025年2月,特斯拉在中国市场开始分批推送FSD智能辅助驾驶功能,软件版本为2024.45.32.12。需要强调的是,该功能仍属于L2级辅助驾驶,需要驾驶员持续监督。
马斯克对FSD的推广一直持积极态度。去年6月,他曾公开呼吁欧洲监管机构尽快批准FSD技术落地,称延迟审批"令人非常沮丧"甚至"危及人们的安全"。在此前的财报电话会议上,马斯克表示特斯拉只有在需求量非常大的情况下才会考虑FSD授权,并强调FSD的安全水准必须远高于普通人类驾驶员。
从买断制转向订阅制,可能帮助特斯拉建立更稳定的经常性收入来源,同时降低用户的初始购买门槛。不过,这一变化也意味着已购买FSD买断版的车主将成为"最后一批"永久拥有该功能的用户,新用户则需要持续支付订阅费用才能使用FSD功能。
via AI新闻资讯 (author: AI Base)
🎥 Google 发布 Veo 3.1 视频生成工具,支持 4K 分辨率与竖屏格式
Google 宣布推出 Veo 3.1 升级版,该工具支持基于参考图像生成视频内容。新版本显著提升了角色身份、背景及物体的连贯性,即使使用简单提示词也能生成更具表现力的视频。此次更新首次支持原生 9:16 竖屏格式输出,并新增最高 4K 分辨率的升级功能,以满足移动端短视频创作及高端大屏播放的需求。目前,Veo 3.1 已在 Gemini 应用、YouTube、Flow、Google Vids、Gemini API 和 Vertex AI 同步上线。
(科技圈)
via 茶馆 - Telegram Channel
Google 宣布推出 Veo 3.1 升级版,该工具支持基于参考图像生成视频内容。新版本显著提升了角色身份、背景及物体的连贯性,即使使用简单提示词也能生成更具表现力的视频。此次更新首次支持原生 9:16 竖屏格式输出,并新增最高 4K 分辨率的升级功能,以满足移动端短视频创作及高端大屏播放的需求。目前,Veo 3.1 已在 Gemini 应用、YouTube、Flow、Google Vids、Gemini API 和 Vertex AI 同步上线。
(科技圈)
via 茶馆 - Telegram Channel
Google 宣布推出 Veo 3.1 Ingredients to Video 升级版,该工具可基于参考图像生成视频内容。新版本在保持角色身份一致性、背景和物体连贯性方面显著改进,即使使用简单提示词也能生成更具表现力和创意的视频。
此次更新首次支持原生 9:16 竖屏格式输出,专为移动端短视频创作优化。同时新增最高 4K 分辨率的升级功能,1080p 版本提供更清晰的编辑效果,4K 版本则适用于高端制作和大屏幕播放。这些功能已在 Gemini 应用、YouTube、Flow、Google Vids、Gemini API 和 Vertex AI 中上线。
🍀在花频道 🍵茶馆聊天 📮投稿
via 科技圈🎗在花频道📮 - Telegram Channel
谷歌加码医疗AI开源生态:MedGemma 1.5强化医学影像能力,同步推出语音转写模型MedASR
近日,公司正式发布新一代开源医疗大模型 MedGemma 1.5,并在同期推出专为临床场景设计的开源语音识别模型 MedASR,进一步完善其在医疗垂直领域的技术栈。
作为Gemma系列的医疗专用版本,MedGemma 1.5 在前代基础上显著增强了对医学影像的理解与分析能力。该模型不仅能处理文本病历、检验报告和医学文献,还可结合X光、CT等常见影像模态的描述性数据,辅助进行初步筛查与诊断推理。这一升级使MedGemma从纯文本问答工具,迈向多模态临床决策支持系统,更贴近真实医疗工作流。
与此同时,MedASR 的推出直击医生文书负担痛点。该模型专为医疗语音场景优化,能高精度识别医患对话、查房记录、手术口述等专业内容,并自动转写为结构化文本,大幅提升电子病历录入效率。谷歌强调,两个模型均基于去标识化的临床数据训练,严格遵循隐私保护规范,并以开源形式发布,供全球研究者与开发者免费使用。
此次双模型发布,标志着谷歌在医疗AI领域从“封闭服务”向“开放赋能”战略的深化。继Gemini医疗助手通过HIPAA合规认证后,开源模型的推出将进一步降低医疗机构、初创公司及学术团队的创新门槛,推动AI在基层医疗、远程诊疗和科研分析等场景的普惠应用。
在AI医疗从“可用”走向“好用”的关键阶段,谷歌正以开源+合规+多模态的组合拳,构建一个兼具安全性、实用性与可扩展性的医疗AI生态底座。
via AI新闻资讯 (author: AI Base)
近日,公司正式发布新一代开源医疗大模型 MedGemma 1.5,并在同期推出专为临床场景设计的开源语音识别模型 MedASR,进一步完善其在医疗垂直领域的技术栈。
作为Gemma系列的医疗专用版本,MedGemma 1.5 在前代基础上显著增强了对医学影像的理解与分析能力。该模型不仅能处理文本病历、检验报告和医学文献,还可结合X光、CT等常见影像模态的描述性数据,辅助进行初步筛查与诊断推理。这一升级使MedGemma从纯文本问答工具,迈向多模态临床决策支持系统,更贴近真实医疗工作流。
与此同时,MedASR 的推出直击医生文书负担痛点。该模型专为医疗语音场景优化,能高精度识别医患对话、查房记录、手术口述等专业内容,并自动转写为结构化文本,大幅提升电子病历录入效率。谷歌强调,两个模型均基于去标识化的临床数据训练,严格遵循隐私保护规范,并以开源形式发布,供全球研究者与开发者免费使用。
此次双模型发布,标志着谷歌在医疗AI领域从“封闭服务”向“开放赋能”战略的深化。继Gemini医疗助手通过HIPAA合规认证后,开源模型的推出将进一步降低医疗机构、初创公司及学术团队的创新门槛,推动AI在基层医疗、远程诊疗和科研分析等场景的普惠应用。
在AI医疗从“可用”走向“好用”的关键阶段,谷歌正以开源+合规+多模态的组合拳,构建一个兼具安全性、实用性与可扩展性的医疗AI生态底座。
via AI新闻资讯 (author: AI Base)
据财联社报道,韩国政府去年6月启动的"自主AI基础模型"竞赛陷入技术路线争议。在入围决赛的五家企业中,已有三家被发现至少部分使用了外国开源AI模型代码,其中中国模型成为主要"效仿"对象。
这场为期三年、旨在打造韩国"AI国家队"的竞赛由科学技术信息通信部主导,Naver Cloud、Upstage、SK Telecom、NC AI和LG AI研究院五家企业入围。竞赛目标是到2027年选出两家本土企业,其AI模型性能需达到OpenAI或谷歌等行业领军者95%以上水平。
争议最早由Upstage引发。竞争对手Sionic AI首席执行官Ko Suk-hyun指出,Upstage的AI模型部分组件与智谱AI开源模型存在相似之处,且代码中仍保留智谱AI版权标记。Upstage随后举行直播验证,承认推理代码使用了智谱AI的开源组件,但强调模型本身是从空白状态自主开发训练的。
随后,Naver被指其视觉和音频编码器与阿里巴巴和OpenAI产品相似;SK Telecom的推理代码则被指与DeepSeek模型代码相似。两家企业均承认使用外部编码器,但强调模型核心引擎完全自主研发。
值得注意的是,竞赛规则本身并未明确禁止使用外国开源代码。哈佛大学教授Gu-Yeon Wei指出,"放弃开源软件就意味着放弃巨大利益",要求所有代码由本国编写并不现实。但部分韩国业界人士担忧,使用外国工具可能带来安全风险,并削弱培育本土AI模型的初衷。
韩国副总理兼科学技术信息通信部长官裵庆勋对争议持开放态度,称"目睹技术论战反而看到了韩国AI的光明前景"。首尔国立大学AI研究院院长Jae W. Lee表示,受质疑企业的模型核心任务似乎并未依赖外国工具。按原计划,韩国政府将本周从五家入围者中淘汰一家。
via AI新闻资讯 (author: AI Base)
国内领先的视频大模型 Vidu 今日宣布,其开放平台正式上线“一键生成 MV”功能。这一技术的推出,标志着视频创作从素材拼接迈向了全自动的端到端生成时代。用户现在只需提供背景音乐、参考图像以及简单的文本指令,系统即可在分钟级别内输出画质精美、叙事连贯的高质量 MV。
该功能的核心在于一套深度协同的多智能体(Multi-Agent)系统。在接收到用户指令后,系统内部的多个专用 AI 智能体会立即开启精密协作。首先,导演智能体会对音乐结构和歌词进行深度解析,规划出整体的叙事脉络;随后,分镜脚本智能体会将创意转化为详细的镜头描述,涵盖景别、运镜和时长等专业参数。
在视觉生成阶段,该系统表现出了极高的工业级稳定性。通过“多图参考生视频”技术,创作者最多可上传7张参考图作为视觉锚点,视觉生成智能体据此在长达五分钟的视频中精准维持角色、场景和美学风格的高度统一。最后,剪辑与合成智能体会负责镜头的转场卡点,并自动生成与歌词逐帧同步的动态字幕。
这种“全自动制片”模式无需人工干预,极大地降低了专业视频创作的门槛。对于创作者而言,Vidu 不再仅仅是一个生成工具,而是一个集成化的虚拟制片厂,让复杂的 MV 制作变得像发送指令一样简单。
划重点:
● 🎬 全自动多智能体协同:系统内置导演、分镜、视觉生成及剪辑四大智能体,实现从解析音乐到成片输出的全流程自动化。
● 🖼️ 工业级风格一致性:支持最多7张参考图定位,确保在长达5分钟的视频中,角色与场景风格不发生漂移。
● 🎵 音画同步精准卡点:AI 能自动识别背景音乐节奏并完成转场,同时生成逐帧同步的动态字幕,分钟级即可交片。
via AI新闻资讯 (author: AI Base)
继发布全球首个通用实时世界模型 PixVerse R1后,其技术内核与应用场景近日同步亮相 —— 该模型通过三大核心技术的环环相扣,实现 “让虚拟世界活起来” 的实时交互体验,同时在游戏、影视、直播等领域拓展出 “人人可共创” 的新可能。
技术:三大创新筑牢 “实时世界” 基础
PixVerse R1的核心能力,源于三项底层技术的协同突破:
Omni 原生多模态模型作为现实世界的 “计算基座”,它将文本、图像、音频、视频等多模态内容统一为连续 Token 流,可端到端生成物理逻辑一致、最高1080P 画质的数字世界,为多模态交互提供了统一的技术底座。
自回归流式生成机制赋予模型 “持久记忆”,解决了长时序内容的一致性痛点:不仅支持无限时长生成,还能告别画面突变、逻辑断裂的问题,实现叙事的 “流式交互”。
瞬时响应引擎 IRE注入即时反应的 “神经反射”:通过时间轨迹折叠、引导校正、自适应稀疏注意力三大创新,将采样步骤压缩至1-4步,计算效率提升数百倍,直接支撑起 “即时响应” 的核心体验。
应用:多场景解锁 “实时共创” 新体验
基于技术能力,PixVerse R1让 “每个人都是实时世界的创造者”,在三大领域落地新范式:
● 游戏领域:让游戏世界 “活起来”,打造动态可交互的虚拟环境;
● 影视领域:让电影 “可以玩起来”,打破单向观看模式,实现互动式内容体验;
● 直播领域:让直播 “万物可互动”,升级实时参与感与交互深度。
该模型以 “所想即所见,所说即所现” 为核心,推动虚拟世界从 “录好再播” 的回放式形态,转向 “因你而实时演化” 的共创形态,其官方体验地址为 realtime.pixverse.ai。
via AI新闻资讯 (author: AI Base)
近日,人工智能公司 Anthropic 正式发布了其新款编程助手 “Cowork”,这一工具的开发过程几乎完全依赖于其自家 AI 模型 Claude。在短短一周半的时间内,Cowork 的首个版本就已问世,成为了 AI 编程工具的又一重要里程碑。
根据《商业内幕》的报道,Cowork 的设计旨在为非编程用户提供更加友好的 AI 支持。用户可以轻松授权 Cowork 访问计算机中的特定文件,通过简单的自然语言指令来完成各种任务,极大地降低了编程的门槛。Anthropic 的 Claude Code 项目负责人 Boris Cherny 透露,Cowork 的核心代码几乎全部由 Claude 自动生成,团队成员主要集中在讨论架构和产品方向,而具体的功能实现、漏洞修复和研究工作则是通过多个 Claude 实例并行完成的。
产品经理 Felix Rieseberg 表示,这种创新的开发方式让 Cowork 能够在极短的时间内完成首个版本。特别是在假日季节,用户们开始频繁使用 Claude 进行非编程工作,这也为 Cowork 的诞生提供了契机。不过,他也坦言,目前 Cowork 仍处于 Alpha 阶段,存在一些不完善之处。
目前,Cowork 仅对 Mac 端的 Claude Max 订阅用户开放,发布后迅速吸引了广泛的关注。Datasette 的联合创始人 Simon Willison 指出,Claude Code 的潜在价值尚未完全释放,而 Cowork 提供了一种更实用的切入方式。Reddit 的联合创始人 Alexis Ohanian 则对此表示,这是一个 “重大事件”。
然而,Anthropic 也提醒用户在使用 Cowork 时需要注意潜在风险。由于 Cowork 在获得文件访问权限后,可能执行删除本地文件等具有破坏性的操作,因此用户在下达指令时务必清晰明确。
在谈到 AI 投资的过热话题时,Anthropic 的首席执行官达里奥・阿莫代伊表示,专注于企业客户帮助公司建立了更可持续的商业模式,让他们在投资方面更加理性。
via AI新闻资讯 (author: AI Base)
据报道,阿里巴巴旗下AI应用千问上线仅两个月,月活跃用户数(MAU)已突破1亿大关,在学生和白领群体中呈现强劲增长势头。不过,截至发稿时阿里方面尚未对这一数据作出官方回应。
千问App于2025年11月启动公测,这标志着阿里巴巴从B端企业服务向C端用户市场的战略转型进入实质阶段。作为阿里全力进军AI to C市场的核心产品,千问被寄予打造"AI时代未来入口"的战略期望。
阿里巴巴智能信息事业群总裁吴嘉将千问明确定位为"会聊天能办事的个人AI助手"。他强调,千问的核心竞争力体现在两个维度:智力水平和办事能力。产品目标是构建一个真正理解用户需求、能够随时随地解决实际问题的AI助理。
若1亿MAU数据属实,这将是阿里在消费级AI应用市场取得的重要里程碑,也反映出国内用户对AI工具的接受度正在快速提升。从公测到破亿用户,千问的增长速度显示出超级AI应用在C端市场的巨大潜力。
via AI新闻资讯 (author: AI Base)