https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.oaibest.com
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.oaibest.com
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
地瓜机器人完成1.2亿美元B1轮融资,加速具身智能软硬件全栈研发
近日,具身智能计算基础设施领军企业地瓜机器人宣布完成1.2亿美元B1轮融资,此举标志着其在机器人全栈软硬件技术研发与产品迭代上进入加速阶段。
本轮融资由Synstellation Capital、滴滴、美团龙珠等头部产业资本领投,并吸引了北汽产投、九坤创投、芯联资本等多家战略及财务机构跟投,老股东高瓴创投、淡马锡旗下Vertex Growth、五源资本等悉数超额增持。自2025年完成A轮融资以来,公司在短短一年内累计融资额已达2.2亿美元(约合人民币15.17亿元),展现了资本市场对其“机器人界英伟达”定位的高度认可。
脱胎于地平线机器人事业部并于2024年独立运作的地瓜机器人,目前已构建起覆盖芯片、算法到软件的完善产品体系,算力布局跨越5至560TOPS,精准切入人形机器人、四足机器狗、物流AMR等多元化场景。通过与云鲸、影石Insta360、维他动力等行业头部客户的深度量产合作,地瓜机器人正纵向打通从前沿技术创新到大规模量产的链条。
在全球具身智能技术代际跃升的关键期,地瓜机器人致力于成为机器人时代的“Wintel”,其持续增强的端侧计算能力将为机器人规模化普及提供核心动力,进一步夯实全球机器人产业链的底层支撑基石。
via AI新闻资讯 (author: AI Base)
近日,具身智能计算基础设施领军企业地瓜机器人宣布完成1.2亿美元B1轮融资,此举标志着其在机器人全栈软硬件技术研发与产品迭代上进入加速阶段。
本轮融资由Synstellation Capital、滴滴、美团龙珠等头部产业资本领投,并吸引了北汽产投、九坤创投、芯联资本等多家战略及财务机构跟投,老股东高瓴创投、淡马锡旗下Vertex Growth、五源资本等悉数超额增持。自2025年完成A轮融资以来,公司在短短一年内累计融资额已达2.2亿美元(约合人民币15.17亿元),展现了资本市场对其“机器人界英伟达”定位的高度认可。
脱胎于地平线机器人事业部并于2024年独立运作的地瓜机器人,目前已构建起覆盖芯片、算法到软件的完善产品体系,算力布局跨越5至560TOPS,精准切入人形机器人、四足机器狗、物流AMR等多元化场景。通过与云鲸、影石Insta360、维他动力等行业头部客户的深度量产合作,地瓜机器人正纵向打通从前沿技术创新到大规模量产的链条。
在全球具身智能技术代际跃升的关键期,地瓜机器人致力于成为机器人时代的“Wintel”,其持续增强的端侧计算能力将为机器人规模化普及提供核心动力,进一步夯实全球机器人产业链的底层支撑基石。
via AI新闻资讯 (author: AI Base)
Anthropic 面向合作伙伴推出「Claude 认证架构师——基础」(CCA-F)认证考试,定位 301 级技术从业者,要求具备 Claude Agent SDK、Claude Code、Anthropic API 及 MCP 的实际开发经验。考试共 60 道题,涵盖五大核心能力领域,从六个生产场景中随机抽取四个作为考题背景,仅限一次作答机会,由 ProctorFree 提供在线监考;早期访问阶段前 5,000 名合作伙伴员工可免费参考,此后定价 99 美元,通过者将获得可在 LinkedIn 分享的 CCA-F 徽章。
Anthropic Courses
🍀在花频道 🍵茶馆聊天 📮投稿
via 科技圈🎗在花频道📮 - Telegram Channel
香港用户终于等到你!谷歌逐步解锁 Gemini 网页版:生成图像、音乐全开放
在经历了漫长的等待后,香港用户终于要和谷歌最强 AI 助手正面“握手”了。据有线新闻今日报道,谷歌 (Google) 已开始逐步向香港特别行政区用户开放其大语言模型 Gemini 的网页版应用。
作为谷歌倾力打造的多模态 AI,Gemini 此前因种种原因一直未对香港个人用户直接开放登录。此次“解锁”意味着,全港用户将能直接体验到这款集文字处理、图像生成、语音交互及复杂数据分析于一体的顶尖生产力工具。
根据谷歌方面的官方计划,本次开放将分阶段进行:
第一阶段: 逐步覆盖全港用户的网页端使用权限。
第二阶段: 未来将进一步涵盖 Gemini App 移动应用程序,让用户在手机上也能随时调用 AI 能力。
目前,香港用户可以使用 Gemini 处理日常办公琐事,或利用其多模态能力生成创意图像、多媒体内容以及编写音乐。虽然谷歌尚未透露此次开放的模型是否包含最新的 Gemini1.5Pro 系列,但这一举措无疑极大降低了香港开发者与创意工作者的技术门槛。
值得注意的是,随着Gemini的正式进场,香港市场的 AI 竞争格局将愈发白热化。此前,央视3·15晚会刚曝光了 AI 大模型被投毒的产业链,这提醒用户在享受谷歌带来的技术红利时,仍需保持对 AI 生成内容的审慎判别。当全球顶尖 AI 真正融入维港的日常生活,香港的数智化进程或将迎来新的加速点。
via AI新闻资讯 (author: AI Base)
在经历了漫长的等待后,香港用户终于要和谷歌最强 AI 助手正面“握手”了。据有线新闻今日报道,谷歌 (Google) 已开始逐步向香港特别行政区用户开放其大语言模型 Gemini 的网页版应用。
作为谷歌倾力打造的多模态 AI,Gemini 此前因种种原因一直未对香港个人用户直接开放登录。此次“解锁”意味着,全港用户将能直接体验到这款集文字处理、图像生成、语音交互及复杂数据分析于一体的顶尖生产力工具。
根据谷歌方面的官方计划,本次开放将分阶段进行:
第一阶段: 逐步覆盖全港用户的网页端使用权限。
第二阶段: 未来将进一步涵盖 Gemini App 移动应用程序,让用户在手机上也能随时调用 AI 能力。
目前,香港用户可以使用 Gemini 处理日常办公琐事,或利用其多模态能力生成创意图像、多媒体内容以及编写音乐。虽然谷歌尚未透露此次开放的模型是否包含最新的 Gemini1.5Pro 系列,但这一举措无疑极大降低了香港开发者与创意工作者的技术门槛。
值得注意的是,随着Gemini的正式进场,香港市场的 AI 竞争格局将愈发白热化。此前,央视3·15晚会刚曝光了 AI 大模型被投毒的产业链,这提醒用户在享受谷歌带来的技术红利时,仍需保持对 AI 生成内容的审慎判别。当全球顶尖 AI 真正融入维港的日常生活,香港的数智化进程或将迎来新的加速点。
via AI新闻资讯 (author: AI Base)
通义开源首个影视级配音大模型:AI 终于学会了“有感情地说话”
在 AIGC 横扫图像与文字领域后,影视行业的最后一个“人工堡垒”——配音,正在被阿里通义实验室攻破。3月16日,通义实验室正式发布并开源了全球首个支持影视级、多场景配音的多模态大模型 Fun-CineForge。
长期以来,AI 配音始终难以撕掉“机械感”和“播音腔”的标签。尤其在影视剧场景中,角色的情感爆发、环境音的杂糅以及口型同步,一直是 AI 难以逾越的鸿沟。而Fun-CineForge的出现,正是为了终结这一难题。
这款大模型采用了革命性的“数据+模型”一体化设计。除了模型本身,通义实验室还配套开放了一套高质量数据集的构建方法。这意味着,AI 不再是简单地读取文本,而是能够深度理解影视剧中的复杂语境,还原出细腻的情感起伏和多场景下的空间音效。
作为阿里通义家族的新成员,Fun-CineForge的开源属性极具杀伤力。它不仅为视频创作者提供了一个“影视级”的后期工具,更通过技术下放,让中短剧甚至个人创作者也能以极低成本完成高质量的跨语言译制。
从去年发布的Qwen3-Omni到如今的Fun-CineForge,通义系列正加速补齐多模态拼图的最后一块。当 AI 真正学会了“像人一样演戏”,影视翻译和后期制作的逻辑,或许将从此被彻底重写。目前,该模型及其数据集构建方案已在相关开源平台上线,这波“影视级 AI”的普及风暴,比我们想象中来得更快。
via AI新闻资讯 (author: AI Base)
在 AIGC 横扫图像与文字领域后,影视行业的最后一个“人工堡垒”——配音,正在被阿里通义实验室攻破。3月16日,通义实验室正式发布并开源了全球首个支持影视级、多场景配音的多模态大模型 Fun-CineForge。
长期以来,AI 配音始终难以撕掉“机械感”和“播音腔”的标签。尤其在影视剧场景中,角色的情感爆发、环境音的杂糅以及口型同步,一直是 AI 难以逾越的鸿沟。而Fun-CineForge的出现,正是为了终结这一难题。
这款大模型采用了革命性的“数据+模型”一体化设计。除了模型本身,通义实验室还配套开放了一套高质量数据集的构建方法。这意味着,AI 不再是简单地读取文本,而是能够深度理解影视剧中的复杂语境,还原出细腻的情感起伏和多场景下的空间音效。
作为阿里通义家族的新成员,Fun-CineForge的开源属性极具杀伤力。它不仅为视频创作者提供了一个“影视级”的后期工具,更通过技术下放,让中短剧甚至个人创作者也能以极低成本完成高质量的跨语言译制。
从去年发布的Qwen3-Omni到如今的Fun-CineForge,通义系列正加速补齐多模态拼图的最后一块。当 AI 真正学会了“像人一样演戏”,影视翻译和后期制作的逻辑,或许将从此被彻底重写。目前,该模型及其数据集构建方案已在相关开源平台上线,这波“影视级 AI”的普及风暴,比我们想象中来得更快。
via AI新闻资讯 (author: AI Base)
拒绝“套壳”:谷歌与 Accel 印度加速器从 4000 份申请中选出 5 家硬核初创公司
在审查了旗下印度人工智能加速器项目的 4000 多份申请后,谷歌与风险投资公司 Accel 正式公布了入选的 5 家初创企业。值得关注的是,尽管“人工智能封装器(Wrapper)”类的创意在申请中占据了绝大多数,但最终入选的名单中没有一家属于此类肤浅的“套壳”项目。
Accel 合伙人 Prayank Swaroop 表示,约 70% 的被拒申请仅仅是在现有模型之上叠加了一个简单的聊天机器人界面,而未能利用 AI 重新构思新的工作流程。此外,营销自动化和招聘工具等竞争过度、缺乏创新的领域也是被拒绝的重灾区。投资者目前更倾向于支持那些能够解决深层行业痛点、具备独特技术壁垒的企业。
此次入选的 5 家初创公司展现了极强的行业针对性,涵盖了从生命科学到工业自动化的多个前沿领域:
● K-Dense:开发 AI “副科学家”,旨在加速生物化学等领域的科研进程。
● Dodge.ai:为企业 ERP 系统打造自主智能体。
● Persistence Labs:专注于呼叫中心运营的语音 AI 技术。
● Zingroll:构建 AI 生成影视剧内容的平台。
● Level Plane:将 AI 应用于航空航天及汽车制造的工业自动化。
这些入选者将获得最高 200 万美元的资金支持,以及谷歌提供的 35 万美元计算资源。谷歌表示,该项目并不限制初创公司仅使用谷歌的模型,其核心目标是观察 AI 在现实复杂场景中的表现,并将相关反馈作为“飞轮”回馈给 Google DeepMind 团队,以推动未来模型的迭代升级。
via AI新闻资讯 (author: AI Base)
在审查了旗下印度人工智能加速器项目的 4000 多份申请后,谷歌与风险投资公司 Accel 正式公布了入选的 5 家初创企业。值得关注的是,尽管“人工智能封装器(Wrapper)”类的创意在申请中占据了绝大多数,但最终入选的名单中没有一家属于此类肤浅的“套壳”项目。
Accel 合伙人 Prayank Swaroop 表示,约 70% 的被拒申请仅仅是在现有模型之上叠加了一个简单的聊天机器人界面,而未能利用 AI 重新构思新的工作流程。此外,营销自动化和招聘工具等竞争过度、缺乏创新的领域也是被拒绝的重灾区。投资者目前更倾向于支持那些能够解决深层行业痛点、具备独特技术壁垒的企业。
此次入选的 5 家初创公司展现了极强的行业针对性,涵盖了从生命科学到工业自动化的多个前沿领域:
● K-Dense:开发 AI “副科学家”,旨在加速生物化学等领域的科研进程。
● Dodge.ai:为企业 ERP 系统打造自主智能体。
● Persistence Labs:专注于呼叫中心运营的语音 AI 技术。
● Zingroll:构建 AI 生成影视剧内容的平台。
● Level Plane:将 AI 应用于航空航天及汽车制造的工业自动化。
这些入选者将获得最高 200 万美元的资金支持,以及谷歌提供的 35 万美元计算资源。谷歌表示,该项目并不限制初创公司仅使用谷歌的模型,其核心目标是观察 AI 在现实复杂场景中的表现,并将相关反馈作为“飞轮”回馈给 Google DeepMind 团队,以推动未来模型的迭代升级。
via AI新闻资讯 (author: AI Base)
旧金山地下机器人格斗俱乐部:AI让人形机器人走向致命竞技
【AIbase】旧金山正在兴起一种新型地下娱乐——人形机器人格斗俱乐部。钢铁笼中,人形机器人在VR飞行员的远程操控下激烈对战,观众呐喊助威。这一奇特景象背后,是中国制造的硬件、美国搭建的竞技舞台,以及AI赋予机器人的致命能力。
地下机器人格斗:科技与娱乐的碰撞
据科技作家Ashlee Vance转发的报道,旧金山的地下机器人格斗俱乐部正在成为科技爱好者和极客们的新聚集地。在这些秘密举办的活动中,人形机器人被关在钢铁笼中进行激烈对抗。操控这些机器人的不是现场的操作员,而是通过VR设备进行远程操控的"飞行员"。
现场观众可以近距离观看这些机器人的对抗,感受金属碰撞的震撼。这种将高科技与娱乐 spectacle 结合的形式,正在吸引越来越多的关注。
中国制造,美国舞台
报道中特别提到,这些参与格斗的人形机器人硬件大多来自中国制造商。中国在人形机器人硬件制造领域的快速发展,为这些地下格斗俱乐部提供了坚实的技术基础。而美国则提供了展示这些技术的舞台和观众群体。
这种"中国制造硬件,美国搭建舞台"的模式,反映了全球AI和机器人产业链的协作与分工。
AI赋予致命能力
AI技术在这些机器人格斗中扮演着关键角色。通过AI算法,这些机器人能够做出更加灵活和精准的动作,让对抗更具观赏性。报道中提到"AI makes them lethal",暗示AI技术让这些机器人在格斗中展现出惊人的能力。
VR远程操控与AI自主决策的结合,代表了人机协作的新方向。操控者可以通过VR设备身临其境地感受机器人的视角,而AI则负责处理复杂的运动控制。
科技伦理与未来展望
虽然目前的机器人格斗更多是一种娱乐形式,但它也引发了关于AI和机器人技术应用的讨论。随着人形机器人技术的不断进步,类似的竞技活动可能会变得更加普遍。
科技作家Ashlee Vance对这一话题的关注,也反映了科技界对AI和机器人技术发展趋势的持续关注。
(本文综合X@ashleevance、X@jeffs2009等媒体报道)
via AI新闻资讯 (author: AI Base)
【AIbase】旧金山正在兴起一种新型地下娱乐——人形机器人格斗俱乐部。钢铁笼中,人形机器人在VR飞行员的远程操控下激烈对战,观众呐喊助威。这一奇特景象背后,是中国制造的硬件、美国搭建的竞技舞台,以及AI赋予机器人的致命能力。
地下机器人格斗:科技与娱乐的碰撞
据科技作家Ashlee Vance转发的报道,旧金山的地下机器人格斗俱乐部正在成为科技爱好者和极客们的新聚集地。在这些秘密举办的活动中,人形机器人被关在钢铁笼中进行激烈对抗。操控这些机器人的不是现场的操作员,而是通过VR设备进行远程操控的"飞行员"。
现场观众可以近距离观看这些机器人的对抗,感受金属碰撞的震撼。这种将高科技与娱乐 spectacle 结合的形式,正在吸引越来越多的关注。
中国制造,美国舞台
报道中特别提到,这些参与格斗的人形机器人硬件大多来自中国制造商。中国在人形机器人硬件制造领域的快速发展,为这些地下格斗俱乐部提供了坚实的技术基础。而美国则提供了展示这些技术的舞台和观众群体。
这种"中国制造硬件,美国搭建舞台"的模式,反映了全球AI和机器人产业链的协作与分工。
AI赋予致命能力
AI技术在这些机器人格斗中扮演着关键角色。通过AI算法,这些机器人能够做出更加灵活和精准的动作,让对抗更具观赏性。报道中提到"AI makes them lethal",暗示AI技术让这些机器人在格斗中展现出惊人的能力。
VR远程操控与AI自主决策的结合,代表了人机协作的新方向。操控者可以通过VR设备身临其境地感受机器人的视角,而AI则负责处理复杂的运动控制。
科技伦理与未来展望
虽然目前的机器人格斗更多是一种娱乐形式,但它也引发了关于AI和机器人技术应用的讨论。随着人形机器人技术的不断进步,类似的竞技活动可能会变得更加普遍。
科技作家Ashlee Vance对这一话题的关注,也反映了科技界对AI和机器人技术发展趋势的持续关注。
(本文综合X@ashleevance、X@jeffs2009等媒体报道)
via AI新闻资讯 (author: AI Base)
IBM 近日正式推出了 Granite4.01B Speech。这是一款专为边缘计算和企业级部署设计的紧凑型语音语言模型,旨在提供高效率的多语种自动语音识别(ASR)与双向自动语音翻译(AST)能力。
与前代版本相比,Granite4.01B Speech 的参数量仅为上一代模型的一半,但在性能上实现了显著跃升。新模型不仅增加了对日语 ASR 的支持,还引入了关键词偏置功能,并大幅提升了英文转录的准确率。其核心设计目标是在不牺牲核心能力的前提下,极大地降低内存占用、推理延迟和计算成本。
该模型采用了创新的“两阶段设计”架构。系统首先将音频转换为文本,随后通过专门的 Granite 语言模型进行推理处理。这种模块化设计允许开发者根据需求灵活编排流程。目前,该模型已支持包括英语、法语、德语、西班牙语、葡萄牙语和日语在内的多语种互译,并能处理英语对中文(普通话)的翻译任务。
在性能测试中,Granite4.01B Speech 表现出色,位居 OpenASR 排行榜首位,平均字错率(WER)仅为5.52。目前,IBM 已根据 Apache2.0协议正式开源该模型,开发者可通过 Transformers 或 vLLM 等主流框架进行本地部署,为资源受限的移动端或边缘设备提供强劲的 AI 语音支持。
项目:https://huggingface.co/ibm-granite/granite-4.0-1b-speech
via AI新闻资讯 (author: AI Base)