https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
xAI重磅发布Grok Voice Agent API:每分钟仅0.05美元,音频推理基准登顶第一!
xAI正式推出Grok Voice Agent API,为开发者开放实时语音交互能力。这一API基于Grok语音技术栈打造,已在移动应用和数百万Tesla车辆中服务海量用户,现向全球开发者全面开放。
极致性价比:每分钟仅0.05美元
Grok Voice Agent API以行业领先的成本效率脱颖而出,采用简单平价计费模式——每分钟连接时间仅0.05美元。这一定价显著低于主流竞品,帮助开发者以最低成本构建高性能语音应用。
音频推理基准排名第一
在权威音频推理基准Big Bench Audio上,Grok Voice Agent API位居第一。该API平均首音频响应时间不到1秒,比最接近的竞争对手快近5倍,展现出卓越的实时响应与推理能力。
核心能力一览
- 实时双向语音通信:支持流式音频输入输出,实现低延迟、自然对话体验。
- 多语言支持:覆盖包括中文在内的数十种语言(官方称超100种),具备原生级发音、口音和方言捕捉能力。
- 自动语言识别与切换:无需配置,即可自动检测用户语言并无缝切换;开发者也可通过系统提示指定响应语言。
- 外部工具调用:轻松集成自定义工具,或接入xAI的实时搜索能力,覆盖网络和X平台数据。
- 实时联网搜索与推理:在对话中即时查询信息并进行复杂推理。
- 情感提示控制语音:通过提示调节语音情感表达,提升交互自然度。
- 多种人声选择:提供多样化声音选项,包括Sal、Rex、Eve、Leo等经典角色,以及Mika、Valentin等伴侣型人格。
- 兼容OpenAI Realtime API规范:无缝迁移现有应用,并支持xAI LiveKit插件,便于快速集成。
未来展望
xAI表示,该API将持续迭代,未来几周内将推出独立文本到语音(TTS)和语音到文本(STT)端点,以及进一步优化的音频模型,提升发音准确度和延迟表现。
via AI新闻资讯 (author: AI Base)
xAI正式推出Grok Voice Agent API,为开发者开放实时语音交互能力。这一API基于Grok语音技术栈打造,已在移动应用和数百万Tesla车辆中服务海量用户,现向全球开发者全面开放。
极致性价比:每分钟仅0.05美元
Grok Voice Agent API以行业领先的成本效率脱颖而出,采用简单平价计费模式——每分钟连接时间仅0.05美元。这一定价显著低于主流竞品,帮助开发者以最低成本构建高性能语音应用。
音频推理基准排名第一
在权威音频推理基准Big Bench Audio上,Grok Voice Agent API位居第一。该API平均首音频响应时间不到1秒,比最接近的竞争对手快近5倍,展现出卓越的实时响应与推理能力。
核心能力一览
- 实时双向语音通信:支持流式音频输入输出,实现低延迟、自然对话体验。
- 多语言支持:覆盖包括中文在内的数十种语言(官方称超100种),具备原生级发音、口音和方言捕捉能力。
- 自动语言识别与切换:无需配置,即可自动检测用户语言并无缝切换;开发者也可通过系统提示指定响应语言。
- 外部工具调用:轻松集成自定义工具,或接入xAI的实时搜索能力,覆盖网络和X平台数据。
- 实时联网搜索与推理:在对话中即时查询信息并进行复杂推理。
- 情感提示控制语音:通过提示调节语音情感表达,提升交互自然度。
- 多种人声选择:提供多样化声音选项,包括Sal、Rex、Eve、Leo等经典角色,以及Mika、Valentin等伴侣型人格。
- 兼容OpenAI Realtime API规范:无缝迁移现有应用,并支持xAI LiveKit插件,便于快速集成。
未来展望
xAI表示,该API将持续迭代,未来几周内将推出独立文本到语音(TTS)和语音到文本(STT)端点,以及进一步优化的音频模型,提升发音准确度和延迟表现。
via AI新闻资讯 (author: AI Base)
字节跳动推出 TRAE CN 企业版,助力高效编程
字节跳动正式发布了其 AI 编程工具 TRAE CN 的企业版。这款工具在字节内部已经获得了超过92% 的工程师的使用,显示出其强大的实用性。同时,个人版的注册用户也已经突破了600万。
根据字节内部的实践数据,TRAE 在抖音生活服务团队的 AI 代码贡献率高达43%,这表明其在提升工作效率方面的显著效果。为了满足企业在性能、部署适配、效能追踪及代码安全等方面的需求,TRAE CN 企业版经过了全面优化。
这款新产品能够支持多达10万个文件和1.5亿行代码的容量,具备强大的处理能力。同时,它实现了从知识库到 Agent 的全场景业务适配,方便用户在不同场景下进行高效的代码编写和管理。此外,TRAE CN 企业版还支持实时效能追踪管理,让企业能够随时掌握项目进展和代码执行情况。
在安全性方面,TRAE CN 企业版采用全链路代码加密传输,确保数据的安全性。值得一提的是,它还提供云端零存储的解决方案,保障企业在使用过程中的合规性与安全性。
via AI新闻资讯 (author: AI Base)
字节跳动正式发布了其 AI 编程工具 TRAE CN 的企业版。这款工具在字节内部已经获得了超过92% 的工程师的使用,显示出其强大的实用性。同时,个人版的注册用户也已经突破了600万。
根据字节内部的实践数据,TRAE 在抖音生活服务团队的 AI 代码贡献率高达43%,这表明其在提升工作效率方面的显著效果。为了满足企业在性能、部署适配、效能追踪及代码安全等方面的需求,TRAE CN 企业版经过了全面优化。
这款新产品能够支持多达10万个文件和1.5亿行代码的容量,具备强大的处理能力。同时,它实现了从知识库到 Agent 的全场景业务适配,方便用户在不同场景下进行高效的代码编写和管理。此外,TRAE CN 企业版还支持实时效能追踪管理,让企业能够随时掌握项目进展和代码执行情况。
在安全性方面,TRAE CN 企业版采用全链路代码加密传输,确保数据的安全性。值得一提的是,它还提供云端零存储的解决方案,保障企业在使用过程中的合规性与安全性。
划重点:
🌟 TRAE CN 企业版正式发布,已有超92% 的字节工程师使用。
📈 支持10万文件和1.5亿行代码,性能优化显著。
🔒 全链路代码加密传输,确保企业数据安全合规。
via AI新闻资讯 (author: AI Base)
xAI 推最快语音代理 API,支持中文实时搜索与情绪控制
据 AIbase 报道,xAI 正式发布了 Grok 语音代理 API,以每分钟仅 0.05美元的极具竞争力价格,在实时语音 AI 领域掀起了性能与性价比的双重风暴。该模型在音频推理基准测试中高居榜首,凭借不足1秒的首音延迟,实现了比竞品快近5倍的响应速度。
技术上,Grok 语音代理不仅支持包括中文在内的数十种语言自动检测与自由切换,更深度集成了实时网页搜索与推理能力,使其回复能够紧跟全网最新资讯。通过支持外部工具调用、情绪控制及多种语音选项,开发者可以构建出极具表现力且能执行实际任务的 AI 智能体。
值得一提的是,该 API 完全兼容 OpenAI 实时 API 规范,这为追求高性能、低成本方案的开发者提供了无缝迁移的可能,标志着马斯克在实时对话 AI 赛道上正式迈出了挑战行业格局的关键一步。
via AI新闻资讯 (author: AI Base)
据 AIbase 报道,xAI 正式发布了 Grok 语音代理 API,以每分钟仅 0.05美元的极具竞争力价格,在实时语音 AI 领域掀起了性能与性价比的双重风暴。该模型在音频推理基准测试中高居榜首,凭借不足1秒的首音延迟,实现了比竞品快近5倍的响应速度。
技术上,Grok 语音代理不仅支持包括中文在内的数十种语言自动检测与自由切换,更深度集成了实时网页搜索与推理能力,使其回复能够紧跟全网最新资讯。通过支持外部工具调用、情绪控制及多种语音选项,开发者可以构建出极具表现力且能执行实际任务的 AI 智能体。
值得一提的是,该 API 完全兼容 OpenAI 实时 API 规范,这为追求高性能、低成本方案的开发者提供了无缝迁移的可能,标志着马斯克在实时对话 AI 赛道上正式迈出了挑战行业格局的关键一步。
via AI新闻资讯 (author: AI Base)
马斯克“新战书”:xAI两三年内超越竞争对手
多位知情人士透露,上周在xAI公司旧金山总部举行的全体员工大会上,马斯克扬言,只要公司能够顺利挺过未来两到三年,xAI就能战胜竞争对手。他补充称,该公司快速扩展其算力和数据容量的能力将是在所谓超级智能的竞争中致胜的关键,并最终有望让xAI成为最强大的AI公司。马斯克表示,xAI有可能在未来几年内实现通用人工智能(AGI),甚至最早可能在2026年实现。此外,马斯克还告诉员工,与其他人工智能公司相比,xAI将具有优势,因为它每年可以获得约200亿至300亿美元的资金支持,并且能够受益于他旗下其他公司的协同效应。特斯拉今年早些时候已将Grok集成进其生产的车辆中。
—— 财联社
via 风向旗参考快讯 - Telegram Channel
多位知情人士透露,上周在xAI公司旧金山总部举行的全体员工大会上,马斯克扬言,只要公司能够顺利挺过未来两到三年,xAI就能战胜竞争对手。他补充称,该公司快速扩展其算力和数据容量的能力将是在所谓超级智能的竞争中致胜的关键,并最终有望让xAI成为最强大的AI公司。马斯克表示,xAI有可能在未来几年内实现通用人工智能(AGI),甚至最早可能在2026年实现。此外,马斯克还告诉员工,与其他人工智能公司相比,xAI将具有优势,因为它每年可以获得约200亿至300亿美元的资金支持,并且能够受益于他旗下其他公司的协同效应。特斯拉今年早些时候已将Grok集成进其生产的车辆中。
—— 财联社
via 风向旗参考快讯 - Telegram Channel
12月18日,人工智能搜索平台 Perplexity 宣布,其集成的最新大模型 Gemini3Flash 已全面向 Pro 和 Max 订阅用户开放。此次更新标志着 Perplexity 在提升响应速度与推理效率方面迈出关键一步。
Gemini3Flash 是谷歌近期推出的轻量级高性能模型,主打低延迟与高吞吐能力,在保持强大语言理解能力的同时,显著优化了推理成本与响应速度。Perplexity 表示,该模型将为用户提供更快速、流畅的问答体验,尤其适用于需要实时信息整合与多轮交互的复杂查询场景。
据官方介绍,Pro 与 Max 用户无需额外操作,即可在现有界面中直接调用 Gemini3Flash。系统将根据查询类型智能选择最合适的模型,确保在速度与准确性之间取得最佳平衡。此外,该模型对多语言支持和代码理解能力也进行了针对性优化,进一步拓展了 Perplexity 在专业领域的应用边界。
此次集成是 Perplexity 与谷歌深度合作的又一成果。随着 Gemini3Flash 的上线,Perplexity 有望在竞争激烈的 AI 搜索赛道中强化其技术优势,为高阶用户提供更高效、精准的信息服务。未来,该模型或将进一步下放至免费用户层级,扩大技术普惠范围。
via AI新闻资讯 (author: AI Base)
近日,微软正式开源了其最新的图像到3D 模型生成工具 ——TRELLIS.2。该工具在生成高质量、带材质的3D 模型方面表现出色,仅需输入一张图片,便可迅速生成可供 Blender、Unity、Unreal 等平台使用的.glb 格式三角形网格文件。
TRELLIS.2使用了一种名为4B 的模型,能够处理分辨率在512³ 到1536³ 之间的图像。在 NVIDIA H100显卡的支持下,生成512³ 分辨率的3D 模型仅需约3秒,1024³ 分辨率的模型则需约17秒,而生成1536³ 分辨率的模型则约需1分钟。这一速度使得用户能够在极短的时间内获得高精度的3D 模型,极大地提升了工作效率。
TRELLIS.2不仅能生成3D 模型,还附带了 PBR 四件套贴图,包括颜色、粗糙度、金属度和透明度,这些特性对于电商场景尤为重要。商家只需拍摄产品图片,上传至 TRELLIS.2,即可在1分钟内获得适合上架的3D 模型,大幅简化了电商产品展示的流程。
TRELLIS.2的发布标志着图像生成3D 技术的进一步发展,吸引了众多开发者和企业的关注。通过这一工具,用户能够轻松制作出高质量的3D 内容,无论是在游戏开发、虚拟现实还是电子商务领域,都具备广泛的应用潜力。
HF:https://huggingface.co/microsoft/TRELLIS.2-4B
github:https://github.com/microsoft/TRELLIS.2
划重点:
🌟 TRELLIS.2是一款微软开源的图像到3D 模型生成工具,能迅速生成高质量3D 模型。
⏱️ 该工具在 NVIDIA H100显卡上生成512³ 分辨率模型仅需3秒,效率极高。
🛒 附带 PBR 四件套贴图,方便电商用户快速将产品转为3D 展示。
via AI新闻资讯 (author: AI Base)
火山引擎发布 AI 节省计划,豆包大模型最高降价47%
在12月18日举办的火山引擎 FORCE 原动力大会上,火山引擎总裁谭待发布了多项重磅更新,旨在通过视觉模型进化、生态整合及极具竞争力的定价策略,加速 AI 在企业端的规模化普惠。
在多模态领域,豆包视觉模型迎来双重迭代。图像创作模型 Seedream4.5 能力显著增强,已支持多图组合、创意写真、虚拟试穿及海报设计等多种商业化功能。与此同时,全新视频生成模型 Seedance1.5Pro 正式亮相,该版本实现了音画高精同步与多人多语言对白,具备影视级镜头叙事能力,并引入 Draft 样片功能,让开发者能以极低成本快速验证创意一致性。
生态应用方面,豆包助手 API 正式登陆火山方舟大模型服务平台。首批上线的“日常沟通”与“联网搜索”等能力,赋予了企业级应用更强的实时信息获取与拟人化交互体验。为了进一步降低模型使用门槛,火山引擎同步推出 “AI 节省计划”。
该计划覆盖所有按量后付费的大模型产品,采用阶梯式折扣模式,承诺用量越多单价越低,最高可为企业节省 47% 的使用成本。通过软硬件协同优化与商业模式创新,火山引擎正致力于让大模型真正成为人人用得起、用得好的生产力基座。
via AI新闻资讯 (author: AI Base)
在12月18日举办的火山引擎 FORCE 原动力大会上,火山引擎总裁谭待发布了多项重磅更新,旨在通过视觉模型进化、生态整合及极具竞争力的定价策略,加速 AI 在企业端的规模化普惠。
在多模态领域,豆包视觉模型迎来双重迭代。图像创作模型 Seedream4.5 能力显著增强,已支持多图组合、创意写真、虚拟试穿及海报设计等多种商业化功能。与此同时,全新视频生成模型 Seedance1.5Pro 正式亮相,该版本实现了音画高精同步与多人多语言对白,具备影视级镜头叙事能力,并引入 Draft 样片功能,让开发者能以极低成本快速验证创意一致性。
生态应用方面,豆包助手 API 正式登陆火山方舟大模型服务平台。首批上线的“日常沟通”与“联网搜索”等能力,赋予了企业级应用更强的实时信息获取与拟人化交互体验。为了进一步降低模型使用门槛,火山引擎同步推出 “AI 节省计划”。
该计划覆盖所有按量后付费的大模型产品,采用阶梯式折扣模式,承诺用量越多单价越低,最高可为企业节省 47% 的使用成本。通过软硬件协同优化与商业模式创新,火山引擎正致力于让大模型真正成为人人用得起、用得好的生产力基座。
via AI新闻资讯 (author: AI Base)
火山引擎FORCE大会亮剑:豆包大模型1.8+Seedance 1.5 Pro发布,日均50万亿Tokens登顶中国第一
在今日举行的火山引擎FORCE原动力大会上,字节跳动旗下智能科技品牌重磅升级其AI核心能力:正式发布豆包大模型1. 8 与视频生成模型Seedance 1.5 Pro,并同步推出“AI节省计划”,旨在进一步降低企业使用大模型的成本门槛。
性能方面,豆包大模型1. 8 在推理、多语言、代码生成与工具调用等关键维度实现显著提升;而Seedance 1.5 Pro则聚焦视频生成质量与一致性,支持更长时长、更高帧率的可控内容创作,为短视频、广告、游戏等领域提供工业化级视觉生成能力。
更引人注目的是其规模化落地的实绩:截至 2024 年 12 月,豆包大模型日均Tokens使用量已突破 50 万亿,稳居中国第一、全球第三。目前,超 100 家企业在火山引擎平台上的累计Tokens消耗量超过一万亿,涵盖电商、金融、文娱、制造等多个行业,标志着豆包已从技术产品走向大规模产业应用。
“AI节省计划”的推出,则直击当前企业AI部署的核心痛点——成本。火山引擎将通过模型压缩、推理优化、资源调度等技术手段,帮助客户在同等算力下实现更高吞吐与更低单位Token成本,加速AI在业务场景中的深度渗透。
随着豆包手机、AI眼镜等终端产品相继落地,字节跳动正以“大模型+云+终端+场景”四轮驱动,构建完整的AI生态闭环。而 50 万亿Tokens的日均使用量,不仅是一个技术指标,更是市场对豆包能力与性价比的集体投票——在中国AI从“可用”迈向“好用、常用”的关键阶段,火山引擎已站上浪潮之巅。
via AI新闻资讯 (author: AI Base)
在今日举行的火山引擎FORCE原动力大会上,字节跳动旗下智能科技品牌重磅升级其AI核心能力:正式发布豆包大模型1. 8 与视频生成模型Seedance 1.5 Pro,并同步推出“AI节省计划”,旨在进一步降低企业使用大模型的成本门槛。
性能方面,豆包大模型1. 8 在推理、多语言、代码生成与工具调用等关键维度实现显著提升;而Seedance 1.5 Pro则聚焦视频生成质量与一致性,支持更长时长、更高帧率的可控内容创作,为短视频、广告、游戏等领域提供工业化级视觉生成能力。
更引人注目的是其规模化落地的实绩:截至 2024 年 12 月,豆包大模型日均Tokens使用量已突破 50 万亿,稳居中国第一、全球第三。目前,超 100 家企业在火山引擎平台上的累计Tokens消耗量超过一万亿,涵盖电商、金融、文娱、制造等多个行业,标志着豆包已从技术产品走向大规模产业应用。
“AI节省计划”的推出,则直击当前企业AI部署的核心痛点——成本。火山引擎将通过模型压缩、推理优化、资源调度等技术手段,帮助客户在同等算力下实现更高吞吐与更低单位Token成本,加速AI在业务场景中的深度渗透。
随着豆包手机、AI眼镜等终端产品相继落地,字节跳动正以“大模型+云+终端+场景”四轮驱动,构建完整的AI生态闭环。而 50 万亿Tokens的日均使用量,不仅是一个技术指标,更是市场对豆包能力与性价比的集体投票——在中国AI从“可用”迈向“好用、常用”的关键阶段,火山引擎已站上浪潮之巅。
via AI新闻资讯 (author: AI Base)
豆包AI眼镜明年上市!联合润欣科技、老凤祥打造2000元内智能穿戴新品
字节跳动旗下豆包大模型正加速落地硬件终端。据最新消息,豆包AI眼镜已进入量产前阶段,由火山引擎提供底层技术支撑,润欣科技负责模组与硬件程序设计,并携手百年珠宝品牌老凤祥共同打造外观与佩戴体验。该产品定价 2000 元以内,预计 2025 年初正式上市,将成为国内首款深度融合大模型能力的亲民级AI眼镜。
在技术架构上,该眼镜依托火山引擎的RTC(实时音视频)技术,实现低延迟语音交互与云端协同;核心智能则由豆包大模型驱动,支持实时语音助手、环境感知、多轮对话、翻译、信息摘要等场景化功能。用户可通过语音指令完成导航、拍照识别、日程提醒、通话转录等操作,真正实现“听得懂、看得清、用得顺”的端侧AI体验。
值得注意的是,此次合作中老凤祥的加入,不仅为AI眼镜注入时尚与工艺基因,更探索了智能硬件与传统消费品牌的跨界融合新路径——科技不再冰冷,而是兼具美学与实用性的日常配饰。
随着AI终端从手机向可穿戴设备延伸,豆包眼镜的推出标志着字节跳动正以“大模型+硬件+渠道”三位一体策略,抢占下一代人机交互入口。在 2000 元价格带,这款产品或将引爆大众市场对AI眼镜的首次规模化认知,推动智能穿戴从“极客玩具”走向“生活刚需”。
via AI新闻资讯 (author: AI Base)
字节跳动旗下豆包大模型正加速落地硬件终端。据最新消息,豆包AI眼镜已进入量产前阶段,由火山引擎提供底层技术支撑,润欣科技负责模组与硬件程序设计,并携手百年珠宝品牌老凤祥共同打造外观与佩戴体验。该产品定价 2000 元以内,预计 2025 年初正式上市,将成为国内首款深度融合大模型能力的亲民级AI眼镜。
在技术架构上,该眼镜依托火山引擎的RTC(实时音视频)技术,实现低延迟语音交互与云端协同;核心智能则由豆包大模型驱动,支持实时语音助手、环境感知、多轮对话、翻译、信息摘要等场景化功能。用户可通过语音指令完成导航、拍照识别、日程提醒、通话转录等操作,真正实现“听得懂、看得清、用得顺”的端侧AI体验。
值得注意的是,此次合作中老凤祥的加入,不仅为AI眼镜注入时尚与工艺基因,更探索了智能硬件与传统消费品牌的跨界融合新路径——科技不再冰冷,而是兼具美学与实用性的日常配饰。
随着AI终端从手机向可穿戴设备延伸,豆包眼镜的推出标志着字节跳动正以“大模型+硬件+渠道”三位一体策略,抢占下一代人机交互入口。在 2000 元价格带,这款产品或将引爆大众市场对AI眼镜的首次规模化认知,推动智能穿戴从“极客玩具”走向“生活刚需”。
via AI新闻资讯 (author: AI Base)
以色列前总理电话联系人及聊天记录泄露
以色列安全官员正在调查属于前总理纳夫塔利·本内特的电话联系人、照片及信息如何泄露至网络。以色列媒体本周三报道称,本内特或其身边人员的手机遭伊朗黑客入侵。网络上流传的本内特电话联系人名单似乎包含OpenAI CEO萨姆·奥尔特曼等科技企业高管、名人、外交官及商界领袖的号码。本内特通过其办公室发布声明称,其手机并未被黑客入侵,但电报账户遭通过各种方式访问。并暗示泄露事件系 “以色列的敌人” 所为。本内特表示,网络上分享的电话名单、照片及聊天记录部分内容属实,并补充说部分为伪造内容。他称以色列安全官员正在调查此事。
—— 彭博社
via 风向旗参考快讯 - Telegram Channel
以色列安全官员正在调查属于前总理纳夫塔利·本内特的电话联系人、照片及信息如何泄露至网络。以色列媒体本周三报道称,本内特或其身边人员的手机遭伊朗黑客入侵。网络上流传的本内特电话联系人名单似乎包含OpenAI CEO萨姆·奥尔特曼等科技企业高管、名人、外交官及商界领袖的号码。本内特通过其办公室发布声明称,其手机并未被黑客入侵,但电报账户遭通过各种方式访问。并暗示泄露事件系 “以色列的敌人” 所为。本内特表示,网络上分享的电话名单、照片及聊天记录部分内容属实,并补充说部分为伪造内容。他称以色列安全官员正在调查此事。
—— 彭博社
via 风向旗参考快讯 - Telegram Channel
据 AIbase 报道,为了撼动英伟达在 AI 芯片领域的统治地位,Alphabet(谷歌母公司)正在推进一项名为“TorchTPU”的战略计划。该计划旨在显著提升其张量处理单元(TPU)芯片对 PyTorch 框架的兼容性,从而降低开发者从英伟达 GPU 切换至谷歌 TPU 的技术门槛和迁移成本。
长期以来,PyTorch 作为全球应用最广泛的开源 AI 开发框架,与英伟达的 CUDA 软件栈深度绑定,这构成了英伟达最强大的生态护城河。相比之下,谷歌的 TPU 过去主要适配自家的 JAX 框架,导致大量习惯使用 PyTorch 的开发者在调用 TPU 算力时面临性能瓶颈。通过 TorchTPU 项目,谷歌计划投入更多战略资源,优化底层软件与 PyTorch 的匹配度。
此外,谷歌正考虑开源部分核心软件组件,以吸引更多开发者。据悉,谷歌还与 PyTorch 的主要维护方 Meta 展开了深度合作,探讨让 Meta 获取更多 TPU 资源的可能性。在硬件层面,谷歌最新发布的第七代 TPU v7(代号 Ironwood) 已针对推理场景进行了大幅优化。
通过 TorchTPU 补齐软件短板后,谷歌有望为企业提供一个更具性价比的英伟达替代方案,加速其 AI 基础设施的商业化进程。
via AI新闻资讯 (author: AI Base)
Mozilla新任CEO上任:AI功能将进Firefox,但“必须可关闭”
在AI重塑浏览器定义的关键时刻,Mozilla迎来新掌舵人——Anthony Enzor-DeMeo正式出任CEO,接替临时CEO劳拉·钱伯斯(Laura Chambers)。这位前Firefox业务总经理的升任,标志着这家以隐私和开放网络为使命的组织,正试图在AI浪潮中走出一条“不妥协”的第三条路。
当前,浏览器市场正经历十年未有之变局。传统三巨头——Chrome、Safari与Firefox——正面临来自Perplexity、Arc、Opera乃至OpenAI的强势挑战。这些新玩家将大模型、智能代理深度集成至浏览体验,试图把浏览器从“信息入口”转变为“AI原生操作系统”。Mozilla显然已意识到,若不迎头赶上,恐将被彻底边缘化。
Enzor-DeMeo在就任声明中明确表示:Mozilla将投资AI,并为Firefox添加AI功能。但他同时强调,这些功能必须是可选的、可关闭的。“AI应该始终是一种选择——用户能轻松关闭它。人们应清楚某项功能为何如此工作,以及自己从中获得了什么价值。”这一立场直指当前AI原生浏览器的隐忧:黑箱推理、数据收集不透明、强制体验。
此举也回应了Firefox核心用户群体的焦虑。多年来,许多用户选择Firefox,正是因为其不捆绑AI、不追踪行为、不推送算法内容。Mozilla若贸然全盘AI化,恐将失去最后的差异化优势。如今,“AI可选”既是对市场趋势的顺应,也是对用户信任的守护。
除了产品策略,Mozilla也在加速商业模式转型。目前,公司超80%收入依赖与谷歌的默认搜索协议。为降低单一收入风险,Mozilla正拓展产品矩阵:除主力浏览器外,还运营Thunderbird邮件客户端,并去年推出了面向中小企业的AI建站工具。Enzor-DeMeo称,目标是将Firefox发展为“一个更广泛的可信软件生态系统”。
过去几年,Mozilla历经阵痛: 2023 年裁员30%,大幅收缩全球倡导项目,聚焦核心技术。如今,在新CEO带领下,这家非营利与商业双轨并行的机构,正试图证明:隐私与AI并非对立,开放网络与智能体验可以共存。
在AI浏览器军备竞赛中,Mozilla或许无法以技术炫技取胜,但它正押注于另一张王牌——用户信任。而这场赌注的成败,将决定开放网络的未来是否还有容身之地。
via AI新闻资讯 (author: AI Base)
在AI重塑浏览器定义的关键时刻,Mozilla迎来新掌舵人——Anthony Enzor-DeMeo正式出任CEO,接替临时CEO劳拉·钱伯斯(Laura Chambers)。这位前Firefox业务总经理的升任,标志着这家以隐私和开放网络为使命的组织,正试图在AI浪潮中走出一条“不妥协”的第三条路。
当前,浏览器市场正经历十年未有之变局。传统三巨头——Chrome、Safari与Firefox——正面临来自Perplexity、Arc、Opera乃至OpenAI的强势挑战。这些新玩家将大模型、智能代理深度集成至浏览体验,试图把浏览器从“信息入口”转变为“AI原生操作系统”。Mozilla显然已意识到,若不迎头赶上,恐将被彻底边缘化。
Enzor-DeMeo在就任声明中明确表示:Mozilla将投资AI,并为Firefox添加AI功能。但他同时强调,这些功能必须是可选的、可关闭的。“AI应该始终是一种选择——用户能轻松关闭它。人们应清楚某项功能为何如此工作,以及自己从中获得了什么价值。”这一立场直指当前AI原生浏览器的隐忧:黑箱推理、数据收集不透明、强制体验。
此举也回应了Firefox核心用户群体的焦虑。多年来,许多用户选择Firefox,正是因为其不捆绑AI、不追踪行为、不推送算法内容。Mozilla若贸然全盘AI化,恐将失去最后的差异化优势。如今,“AI可选”既是对市场趋势的顺应,也是对用户信任的守护。
除了产品策略,Mozilla也在加速商业模式转型。目前,公司超80%收入依赖与谷歌的默认搜索协议。为降低单一收入风险,Mozilla正拓展产品矩阵:除主力浏览器外,还运营Thunderbird邮件客户端,并去年推出了面向中小企业的AI建站工具。Enzor-DeMeo称,目标是将Firefox发展为“一个更广泛的可信软件生态系统”。
过去几年,Mozilla历经阵痛: 2023 年裁员30%,大幅收缩全球倡导项目,聚焦核心技术。如今,在新CEO带领下,这家非营利与商业双轨并行的机构,正试图证明:隐私与AI并非对立,开放网络与智能体验可以共存。
在AI浏览器军备竞赛中,Mozilla或许无法以技术炫技取胜,但它正押注于另一张王牌——用户信任。而这场赌注的成败,将决定开放网络的未来是否还有容身之地。
via AI新闻资讯 (author: AI Base)
↩️ 千问APP接入阿里生态场景
千问APP接入阿里生态场景
阿里千问APP开始接入第一个阿里生态场景——高德,开始具备物理世界理解与行动能力。通过系统级对接,千问APP不再只是生成一段文字建议,而是能够调用高德地图、扫街榜等底层服务,即时生成包含推荐餐厅、酒店、地理位置及出行方案的可视化决策卡片。这仅是开端,阿里旗下的消费、支付等核心业务场景未来将陆续接入,加速构建现实世界服务履约网络。
DoNews
🍀在花频道 🍵茶馆 📮投稿新鲜事
via 科技圈🎗在花频道📮 - Telegram Channel
科技圈🎗在花频道📮:
阿里旗下"通义"APP 正式更名为"千问" 阿里巴巴旗下"通义"APP 今日在苹果和安卓应用商店发布更新,正式更名为"千问"APP。此次升级版本号直接从 3.x 跳跃至 5.0.0,阿里将其视为重大更新。更新后的千问 APP 界面布局与 ChatGPT 相似,内部 UI 已全面将"通义"替换为"千问"。 据了解,阿里此次动作不仅限于本土市场,千问 APP 海外版目前也在同步开发中。根据 AI 产品榜单数据显示,同为阿里旗下 AI 助手的夸克 APP 在 10 月的日活数据已被字节跳动旗下的豆包 APP…
千问APP接入阿里生态场景
阿里千问APP开始接入第一个阿里生态场景——高德,开始具备物理世界理解与行动能力。通过系统级对接,千问APP不再只是生成一段文字建议,而是能够调用高德地图、扫街榜等底层服务,即时生成包含推荐餐厅、酒店、地理位置及出行方案的可视化决策卡片。这仅是开端,阿里旗下的消费、支付等核心业务场景未来将陆续接入,加速构建现实世界服务履约网络。
DoNews
🍀在花频道 🍵茶馆 📮投稿新鲜事
via 科技圈🎗在花频道📮 - Telegram Channel
#Tip #Gemini
Gemini 3 Flash 在极低 API 价格(每百万 Token 输入/输出:0.5/3 USD)的前提下宣称和当前的 SOTA 模型在多个基准测试中性能接近,且在部分基准测试中达到了 SOTA 水平。
这意味着该模型可能是目前性能/价格比最高的模型。
via AI Copilot - Telegram Channel
Gemini 3 Flash 在极低 API 价格(每百万 Token 输入/输出:0.5/3 USD)的前提下宣称和当前的 SOTA 模型在多个基准测试中性能接近,且在部分基准测试中达到了 SOTA 水平。
这意味着该模型可能是目前性能/价格比最高的模型。
via AI Copilot - Telegram Channel