2026中国AI大模型平台排行榜 | 2月

2026-03-05

作者|参商 西梅汁

编辑|星奈

媒体|AI大模型工场



国内大模型发展趋势|2月份解读


OpenClaw 成香饽饽,云服务厂商扎堆OpenClaw 一键部署,慢者无羹?


二月的AI圈,OpenClaw无疑是最炙手可热的明星。

这个开源的智能体框架在20天内完成了超过10次更新,其Token使用量一度飙升至OpenRouter平台总量的约13% 。它之所以如此炙手可热,关键在于它重新定义了人机交互的方式,从“对话”到“执行”。OpenClaw让大模型不再是只能聊天的“百科全书”,而是能直接操作电脑桌面、调用各类工具,甚至拆解复杂任务的“数字员工” 。

面对这股洪流,国内头部玩家不约而同地选择了“为我所用”,通过云服务将OpenClaw打包成一键部署的“开箱即用”产品。百度智能云率先出招,在二月上旬接连推出OpenClaw一键部署服务和移动端的“红手指Operator”,让用户能在云手机上直接激活AI的自主能力。

紧随其后,月之暗面推出了Kimi Claw,将其与自家最强的K2.5模型深度绑定,会员用户无需任何硬件和代码即可在网页端享受7x24小时不间断的智能体服务 。而MiniMax则上线了MaxClaw,直接集成在Agent网页端,不仅省去了服务器和API Key,还预置了诸多专家技能 。这种“云端托管”的模式,精准击中了原生OpenClaw部署门槛高、安全风险大的痛点,将原本属于极客圈子的玩具,变成了亿级用户都能触及的服务。

更深层次来看,云厂商们如此急切地“抢滩登陆”,实则是在进行一场关于未来生态主导权的卡位战。OpenClaw本身只是一个框架,其“大脑”依然需要调用各大厂的模型API。当百度、阿里、月之暗面、MiniMax纷纷推出自己的“一键部署”版本时,它们争夺的不仅仅是用户,更是底层模型的调用份额。

Kimi K2.5在OpenClaw调用榜上登顶,以及智谱API套餐被抢空,都证明了OpenClaw是消耗Token的“超级大户”,是拉动云营收的强力引擎 。更重要的是,通过官方提供的深度集成工具(如MaxClaw中的云端储存、跨端协作),厂商得以将用户的数据、工作流甚至整个开发习惯都锁定在自己的生态内,完成了从“卖水人”到“筑城者”的身份转变。

然而,这场狂欢背后也潜藏着巨大的隐忧。OpenClaw本身的安全性堪称“噩梦”,一月份曾被爆出数百个漏洞,甚至有数以万计的公开实例毫无防护地暴露在公网上。赋予AI系统最高权限,意味着一旦出现幻觉或被恶意代码利用,后果将是灾难性的。

这或许也是云厂商必须亲自下场,而不能仅仅依赖开源社区的重要原因。它们通过云端的沙盒隔离、严格的权限控制和企业级的安全审计,为原本“狂野”的OpenClaw穿上了防护甲 。其实,只有解决了金融、政务等大客户最敏感的安全问题,OpenClaw才能真正从极客的“玩具”变成企业愿意买单的“工具”,而这也决定了这场“抢滩战”最终能走多远。


春节期间视频赛道“不打烊”,国产已实现全球领跑

过年期间,视频生成赛道同样热闹。国产模型用密集的技术迭代,把“领跑”从口号变成了结果。无论是榜单表现还是行业口碑,可灵、Vidu,以及字节新推出的 Seedance,都已经能与 Sora 正面竞争,甚至在部分维度实现反超。

据最新基准榜单,可灵 3.0 在文生视频排名中位列全球第一,背后是画面真实感、一致性和可控性的系统提升。其“All-in-One”架构本质上是一套统一的多模态输入输出框架,把文本、图像、声音和视频整合进同一个模型体系内,实现“脚本 → 分镜 → 生成 → 编辑”的闭环流程。相比以往工具链式拼接,这种端到端设计大幅压缩了制作环节,更接近工业级视频生产工具,而不单是创意玩具。

Vidu Q3 的突破点则在“音视频直出”和原生同步叙事能力。它可以在一次生成中输出带原生音频的长片段视频,并理解镜头调度、机位切换等导演级指令,让画面与声音天然同步、节奏连贯。相比早期视频模型偏重视觉生成、声音依赖后期拼接的模式,这种一体化叙事能力,让 AI 更接近真正的“自动化导演”。

当然,字节在这个月祭出的Seedance 2.0,无疑是给这场三国杀又添了一把最旺的火。它不仅能复现参考视频中的动作轨迹,还能还原表情细节、氛围调性甚至运镜节奏。给定一段真人舞蹈,生成的动画角色几乎可以做到动作、节奏高度一致,显著提升了视频生成的可控性和稳定性。叠加多模态指令融合能力,Seedance 2.0 更像一个可精细操控的创作引擎,而非随机灵感机器,也为抖音、剪映生态埋下了高阶创作工具的伏笔。

不过,从“娱乐创作”走向“影视工业级生产”,真正的难点已不在单帧质量,而在长周期一致性。连续剧或系列广告中,角色是否始终如一、场景是否稳定延续,仍是核心瓶颈。一旦人物在多集中“变脸”,沉浸感就会迅速崩塌。目前不少落地案例,本质仍是“主干靠 AI、关键细节人工修补”的混合模式。技术要真正嵌入工业流程,还需要在一致性控制、算力成本和标准化接口上继续突破。

正因为终点连接的是万亿级的影视、广告与短剧市场,视频大模型已成为大模型企业的必争之地。快手有可灵,生数有 Vidu,字节有 Seedance,多方围绕内容生产入口展开卡位。这场竞争,早已不只是参数规模的比拼,而是对下一代内容基础设施的争夺。


阿里百度腾讯集体烧钱:大模型的C 端流量密码,藏在全民级营销里

国内大模型战场上演了一场前所未有的“春节红包大战”。阿里千问拿出30亿“请客免单”,百度文心助手发放5亿红包,腾讯元宝则派发10亿现金,加上字节豆包等其他玩家,行业总投入超过80亿元,直接将AI应用推向了全民视野。

相比传统广告,这种打法效率更高的核心在于“使用即认知”。广告只能传递概念,而红包机制强制用户完成一次交互:下载 App、打开入口、和 AI 对话、触发功能。用户不是被动观看,而是主动操作。以千问的“免单”玩法为例,点奶茶、下单推荐本身就是一条完整的 AI 服务链路;文心一言借春晚红包绑定春联生成、祝福创作;腾讯元宝则把红包嵌入 AI 社交和群聊互动。营销不再是流量导入,而是功能演示,用户在参与活动的过程中理解了模型能做什么。

更重要的是,这种全民级营销在为大模型寻找真正的 C 端“刚需场景”。点奶茶、写春联、生成祝福语,看似轻量,却都指向高频决策和表达需求,吃什么、买什么、怎么说。C 端用户未必关心模型参数,但一定关心“帮我省钱”“帮我表达”“帮我做选择”。从工具属性看,大模型在消费决策助手、内容表达辅助、社交润滑剂这三个方向最接近刚需,而不是抽象的“智能对话”。

从商业逻辑看,红包和免单也是一次成本可控的用户筛选。相比投放传统广告获得的泛流量,通过互动活动沉淀下来的,是完成过实际调用、留下行为数据的真实用户。这为后续会员订阅、API 付费、生态转化打下基础。大模型竞争进入下半场,比拼的已不只是模型能力,而是谁能率先占据用户心智和使用习惯。

2 月的这轮“烧钱”,本质不是简单的补贴大战,而是一次入口争夺战。当模型能力逐渐同质化,C 端流量就成为决定性变量。谁能把 AI 嵌入到春节这样全民参与的场景中,谁就更有机会把大模型从技术产品,变成日常生活的默认工具。


国内大模型动态

阿里

2月阿里AI动作密集:开源多款高效模型与Agent工具,千问APP借30亿春节营销爆火,同时进军AI硬件赛道,首款眼镜即将亮相;叠加企业服务调用量占比翻倍,呈现"技术开源+硬件破圈+场景落地"的全面加速态势。

2月28日,阿里开源桌面Agent工具CoPaw,用户不仅可以一键在本地和云端部署,还可基于CoPaw进行二次开发,自由接入本地模型、编写Skills和接入专属消息应用,满足更定制化的场景需求。基于内置的丰富Skills,CoPaw可帮助用户实现社交平台内容摘要整理、资讯查询和总结、桌面整理等任务。

2月27日,阿里巴巴旗下个人AI助手“千问"正式进军AI硬件领域,今年将面向全球市场推出多款不同形态的AI硬件产品。千问将在西班牙巴塞罗那举行的2026年世界移动通信大会(MWC)上发布首款同名AI眼镜,并于3月2日开启线上线下全渠道预约。

据阿里内部人士透露,除AI眼镜之外,千问还会在年内陆续发布AI指环、AI耳机等产品,并面向全球市场发售。

2月25日,阿里云百炼推出包含Qwen3.5,GLM-5、MiniMax M2.5、Kimi K2.5四大开源模型API服务的CodingPlan。用户订阅套餐后不再受限于单一模型,可实现多模型自由切换,享受更稳定、Tokens额度更高的模型服务。目前,全球云厂商中仅阿里云提供这一服务。

2月24日,2026年2月,国际市场调研机构沙利文(Frost&Sullivan)发布《中国GenAI市场洞察:企业级大模型调用全景研究,2025H2》。

报告显示,2025年下半年,中国企业级大模型日均调用量飙升至37.0万亿tokens,较上半年的10.2万亿增长263%。头部大模型占比均有提升,其中,阿里云千问(Qwen)增幅最多,占比跃升至32.1%,相较上半年的17.7%几乎翻倍,领先优势扩大,成为最受中国企业青睐的大模型。

2月16日,阿里正式开源千问Qwen 3.5-Plus系列模型。该模型采用MoE架构,总参数3970亿但仅激活170亿,部署显存占用降低60%,最大推理吞吐量提升19倍,API调用价低至0.8元/百万token。

此外,chat.qwen.ai页面低调上线了Qwen3.5-Plus和Qwen3.5-397B-A17B两款新模型。Qwen3.5-Plus定位为Qwen3.5系列最新大语言模型,Qwen3.5-397B-A17B定位则是Qwen3.5开源系列旗舰大语言模型。两款模型均支持文本和多模态任务。

2月12日,阿里宣布加大对淘宝闪购业务的投入,计划三年内不考核盈利,聚焦即时零售细分品类,2026年投入规模将超2025年。该业务已与千问AI深度协同。

2月10日,阿里通义千问正式发布新一代视觉大模型Qwen-Image-2.0,在文生图评测中表现优异,支持生成专业PPT及信息图,并实现文生图与图编辑功能的深度融合,可生成2K分辨率高质感图像。

同日,阿里巴巴达摩院发布物理AI模型RynnBrain并开源全系列模型,该模型基于Qwen3-VL训练,参数量从20亿起,聚焦机器人时空记忆与推理能力,在基准评测中超越Google Gemini Robotics-ER 1.5和Nvidia Cosmos-Reason2。

2月5日,阿里千问APP“春节30亿大免单”正式上线,发起奶茶攻势,请全国人民用AI一句话免费点奶茶。用户火爆参与,活动上线不到3小时,用千问APP下单超100万单奶茶。

活动期间,每个人可以领取21张无门槛的25元免单卡,相当于525元钱,还有机会抽取价值10000元的千问AI生活卡。活动页面还显示,第二波福利将于2月13日开启,用户可领取现金红包,最高可得2888元。

2月4日,,阿里开源了一款小型混合专家模型Qwen3-Coder-Next,专为编程智能体(Agent)和本地开发打造。该模型总参数80B,激活参数仅3B,在权威基准SWE-Bench Verified上实现了超70%的问题解决率,性能媲美激活参数规模大10-20倍的稠密模型。

Qwen3-Coder-Next在实际开发中能理解需求、编写代码,还能与环境交互、完成任务,可以在没有人工干预的情况下生成可玩的网页游戏,部署服务并自动测试。

2月3日,继官宣投入30亿启动“春节请客计划”后,2月3日,千问APP宣布独家冠名东方卫视、浙江卫视、江苏卫视、河南卫视四大马年春节晚会,并以AI形式深度参演春晚节目。全国观众在观看这四台春晚节目时,还可同步在千问APP参与互动、抢大额红包。

2月2日,阿里巴巴旗下千问App宣布投入30亿元启动春节营销活动,联合淘宝闪购、飞猪、大麦、盒马、天猫超市、支付宝等生态业务发放现金红包及免单机会。活动上线9小时内订单量突破1000万笔,一度因流量过大导致系统短暂中断。

字节跳动

2月14日,字节跳动正式发布豆包大模型2.0全系列,同步推出Seed 2.0系列模型,完成AI全栈能力升级。其中,豆包大模型2.0包含Pro、Lite、Mini三款通用Agent模型及专属Code版,Pro版全面对标OpenAI的GPT 5.2和Gemini 3 Pro,在数学奥赛、编程竞赛等基准测试中表现优异;Code版深度适配字节TRAI AI编程环境,强化编码能力。

Seed 2.0系列则重点优化视觉与多模态理解、复杂指令执行能力,多款模型在行业基准测试中达到SOTA水平。同日,豆包2.0 Pro已在豆包App、PC端及网页版上线,火山引擎同步开放全系列API服务,助力企业与开发者快速接入。

2月13日,字节跳动接续发布图像创作模型Seedream 5.0 Lite版本,该版本首次引入“实时检索”能力,打破了传统图像生成模型的知识时效性局限,进一步完善了字节跳动多模态AI创作体系,与前一日推出的Seedance 2.0形成协同,覆盖图像、视频两大核心创作场景。

2月12日,豆包宣布,豆包视频生成模型Seedance 2.0正式接入豆包App、电脑端和网页版。Seedance 2.0模型支持原声音画同步、多镜头长叙事、多模态可控生成。目前,豆包Seedance2.0暂不支持上传真人图片作为主体参考。

2月6日,华中科技大学和字节跳动联合推出了 Stable-DiffCoder。这不仅仅是一个新的扩散代码模型,更是一次关于 「扩散训练能否提升模型能力上限」 的深度探索。

Stable-DiffCoder 在完全复用 Seed-Coder 架构、数据的条件下,通过引入 Block Diffusion 持续预训练(CPT)及一系列稳定性优化策略,成功实现了性能反超。在 多个 Code 主流榜单上(如 MBPP,BigCodeBench 等),它不仅击败了其 AR 原型,更在 8B 规模下超越了 Qwen2.5-Coder ,Qwen3,DeepSeek-Coder 等一众强力开源模型,证明了扩散训练范式本身就是一种强大的数据增强手段。

腾讯

2月18日,腾讯宣布旗下战略级AI原生产品元宝的日活跃用户(DAU)超5000万,月活跃用户(MAU)已达1.14亿。此前一天,腾讯发布的元宝分10亿元现金红包活动报告显示,元宝春节主会场累计抽奖次数超36亿次,用户通过“创作”栏完成AI任务超10亿次。

2月10日 ,腾讯混元团队正式发布HY-1.8B-2Bit端侧大模型,这是业内首个面向产业场景的2Bit量化端侧大模型。该模型基于混元团队首创的产业级2Bit端侧量化方案,通过对此前混元的小尺寸语言模型——HY-1.8B-Instruct进行2比特量化感知训练(QAT)产出,对比原始精度模型等效参数量降低了6倍,在沿用原模型全思考能力同时,在真实端侧设备上对比原始精度模型生成速度提升2—3倍,可大幅提升使用体验。

2月4日,腾讯首席AI科学家姚顺雨挂帅,带领混元团队与复旦大学联合发布CL-bench上下文学习基准,这也是姚顺雨入职腾讯后的首份重要研究成果。该基准的发布,不仅为AI上下文学习能力提供了统一评测标准,更契合姚顺雨提出的“AI下半场,评估大于训练”的理念,为腾讯AI融入社交、游戏等动态上下文场景奠定技术基础。

2月1日,腾讯旗下AI助手元宝,正式宣布“元宝派”公测上线,探索AI社交赛道。据悉,“元宝派”是腾讯全新的AI社交探索,用户可通过元宝App创建或加入一个“派”。在元宝派里,元宝AI作为派友,能够与用户聊天互动、协作与娱乐。除了内测已有的@元宝AI对话、P图二创和共享屏幕等能力。公测版本还打通了腾讯视频、QQ音乐内容生态,用户可以与派友一起听音乐、一起看电影,畅享QQ音乐海量曲库歌曲、腾讯视频VIP精选影片。

同日,腾讯元宝启动新春特别活动,总额达十亿元的现金红包全面开放领取,活动持续至2月17日,单个红包最高可达一万元,用户通过登录、完成任务、分享等方式抽奖,红包可直接提现至微信零钱。

百度

2月26日,百度发布2025年第四季度及全年财报,显示2025年总营收达1291亿元,Al业务营收达400亿元;四季度,百度总营收327亿元,AI业务收入占百度一般性业务收入的43%,超出市场预期。

2025年,AI云收入同比增长34%,AI应用全年收入突破100亿元,AI原生营销服务收入同比增长301%。12月,文心助手月活用户数达2.02亿;春节红包活动启动以来,文心助手月活跃用户同比增长4倍。同时,萝卜快跑四季度全球无人驾驶出行服务次数达340万,同比增长超200%,季度内每周出行次数峰值超30万。财报显示,截至2026年2月,萝卜快跑累计提供全球出行服务次数超2000万,足迹已覆盖全球26个城市。

2月14日,百度App正式接入OpenClaw智能体,用户可通过百度App一键调用该工具,标志着百度App打通"百度生态+本地个人助理"全链路。同期,百度优选官方电商Skill正式上架ClawHub,成为OpenClaw生态首个官方级电商能力插件。

2月10日,百度文心助手作为北京台春晚首席AI合作伙伴,联动百度App发放5亿元现金红包,推出AI春联、马年写真等近百种春节玩法。数据显示,截至2月10日文心助手MAU同比增长4倍,生图功能同比增长50倍,生视频功能同比增长40倍,打电话功能增长近5倍。

2月5日,百度智能云推出“移动版OpenClaw”——红手指Operator。这款基于百度全栈自研的ARM云服务和VLA(vision-language-action)多模态大模型打造的AI Agent,可以在移动端提供与OpenClaw在PC端类似的功能。用户通过云手机红手指Operator入口,即可激活移动设备的“自主能动性”。

据了解,红手指Operator是将AI大模型的决策能力与云手机提供的安全隔离、精准执行环境深度融合,能够支持理解用户意图、智能拆解和编排工作流,而且支持跨应用完成复杂协作任务。

2月3日,百度智能云上线OpenClaw一键部署服务,并开启限时免费体验活动。开发者可以通过百度智能云轻量应用服务器,快速部署这款智能体产品,并借助千帆平台一键接入文心、DeepSeek、Qwen等主流大模型。

MiniMax

2月,MiniMax发布M2.5模型,以10B激活参数量实现Agent场景高效推理,周调用量3.07T tokens登顶OpenRouter;同步升级Expert 2.0与MaxClaw,降低Agent使用门槛。

2月26日,Minimax官微发文介绍MiniMaxAgentExpert的功能升级,同步介绍MaxClaw。据介绍,在Expert2.0中进一步优化了专家Agent的创建体验。用户不需要考虑Skill、SubAgent、MCP的配置,以及提示词的结构编排,只需用自然语言。描述任务目标或能力需求,Agent会根据目标完成SOP梳理、工具编排与能力配置。

与Expert 2.0升级同步,Minimax上线MaxClaw,基于OpenClaw构建的云端AI助手,直接集成在Mini-MaxAgent网页端,为用户在云端部署并运行OpenClaw,无需自备服务器或API Key。

2月24日,数据显示,MiniMax M2.5模型发布一周内登顶OpenRouter调用量榜首,周调用量暴涨至3.07T tokens,超过Kimi K2.5、GLM-5与DeepSeek V3.2三家总和,同时带动100K至1M长文本区间的增量调用需求,该区间为Agent工作流的典型消耗场景。

此外,研究机构SemiAnalysis实测显示,M2.5在8张H200显卡上,每GPU每秒可稳定达到约2500个token的吞吐量,商用定价具高性价比。

2月23日,港股恒生科技指数大涨3.34%,但大模型板块逆势回调,MiniMax股价单日跌幅达13.35%,此前三天内,MiniMax与智谱从双双突破3000亿港元市值的高位,合计蒸发近千亿港元,市场分析认为此次回调与AI行业整体估值波动及企业亏损现状相关。

2月13日,MiniMax发布新一代模型M2.5,该模型在编程、工具调用及长文本处理等场景表现突出,发布后12小时内登顶OpenRouter热度榜,一周内以3.07T tokens的周调用量位列榜首,超过Kimi K2.5、GLM-5与DeepSeek V3.2三家的总和。

2月12日,AI领域迎来技术爆发与产业落地双热潮,国产大模型智谱GLM-5、MiniMax M2.5等实现关键突破并登顶开源榜单,具身智能、AI视频生成、长上下文处理技术取得重大进展,全球科技企业密集推新开源,资本持续涌入具身智能、AI视频等赛道,同时AI安全、伦理问题凸显,行业迎来从技术研发到产业深度融合的转型,AI对就业、商业、各传统产业的变革影响进一步深化。

2月11日,MiniMax新一代文本模型M2.5在海外Agent产品启动内测,定位为"全球首个为Agent场景原生设计的生产级模型",激活参数量仅10B,主打编程与智能体工作流能力,对标Claude Opus 4.6。

月之暗面

2月25日,Kimi 旗下 K2.5 大模型发布不到一个月,Kimi 近 20 天累计收入已超过 2025 年全年总收入,增长主要受全球付费用户及 API 调用量大涨共同推动,其中海外付费用户数快速增长,OpenRouter 数据显示,Kimi K2.5 调用量持续保持领先。

在连续融资超 12 亿美元后,Kimi 最新估值达到 100-120 亿美元,创下国内公司从成立到晋级十角兽企业(估值超 100 亿美元)的最快成长速度。Kimi 创始人杨植麟此前曾在全员信中表示,「融资金额超过绝大部分 IPO 募资及上市公司的定向增发,还可以从一级市场募集更大量资金。」

2月17日,月之暗面宣布完成新一轮超7亿美元融资,本轮由阿里巴巴、腾讯、五源资本、九安医疗等老股东联合领投。这是公司在2026年开年不到两个月内启动的第二轮融资,估值水平呈现阶梯式跃升,正式迈入100-120亿美元估值区间,成为国内非上市大模型企业中估值最高的头部玩家之一。

此外,在完成超7亿美元C+轮融资交割的同时,月之暗面宣布新一轮100-120亿美元估值的融资已经启动。从2023年6月天使轮3亿美元估值,到2026年2月突破100亿美元,月之暗面在不到三年时间里估值暴涨超30倍,创下国内AI创业企业估值增长最快纪录。

2月16日,月之暗面正式上线核心产品Kimi Claw Beta测试版,提供云端原生集成,支持一键部署或关联设置好的OpenClaw。该功能支持ClawHub 5000+社区插件,涵盖开发与代码类、浏览器相关、办公工作流、专家角色等多个类别,可远程操控电脑执行任务,降低全球AI Agent技术落地门槛。

科大讯飞

2月11日,科大讯飞基于全国产算力训练的星火X2大模型正式发布。星火X2通用能力实现提升,在其公布的数学、推理、语言理解、智能体等能力测评上可以媲美GPT-5.2、Gemini-3-Pro等模型。星火X1.5于2025年11月6日发布,仅三个月后星火系列新旗舰模型就上线了。

蚂蚁集团

2月23日,蚂蚁集团披露春节假期AI业务实战数据,核心AI产品实现重大突破。其中,支付宝“AI付”用户数突破1亿,单周支付笔数超1.2亿笔,成为全球首个用户规模与交易笔数双破亿的AI原生支付产品,标志着AI支付正式进入规模化、普惠化阶段,其覆盖买菜、餐饮、优惠核销等高频民生场景,平均5-8秒即可完成支付,兼顾便捷性与安全性。

同时,蚂蚁阿福APP总用户数也突破1亿,成为全球第一大健康AI App,春节新增用户中52%来自三线及以下城市,连续多日登顶苹果App Store应用下载总榜,依托AI技术提供基础医疗咨询、慢病管理等服务。

据悉,两大产品的爆发得益于蚂蚁集团在AGI领域的持续布局,其近期还开源了百灵大模型2.5版及多款具身智能模型,形成从基础模型到应用场景的完整支撑,践行“用AI守护用户财富与健康”的“两朵花”AI战略。

2月13日-2月16日,蚂蚁集团inclusionAI团队期间发布百灵大模型家族新一代开源万亿参数模型Ling-2.5-1T(即时模型)与Ring-2.5-1T(思考模型)。这两款模型并非仅靠“堆参数”取胜,它们共享的技术底座——混合线性注意力架构“Ling 2.5”,才是此次发布的关键。在当前主流大模型仍以改进型传统注意力机制为核心架构的背景下,Ling-2.5-1T是业内少见的超大型混合线性注意力架构模型,而Ring-2.5-1T成为了全球首个混合线性注意力架构的万亿参数思考模型。

2月11日,蚂蚁集团正式开源发布全模态大模型Ming-Flash-Omni 2.0,该模型基于Ling-2.0 MoE架构训练,核心突破在于实现音频生成“一轨三音”,可在同一音轨实时合成语音、环境音效与背景音乐,支持自然语言调控音色、方言、情绪等20余项参数。其推理帧率低至3.1Hz,可生成分钟级高保真音频,相较于传统方案,端到端架构将开发效率提升40%、成本降低60%,能广泛应用于影视配音、游戏音效、有声书等场景,进一步完善蚂蚁AI开源生态矩阵。

2月2日,蚂蚁通用AI助手灵光宣布对其核心功能“闪应用”进行全面升级,正式推出“上传图片生应用”与“桌面小组件”两大全新能力,并集成音效合成、大语言模型(LLM)调用、日历服务、多模态理解、文本朗读、持久化存储、陀螺仪、震动反馈等近20项API工具。升级后,用户不仅能高效创建个性化小工具,所生成的应用更具备实时反馈与沉浸式的视听触觉交互体验,实用性与趣味性同步跃升。

智谱 AI

2月23日,智谱AI正式发布GLM-5技术报告,全面公开其技术细节,正面回应行业相关质疑。该模型参数规模达7440亿,在编程能力上实现对Claude Opus 4.5的对齐,全球权威Artificial Analysis榜单中位居全球第四、开源第一,同时宣布上调GLM Coding Plan套餐价格,中国区涨价30%,海外版涨价超100%,成为国内首家对大模型商业化服务提价的AI原生企业。

2月21日,智谱发布《GLM Coding Plan致歉信》,承认GLM-5发布后运营中犯下三项错误:规则透明度不足、GLM-5灰度节奏过慢、老用户升级机制设计粗糙;针对受影响的Lite与Pro用户,公司支持自主申请退款,退款范围覆盖2026年1月1日至2月21日期间全部消费,遵循"智谱全部请客"原则。

2月20日,智谱股价迎来大幅上涨,单日涨幅达42.72%,报725港元/股,股价再创新高,总市值达3232亿港元,上市43天股价累计涨幅已超500%,市场对国产大模型技术价值的认可度持续提升。

2月12日,GLM-5正式开源上线并同步登陆chat.z.ai平台,首次集成DeepSeek Sparse Attention稀疏注意力机制,在维持长文本理解无损的前提下显著提升Token效率;同日智谱宣布对GLM Coding Plan套餐价格进行结构性调整,整体涨幅自30%起,取消首购优惠,已订阅用户价格保持不变,生效时间为当日。

2月11日,智谱发布新一代旗舰模型GLM-5。在Coding与Agent能力上,GLM-5取得开源SOTA表现,在真实编程场景的使用体感逼近Claude Opus 4.5,擅长复杂系统工程与长程Agent任务。此前,在OpenRouter市场上发布的开源模型Pony Alpha,实际上是智谱的新模型GLM-5。Pony Alpha引发了智谱近日的股价上涨,2月9日单日涨幅达到36.22%。

2月3日,智谱AI上线GLM-OCR图文解析模型,采用自研CogViT与GLM-0.5B编码器-解码器架构,基于数十亿图文对CLIP预训练,在手写体、表格、印章、竖排等复杂场景中实现高效视觉语义提取与关键Token识别。

整体来看,2月智谱AI以GLM-5发布为核心节点,同步推进技术开源、价格策略调整、算力生态共建与用户沟通优化,在技术影响力、资本市场表现与商业化探索三方面形成共振,但也在高负载运营与用户权益保障方面经历挑战。

阶跃星辰

2月27日,AI独角兽公司阶跃星辰正在进行新一轮Pre-IPO融资,本轮融资分两拨交割,第一拨投前估值约40亿美元,计划融资20亿-30亿元人民币,目前已经确定由一家运营商领投,金额约12亿元人民币,其他老股东跟投,计划在3月6日前完成;第二拨投前估值50亿-60亿美元,计划在4月中下旬交割。此外,据悉,阶跃星辰计划在今年6月30日前,在港股交表,预期基石定价在100亿美元左右,预计今年年底完成上市。

2月25日,外媒彭博社援引知情人士报道,上海大模型明星创企阶跃星辰正考虑在港交所IPO,计划筹集约5亿美元(约合人民币34亿元)。知情人士称,阶跃星辰已与潜在顾问就股权出售事宜进行磋商,最早可能在今年上市,其发行规模和上市时间等细节可能有所变化。阶跃星辰暂未回应IPO相关消息。

2月2日,阶跃星辰正式发布并开源新一代Agent基座模型Step 3.5 Flash,这是印奇出任董事长后公司的首个重大技术动作。该模型采用稀疏MoE架构,总参数量1960亿(每token激活110亿),支持256K超长上下文,单请求代码类任务推理速度最高达350 TPS(每秒生成词元数)。在数学推理、编码能力和Agent场景测试中,性能逼近主流闭源模型。该模型已通过OpenRouter限免开放,并支持个人工作站本地部署。

Step 3.5 Flash发布当日,华为昇腾、沐曦股份、壁仞科技、燧原科技、天数智芯、阿里平头哥等国产芯片厂商宣布已完成对该模型的适配。燧原科技L600芯片成为国内首批适配该模型的国产算力,标志着国产AI芯片与开源大模型的协同生态进一步成熟。

生数科技

2月5日,生数科技宣布完成超过6亿元人民币A+轮融资。本轮融资由中关村科学城公司和星连资本领投,上市公司万兴科技、视觉中国、拓尔思进行战略投资,原有股东启明创投、北京市人工智能产业投资基金、卓源亚洲、建发新兴投资、淮海投资等投资人加码跟投。

据悉,生数科技成立于2023年3月,2024年4月在中关村论坛上发布中国首个全面对标Sora的文生视频大模型Vidu,随后于2024年7月全球上线Vidu,在文生视频和图生视频的模型能力外,Vidu全球首创“参考生视频”技术,率先解决了商业级视频需求中的多主体连续一致性难题,此后连续发布Vidu Q1、Vidu Q2和Vidu Q3版本。

同日,万兴科技宣布斥资数千万元战略投资生数科技,双方在深圳签署战略合作协议,共建"大模型+工具+场景"的AI漫剧工业化生产新范式

1月30日,生数科技发布了Vidu Q3模型,是一个主要面向专业级影视制作场景的视频生成模型。Vidu Q3在国际权威AI基准测试机构Artificial Analysis最新公布的榜单中,Vidu Q3排名中国第一、全球第二,仅次于xAI的Grok视频生成模型,超越Runway Gen-4.5 、Google Veo3.1和OpenAI Sora 2。功能方面,Vidu Q3支持了16s声画同出、1080P画质、丰富的镜头语言、精准切镜、多国文字渲染和多语言输出。

快手

2月26日,全球知名AI基准测试机构Artificial Analysis近日发布最新的全球视频生成大模型榜单,可灵3.0系列模型(Kling3.0 Pro)以1240的Arena ELO基准测试评分位居文生视频赛道第一位,在前15名中可灵共有7个模型在榜。

据介绍,此前发布的可灵3.0模型在视频真实感、一致性和可控性上具备行业领先优势,意味着AI正式进入影视工业级视觉生产的核心环节。

2月5日,可灵AI正式全球上线3.0系列模型,目前正面向黑金会员开放使用,预计将于近期全量上线。此次发布的可灵视频3.0、可灵视频3.0 Omni及可灵图片3.0、可灵图片3.0 Omni模型,覆盖图片生成、视频生成、编辑及后期等影视级全流程链路。

可灵3.0系列模型基于All-in-One产品和技术理念构建,形成一个多模态输入与输出高度统一的一体化视频模型体系。它并非将功能简单叠加,而是通过统一架构,将影像创作中的理解、生成与编辑整合为一个连续流程,让创作首次在单一模型内完成闭环。

昆仑万维

2 月 27 日,Skywork AI 正式发布多模态视频基础模型 SkyReels V4——全球首个同时支持多模态输入、联合音视频生成、统一生成/修复/编辑任务的视频基础模型。

该模型以双流多模态扩散 Transformer(MMDiT)为核心架构,实现了 1080p 分辨率、32 FPS 帧率、15 秒时长的影院级音视频同步生成,为专业创作者与普通用户提供了高效、精准、一体化的视频创作解决方案。在 Artificial Analysis 基准测试中,SkyReels V4 模型排名全球第二,超越Google Veo 3.1、OpenAI Sora 2、Wan 2.6等主流模型。

2月4日,昆仑天工面向全球正式发布「天工Skywork桌面版」,即桌面端应用Skywork Desktop。「天工Skywork桌面版」直接在本地执行任务,无需上传文件到云端。它可以直接读取电脑上的海量文件,进行汇总、整理,并基于内容生成新产物。同时,它以“内容理解”为核心,而非“文件格式”:无论是图片、视频、表格、PPT 还是各类文档文件,都能在统一语义层下被理解、归类、执行任务,且支持多任务并行。


分享