AI大模型工场

搜索

2026中国AI大模型平台排行榜 | 2月

2026-03-05

作者｜参商西梅汁

编辑｜星奈

媒体｜AI大模型工场

国内大模型发展趋势|2月份解读

OpenClaw 成香饽饽，云服务厂商扎堆OpenClaw 一键部署，慢者无羹？

二月的AI圈，OpenClaw无疑是最炙手可热的明星。

这个开源的智能体框架在20天内完成了超过10次更新，其Token使用量一度飙升至OpenRouter平台总量的约13% 。它之所以如此炙手可热，关键在于它重新定义了人机交互的方式，从“对话”到“执行”。OpenClaw让大模型不再是只能聊天的“百科全书”，而是能直接操作电脑桌面、调用各类工具，甚至拆解复杂任务的“数字员工” 。

面对这股洪流，国内头部玩家不约而同地选择了“为我所用”，通过云服务将OpenClaw打包成一键部署的“开箱即用”产品。百度智能云率先出招，在二月上旬接连推出OpenClaw一键部署服务和移动端的“红手指Operator”，让用户能在云手机上直接激活AI的自主能力。

紧随其后，月之暗面推出了Kimi Claw，将其与自家最强的K2.5模型深度绑定，会员用户无需任何硬件和代码即可在网页端享受7x24小时不间断的智能体服务。而MiniMax则上线了MaxClaw，直接集成在Agent网页端，不仅省去了服务器和API Key，还预置了诸多专家技能。这种“云端托管”的模式，精准击中了原生OpenClaw部署门槛高、安全风险大的痛点，将原本属于极客圈子的玩具，变成了亿级用户都能触及的服务。

更深层次来看，云厂商们如此急切地“抢滩登陆”，实则是在进行一场关于未来生态主导权的卡位战。OpenClaw本身只是一个框架，其“大脑”依然需要调用各大厂的模型API。当百度、阿里、月之暗面、MiniMax纷纷推出自己的“一键部署”版本时，它们争夺的不仅仅是用户，更是底层模型的调用份额。

Kimi K2.5在OpenClaw调用榜上登顶，以及智谱API套餐被抢空，都证明了OpenClaw是消耗Token的“超级大户”，是拉动云营收的强力引擎。更重要的是，通过官方提供的深度集成工具（如MaxClaw中的云端储存、跨端协作），厂商得以将用户的数据、工作流甚至整个开发习惯都锁定在自己的生态内，完成了从“卖水人”到“筑城者”的身份转变。

然而，这场狂欢背后也潜藏着巨大的隐忧。OpenClaw本身的安全性堪称“噩梦”，一月份曾被爆出数百个漏洞，甚至有数以万计的公开实例毫无防护地暴露在公网上。赋予AI系统最高权限，意味着一旦出现幻觉或被恶意代码利用，后果将是灾难性的。

这或许也是云厂商必须亲自下场，而不能仅仅依赖开源社区的重要原因。它们通过云端的沙盒隔离、严格的权限控制和企业级的安全审计，为原本“狂野”的OpenClaw穿上了防护甲。其实，只有解决了金融、政务等大客户最敏感的安全问题，OpenClaw才能真正从极客的“玩具”变成企业愿意买单的“工具”，而这也决定了这场“抢滩战”最终能走多远。

春节期间视频赛道“不打烊”，国产已实现全球领跑

过年期间，视频生成赛道同样热闹。国产模型用密集的技术迭代，把“领跑”从口号变成了结果。无论是榜单表现还是行业口碑，可灵、Vidu，以及字节新推出的 Seedance，都已经能与 Sora 正面竞争，甚至在部分维度实现反超。

据最新基准榜单，可灵 3.0 在文生视频排名中位列全球第一，背后是画面真实感、一致性和可控性的系统提升。其“All-in-One”架构本质上是一套统一的多模态输入输出框架，把文本、图像、声音和视频整合进同一个模型体系内，实现“脚本 → 分镜 → 生成 → 编辑”的闭环流程。相比以往工具链式拼接，这种端到端设计大幅压缩了制作环节，更接近工业级视频生产工具，而不单是创意玩具。

Vidu Q3 的突破点则在“音视频直出”和原生同步叙事能力。它可以在一次生成中输出带原生音频的长片段视频，并理解镜头调度、机位切换等导演级指令，让画面与声音天然同步、节奏连贯。相比早期视频模型偏重视觉生成、声音依赖后期拼接的模式，这种一体化叙事能力，让 AI 更接近真正的“自动化导演”。

当然，字节在这个月祭出的Seedance 2.0，无疑是给这场三国杀又添了一把最旺的火。它不仅能复现参考视频中的动作轨迹，还能还原表情细节、氛围调性甚至运镜节奏。给定一段真人舞蹈，生成的动画角色几乎可以做到动作、节奏高度一致，显著提升了视频生成的可控性和稳定性。叠加多模态指令融合能力，Seedance 2.0 更像一个可精细操控的创作引擎，而非随机灵感机器，也为抖音、剪映生态埋下了高阶创作工具的伏笔。

不过，从“娱乐创作”走向“影视工业级生产”，真正的难点已不在单帧质量，而在长周期一致性。连续剧或系列广告中，角色是否始终如一、场景是否稳定延续，仍是核心瓶颈。一旦人物在多集中“变脸”，沉浸感就会迅速崩塌。目前不少落地案例，本质仍是“主干靠 AI、关键细节人工修补”的混合模式。技术要真正嵌入工业流程，还需要在一致性控制、算力成本和标准化接口上继续突破。

正因为终点连接的是万亿级的影视、广告与短剧市场，视频大模型已成为大模型企业的必争之地。快手有可灵，生数有 Vidu，字节有 Seedance，多方围绕内容生产入口展开卡位。这场竞争，早已不只是参数规模的比拼，而是对下一代内容基础设施的争夺。

阿里百度腾讯集体烧钱：大模型的C 端流量密码，藏在全民级营销里

国内大模型战场上演了一场前所未有的“春节红包大战”。阿里千问拿出30亿“请客免单”，百度文心助手发放5亿红包，腾讯元宝则派发10亿现金，加上字节豆包等其他玩家，行业总投入超过80亿元，直接将AI应用推向了全民视野。

相比传统广告，这种打法效率更高的核心在于“使用即认知”。广告只能传递概念，而红包机制强制用户完成一次交互：下载 App、打开入口、和 AI 对话、触发功能。用户不是被动观看，而是主动操作。以千问的“免单”玩法为例，点奶茶、下单推荐本身就是一条完整的 AI 服务链路；文心一言借春晚红包绑定春联生成、祝福创作；腾讯元宝则把红包嵌入 AI 社交和群聊互动。营销不再是流量导入，而是功能演示，用户在参与活动的过程中理解了模型能做什么。

更重要的是，这种全民级营销在为大模型寻找真正的 C 端“刚需场景”。点奶茶、写春联、生成祝福语，看似轻量，却都指向高频决策和表达需求，吃什么、买什么、怎么说。C 端用户未必关心模型参数，但一定关心“帮我省钱”“帮我表达”“帮我做选择”。从工具属性看，大模型在消费决策助手、内容表达辅助、社交润滑剂这三个方向最接近刚需，而不是抽象的“智能对话”。

从商业逻辑看，红包和免单也是一次成本可控的用户筛选。相比投放传统广告获得的泛流量，通过互动活动沉淀下来的，是完成过实际调用、留下行为数据的真实用户。这为后续会员订阅、API 付费、生态转化打下基础。大模型竞争进入下半场，比拼的已不只是模型能力，而是谁能率先占据用户心智和使用习惯。

2 月的这轮“烧钱”，本质不是简单的补贴大战，而是一次入口争夺战。当模型能力逐渐同质化，C 端流量就成为决定性变量。谁能把 AI 嵌入到春节这样全民参与的场景中，谁就更有机会把大模型从技术产品，变成日常生活的默认工具。

国内大模型动态

阿里

2月阿里AI动作密集：开源多款高效模型与Agent工具，千问APP借30亿春节营销爆火，同时进军AI硬件赛道，首款眼镜即将亮相；叠加企业服务调用量占比翻倍，呈现"技术开源+硬件破圈+场景落地"的全面加速态势。

2月28日，阿里开源桌面Agent工具CoPaw，用户不仅可以一键在本地和云端部署，还可基于CoPaw进行二次开发，自由接入本地模型、编写Skills和接入专属消息应用，满足更定制化的场景需求。基于内置的丰富Skills,CoPaw可帮助用户实现社交平台内容摘要整理、资讯查询和总结、桌面整理等任务。

2月27日，阿里巴巴旗下个人AI助手“千问"正式进军AI硬件领域，今年将面向全球市场推出多款不同形态的AI硬件产品。千问将在西班牙巴塞罗那举行的2026年世界移动通信大会(MWC)上发布首款同名AI眼镜，并于3月2日开启线上线下全渠道预约。

据阿里内部人士透露，除AI眼镜之外，千问还会在年内陆续发布AI指环、AI耳机等产品，并面向全球市场发售。

2月25日，阿里云百炼推出包含Qwen3.5,GLM-5、MiniMax M2.5、Kimi K2.5四大开源模型API服务的CodingPlan。用户订阅套餐后不再受限于单一模型，可实现多模型自由切换，享受更稳定、Tokens额度更高的模型服务。目前，全球云厂商中仅阿里云提供这一服务。

2月24日，2026年2月，国际市场调研机构沙利文(Frost&Sullivan)发布《中国GenAI市场洞察:企业级大模型调用全景研究，2025H2》。

报告显示,2025年下半年，中国企业级大模型日均调用量飙升至37.0万亿tokens，较上半年的10.2万亿增长263%。头部大模型占比均有提升，其中，阿里云千问(Qwen)增幅最多，占比跃升至32.1%，相较上半年的17.7%几乎翻倍，领先优势扩大，成为最受中国企业青睐的大模型。

2月16日，阿里正式开源千问Qwen 3.5-Plus系列模型。该模型采用MoE架构，总参数3970亿但仅激活170亿，部署显存占用降低60%，最大推理吞吐量提升19倍，API调用价低至0.8元/百万token。

此外，chat.qwen.ai页面低调上线了Qwen3.5-Plus和Qwen3.5-397B-A17B两款新模型。Qwen3.5-Plus定位为Qwen3.5系列最新大语言模型，Qwen3.5-397B-A17B定位则是Qwen3.5开源系列旗舰大语言模型。两款模型均支持文本和多模态任务。

2月12日，阿里宣布加大对淘宝闪购业务的投入，计划三年内不考核盈利，聚焦即时零售细分品类，2026年投入规模将超2025年。该业务已与千问AI深度协同。

2月10日，阿里通义千问正式发布新一代视觉大模型Qwen-Image-2.0，在文生图评测中表现优异，支持生成专业PPT及信息图，并实现文生图与图编辑功能的深度融合，可生成2K分辨率高质感图像。

同日，阿里巴巴达摩院发布物理AI模型RynnBrain并开源全系列模型，该模型基于Qwen3-VL训练，参数量从20亿起，聚焦机器人时空记忆与推理能力，在基准评测中超越Google Gemini Robotics-ER 1.5和Nvidia Cosmos-Reason2。

2月5日，阿里千问APP“春节30亿大免单”正式上线，发起奶茶攻势，请全国人民用AI一句话免费点奶茶。用户火爆参与，活动上线不到3小时，用千问APP下单超100万单奶茶。

活动期间，每个人可以领取21张无门槛的25元免单卡，相当于525元钱，还有机会抽取价值10000元的千问AI生活卡。活动页面还显示，第二波福利将于2月13日开启，用户可领取现金红包，最高可得2888元。

2月4日，，阿里开源了一款小型混合专家模型Qwen3-Coder-Next，专为编程智能体（Agent）和本地开发打造。该模型总参数80B，激活参数仅3B，在权威基准SWE-Bench Verified上实现了超70%的问题解决率，性能媲美激活参数规模大10-20倍的稠密模型。

Qwen3-Coder-Next在实际开发中能理解需求、编写代码，还能与环境交互、完成任务，可以在没有人工干预的情况下生成可玩的网页游戏，部署服务并自动测试。

2月3日，继官宣投入30亿启动“春节请客计划”后，2月3日，千问APP宣布独家冠名东方卫视、浙江卫视、江苏卫视、河南卫视四大马年春节晚会，并以AI形式深度参演春晚节目。全国观众在观看这四台春晚节目时，还可同步在千问APP参与互动、抢大额红包。

2月2日，阿里巴巴旗下千问App宣布投入30亿元启动春节营销活动，联合淘宝闪购、飞猪、大麦、盒马、天猫超市、支付宝等生态业务发放现金红包及免单机会。活动上线9小时内订单量突破1000万笔，一度因流量过大导致系统短暂中断。

字节跳动

2月14日，字节跳动正式发布豆包大模型2.0全系列，同步推出Seed 2.0系列模型，完成AI全栈能力升级。其中，豆包大模型2.0包含Pro、Lite、Mini三款通用Agent模型及专属Code版，Pro版全面对标OpenAI的GPT 5.2和Gemini 3 Pro，在数学奥赛、编程竞赛等基准测试中表现优异；Code版深度适配字节TRAI AI编程环境，强化编码能力。

Seed 2.0系列则重点优化视觉与多模态理解、复杂指令执行能力，多款模型在行业基准测试中达到SOTA水平。同日，豆包2.0 Pro已在豆包App、PC端及网页版上线，火山引擎同步开放全系列API服务，助力企业与开发者快速接入。

2月13日，字节跳动接续发布图像创作模型Seedream 5.0 Lite版本，该版本首次引入“实时检索”能力，打破了传统图像生成模型的知识时效性局限，进一步完善了字节跳动多模态AI创作体系，与前一日推出的Seedance 2.0形成协同，覆盖图像、视频两大核心创作场景。

2月12日，豆包宣布，豆包视频生成模型Seedance 2.0正式接入豆包App、电脑端和网页版。Seedance 2.0模型支持原声音画同步、多镜头长叙事、多模态可控生成。目前，豆包Seedance2.0暂不支持上传真人图片作为主体参考。

2月6日，华中科技大学和字节跳动联合推出了 Stable-DiffCoder。这不仅仅是一个新的扩散代码模型，更是一次关于「扩散训练能否提升模型能力上限」的深度探索。

Stable-DiffCoder 在完全复用 Seed-Coder 架构、数据的条件下，通过引入 Block Diffusion 持续预训练（CPT）及一系列稳定性优化策略，成功实现了性能反超。在多个 Code 主流榜单上（如 MBPP，BigCodeBench 等），它不仅击败了其 AR 原型，更在 8B 规模下超越了 Qwen2.5-Coder ，Qwen3，DeepSeek-Coder 等一众强力开源模型，证明了扩散训练范式本身就是一种强大的数据增强手段。

腾讯

2月18日，腾讯宣布旗下战略级AI原生产品元宝的日活跃用户（DAU）超5000万，月活跃用户（MAU）已达1.14亿。此前一天，腾讯发布的元宝分10亿元现金红包活动报告显示，元宝春节主会场累计抽奖次数超36亿次，用户通过“创作”栏完成AI任务超10亿次。

2月10日，腾讯混元团队正式发布HY-1.8B-2Bit端侧大模型，这是业内首个面向产业场景的2Bit量化端侧大模型。该模型基于混元团队首创的产业级2Bit端侧量化方案，通过对此前混元的小尺寸语言模型——HY-1.8B-Instruct进行2比特量化感知训练（QAT）产出，对比原始精度模型等效参数量降低了6倍，在沿用原模型全思考能力同时，在真实端侧设备上对比原始精度模型生成速度提升2—3倍，可大幅提升使用体验。

2月4日，腾讯首席AI科学家姚顺雨挂帅，带领混元团队与复旦大学联合发布CL-bench上下文学习基准，这也是姚顺雨入职腾讯后的首份重要研究成果。该基准的发布，不仅为AI上下文学习能力提供了统一评测标准，更契合姚顺雨提出的“AI下半场，评估大于训练”的理念，为腾讯AI融入社交、游戏等动态上下文场景奠定技术基础。

2月1日，腾讯旗下AI助手元宝，正式宣布“元宝派”公测上线，探索AI社交赛道。据悉，“元宝派”是腾讯全新的AI社交探索，用户可通过元宝App创建或加入一个“派”。在元宝派里，元宝AI作为派友，能够与用户聊天互动、协作与娱乐。除了内测已有的@元宝AI对话、P图二创和共享屏幕等能力。公测版本还打通了腾讯视频、QQ音乐内容生态，用户可以与派友一起听音乐、一起看电影，畅享QQ音乐海量曲库歌曲、腾讯视频VIP精选影片。

同日，腾讯元宝启动新春特别活动，总额达十亿元的现金红包全面开放领取，活动持续至2月17日，单个红包最高可达一万元，用户通过登录、完成任务、分享等方式抽奖，红包可直接提现至微信零钱。

百度

2月26日，百度发布2025年第四季度及全年财报，显示2025年总营收达1291亿元，Al业务营收达400亿元;四季度，百度总营收327亿元，AI业务收入占百度一般性业务收入的43%，超出市场预期。

2025年,AI云收入同比增长34%,AI应用全年收入突破100亿元，AI原生营销服务收入同比增长301%。12月，文心助手月活用户数达2.02亿;春节红包活动启动以来，文心助手月活跃用户同比增长4倍。同时，萝卜快跑四季度全球无人驾驶出行服务次数达340万，同比增长超200%，季度内每周出行次数峰值超30万。财报显示，截至2026年2月，萝卜快跑累计提供全球出行服务次数超2000万，足迹已覆盖全球26个城市。

2月14日，百度App正式接入OpenClaw智能体，用户可通过百度App一键调用该工具，标志着百度App打通"百度生态+本地个人助理"全链路。同期，百度优选官方电商Skill正式上架ClawHub，成为OpenClaw生态首个官方级电商能力插件。

2月10日，百度文心助手作为北京台春晚首席AI合作伙伴，联动百度App发放5亿元现金红包，推出AI春联、马年写真等近百种春节玩法。数据显示，截至2月10日文心助手MAU同比增长4倍，生图功能同比增长50倍，生视频功能同比增长40倍，打电话功能增长近5倍。

2月5日，百度智能云推出“移动版OpenClaw”——红手指Operator。这款基于百度全栈自研的ARM云服务和VLA（vision-language-action）多模态大模型打造的AI Agent，可以在移动端提供与OpenClaw在PC端类似的功能。用户通过云手机红手指Operator入口，即可激活移动设备的“自主能动性”。

据了解，红手指Operator是将AI大模型的决策能力与云手机提供的安全隔离、精准执行环境深度融合，能够支持理解用户意图、智能拆解和编排工作流，而且支持跨应用完成复杂协作任务。

2月3日，百度智能云上线OpenClaw一键部署服务，并开启限时免费体验活动。开发者可以通过百度智能云轻量应用服务器，快速部署这款智能体产品，并借助千帆平台一键接入文心、DeepSeek、Qwen等主流大模型。

MiniMax

2月，MiniMax发布M2.5模型，以10B激活参数量实现Agent场景高效推理，周调用量3.07T tokens登顶OpenRouter；同步升级Expert 2.0与MaxClaw，降低Agent使用门槛。

2月26日，Minimax官微发文介绍MiniMaxAgentExpert的功能升级，同步介绍MaxClaw。据介绍，在Expert2.0中进一步优化了专家Agent的创建体验。用户不需要考虑Skill、SubAgent、MCP的配置，以及提示词的结构编排，只需用自然语言。描述任务目标或能力需求，Agent会根据目标完成SOP梳理、工具编排与能力配置。

与Expert 2.0升级同步，Minimax上线MaxClaw，基于OpenClaw构建的云端AI助手，直接集成在Mini-MaxAgent网页端，为用户在云端部署并运行OpenClaw，无需自备服务器或API Key。

2月24日，数据显示，MiniMax M2.5模型发布一周内登顶OpenRouter调用量榜首，周调用量暴涨至3.07T tokens，超过Kimi K2.5、GLM-5与DeepSeek V3.2三家总和，同时带动100K至1M长文本区间的增量调用需求，该区间为Agent工作流的典型消耗场景。

此外，研究机构SemiAnalysis实测显示，M2.5在8张H200显卡上，每GPU每秒可稳定达到约2500个token的吞吐量，商用定价具高性价比。

2月23日，港股恒生科技指数大涨3.34%，但大模型板块逆势回调，MiniMax股价单日跌幅达13.35%，此前三天内，MiniMax与智谱从双双突破3000亿港元市值的高位，合计蒸发近千亿港元，市场分析认为此次回调与AI行业整体估值波动及企业亏损现状相关。

2月13日，MiniMax发布新一代模型M2.5，该模型在编程、工具调用及长文本处理等场景表现突出，发布后12小时内登顶OpenRouter热度榜，一周内以3.07T tokens的周调用量位列榜首，超过Kimi K2.5、GLM-5与DeepSeek V3.2三家的总和。

2月12日，AI领域迎来技术爆发与产业落地双热潮，国产大模型智谱GLM-5、MiniMax M2.5等实现关键突破并登顶开源榜单，具身智能、AI视频生成、长上下文处理技术取得重大进展，全球科技企业密集推新开源，资本持续涌入具身智能、AI视频等赛道，同时AI安全、伦理问题凸显，行业迎来从技术研发到产业深度融合的转型，AI对就业、商业、各传统产业的变革影响进一步深化。

2月11日，MiniMax新一代文本模型M2.5在海外Agent产品启动内测，定位为"全球首个为Agent场景原生设计的生产级模型"，激活参数量仅10B，主打编程与智能体工作流能力，对标Claude Opus 4.6。

月之暗面

2月25日，Kimi 旗下 K2.5 大模型发布不到一个月，Kimi 近 20 天累计收入已超过 2025 年全年总收入，增长主要受全球付费用户及 API 调用量大涨共同推动，其中海外付费用户数快速增长，OpenRouter 数据显示，Kimi K2.5 调用量持续保持领先。

在连续融资超 12 亿美元后，Kimi 最新估值达到 100-120 亿美元，创下国内公司从成立到晋级十角兽企业（估值超 100 亿美元）的最快成长速度。Kimi 创始人杨植麟此前曾在全员信中表示，「融资金额超过绝大部分 IPO 募资及上市公司的定向增发，还可以从一级市场募集更大量资金。」

2月17日，月之暗面宣布完成新一轮超7亿美元融资，本轮由阿里巴巴、腾讯、五源资本、九安医疗等老股东联合领投。这是公司在2026年开年不到两个月内启动的第二轮融资，估值水平呈现阶梯式跃升，正式迈入100-120亿美元估值区间，成为国内非上市大模型企业中估值最高的头部玩家之一。

此外，在完成超7亿美元C+轮融资交割的同时，月之暗面宣布新一轮100-120亿美元估值的融资已经启动。从2023年6月天使轮3亿美元估值，到2026年2月突破100亿美元，月之暗面在不到三年时间里估值暴涨超30倍，创下国内AI创业企业估值增长最快纪录。

2月16日，月之暗面正式上线核心产品Kimi Claw Beta测试版，提供云端原生集成，支持一键部署或关联设置好的OpenClaw。该功能支持ClawHub 5000+社区插件，涵盖开发与代码类、浏览器相关、办公工作流、专家角色等多个类别，可远程操控电脑执行任务，降低全球AI Agent技术落地门槛。

科大讯飞

2月11日，科大讯飞基于全国产算力训练的星火X2大模型正式发布。星火X2通用能力实现提升，在其公布的数学、推理、语言理解、智能体等能力测评上可以媲美GPT-5.2、Gemini-3-Pro等模型。星火X1.5于2025年11月6日发布，仅三个月后星火系列新旗舰模型就上线了。

蚂蚁集团

2月23日，蚂蚁集团披露春节假期AI业务实战数据，核心AI产品实现重大突破。其中，支付宝“AI付”用户数突破1亿，单周支付笔数超1.2亿笔，成为全球首个用户规模与交易笔数双破亿的AI原生支付产品，标志着AI支付正式进入规模化、普惠化阶段，其覆盖买菜、餐饮、优惠核销等高频民生场景，平均5-8秒即可完成支付，兼顾便捷性与安全性。

同时，蚂蚁阿福APP总用户数也突破1亿，成为全球第一大健康AI App，春节新增用户中52%来自三线及以下城市，连续多日登顶苹果App Store应用下载总榜，依托AI技术提供基础医疗咨询、慢病管理等服务。

据悉，两大产品的爆发得益于蚂蚁集团在AGI领域的持续布局，其近期还开源了百灵大模型2.5版及多款具身智能模型，形成从基础模型到应用场景的完整支撑，践行“用AI守护用户财富与健康”的“两朵花”AI战略。

2月13日-2月16日，蚂蚁集团inclusionAI团队期间发布百灵大模型家族新一代开源万亿参数模型Ling-2.5-1T（即时模型）与Ring-2.5-1T（思考模型）。这两款模型并非仅靠“堆参数”取胜，它们共享的技术底座——混合线性注意力架构“Ling 2.5”，才是此次发布的关键。在当前主流大模型仍以改进型传统注意力机制为核心架构的背景下，Ling-2.5-1T是业内少见的超大型混合线性注意力架构模型，而Ring-2.5-1T成为了全球首个混合线性注意力架构的万亿参数思考模型。

2月11日，蚂蚁集团正式开源发布全模态大模型Ming-Flash-Omni 2.0，该模型基于Ling-2.0 MoE架构训练，核心突破在于实现音频生成“一轨三音”，可在同一音轨实时合成语音、环境音效与背景音乐，支持自然语言调控音色、方言、情绪等20余项参数。其推理帧率低至3.1Hz，可生成分钟级高保真音频，相较于传统方案，端到端架构将开发效率提升40%、成本降低60%，能广泛应用于影视配音、游戏音效、有声书等场景，进一步完善蚂蚁AI开源生态矩阵。

2月2日，蚂蚁通用AI助手灵光宣布对其核心功能“闪应用”进行全面升级，正式推出“上传图片生应用”与“桌面小组件”两大全新能力，并集成音效合成、大语言模型（LLM）调用、日历服务、多模态理解、文本朗读、持久化存储、陀螺仪、震动反馈等近20项API工具。升级后，用户不仅能高效创建个性化小工具，所生成的应用更具备实时反馈与沉浸式的视听触觉交互体验，实用性与趣味性同步跃升。

智谱 AI

2月23日，智谱AI正式发布GLM-5技术报告，全面公开其技术细节，正面回应行业相关质疑。该模型参数规模达7440亿，在编程能力上实现对Claude Opus 4.5的对齐，全球权威Artificial Analysis榜单中位居全球第四、开源第一，同时宣布上调GLM Coding Plan套餐价格，中国区涨价30%，海外版涨价超100%，成为国内首家对大模型商业化服务提价的AI原生企业。

2月21日，智谱发布《GLM Coding Plan致歉信》，承认GLM-5发布后运营中犯下三项错误：规则透明度不足、GLM-5灰度节奏过慢、老用户升级机制设计粗糙；针对受影响的Lite与Pro用户，公司支持自主申请退款，退款范围覆盖2026年1月1日至2月21日期间全部消费，遵循"智谱全部请客"原则。

2月20日，智谱股价迎来大幅上涨，单日涨幅达42.72%，报725港元/股，股价再创新高，总市值达3232亿港元，上市43天股价累计涨幅已超500%，市场对国产大模型技术价值的认可度持续提升。

2月12日，GLM-5正式开源上线并同步登陆chat.z.ai平台，首次集成DeepSeek Sparse Attention稀疏注意力机制，在维持长文本理解无损的前提下显著提升Token效率；同日智谱宣布对GLM Coding Plan套餐价格进行结构性调整，整体涨幅自30%起，取消首购优惠，已订阅用户价格保持不变，生效时间为当日。

2月11日，智谱发布新一代旗舰模型GLM-5。在Coding与Agent能力上，GLM-5取得开源SOTA表现，在真实编程场景的使用体感逼近Claude Opus 4.5，擅长复杂系统工程与长程Agent任务。此前，在OpenRouter市场上发布的开源模型Pony Alpha，实际上是智谱的新模型GLM-5。Pony Alpha引发了智谱近日的股价上涨，2月9日单日涨幅达到36.22%。

2月3日，智谱AI上线GLM-OCR图文解析模型，采用自研CogViT与GLM-0.5B编码器-解码器架构，基于数十亿图文对CLIP预训练，在手写体、表格、印章、竖排等复杂场景中实现高效视觉语义提取与关键Token识别。

整体来看，2月智谱AI以GLM-5发布为核心节点，同步推进技术开源、价格策略调整、算力生态共建与用户沟通优化，在技术影响力、资本市场表现与商业化探索三方面形成共振，但也在高负载运营与用户权益保障方面经历挑战。

阶跃星辰

2月27日，AI独角兽公司阶跃星辰正在进行新一轮Pre-IPO融资，本轮融资分两拨交割，第一拨投前估值约40亿美元，计划融资20亿-30亿元人民币，目前已经确定由一家运营商领投，金额约12亿元人民币，其他老股东跟投，计划在3月6日前完成;第二拨投前估值50亿-60亿美元，计划在4月中下旬交割。此外，据悉，阶跃星辰计划在今年6月30日前，在港股交表，预期基石定价在100亿美元左右，预计今年年底完成上市。

2月25日，外媒彭博社援引知情人士报道，上海大模型明星创企阶跃星辰正考虑在港交所IPO，计划筹集约5亿美元（约合人民币34亿元）。知情人士称，阶跃星辰已与潜在顾问就股权出售事宜进行磋商，最早可能在今年上市，其发行规模和上市时间等细节可能有所变化。阶跃星辰暂未回应IPO相关消息。

2月2日，阶跃星辰正式发布并开源新一代Agent基座模型Step 3.5 Flash，这是印奇出任董事长后公司的首个重大技术动作。该模型采用稀疏MoE架构，总参数量1960亿（每token激活110亿），支持256K超长上下文，单请求代码类任务推理速度最高达350 TPS（每秒生成词元数）。在数学推理、编码能力和Agent场景测试中，性能逼近主流闭源模型。该模型已通过OpenRouter限免开放，并支持个人工作站本地部署。

Step 3.5 Flash发布当日，华为昇腾、沐曦股份、壁仞科技、燧原科技、天数智芯、阿里平头哥等国产芯片厂商宣布已完成对该模型的适配。燧原科技L600芯片成为国内首批适配该模型的国产算力，标志着国产AI芯片与开源大模型的协同生态进一步成熟。

生数科技

2月5日，生数科技宣布完成超过6亿元人民币A+轮融资。本轮融资由中关村科学城公司和星连资本领投，上市公司万兴科技、视觉中国、拓尔思进行战略投资，原有股东启明创投、北京市人工智能产业投资基金、卓源亚洲、建发新兴投资、淮海投资等投资人加码跟投。

据悉，生数科技成立于2023年3月，2024年4月在中关村论坛上发布中国首个全面对标Sora的文生视频大模型Vidu，随后于2024年7月全球上线Vidu，在文生视频和图生视频的模型能力外，Vidu全球首创“参考生视频”技术，率先解决了商业级视频需求中的多主体连续一致性难题，此后连续发布Vidu Q1、Vidu Q2和Vidu Q3版本。

同日，万兴科技宣布斥资数千万元战略投资生数科技，双方在深圳签署战略合作协议，共建"大模型＋工具＋场景"的AI漫剧工业化生产新范式

1月30日，生数科技发布了Vidu Q3模型，是一个主要面向专业级影视制作场景的视频生成模型。Vidu Q3在国际权威AI基准测试机构Artificial Analysis最新公布的榜单中，Vidu Q3排名中国第一、全球第二，仅次于xAI的Grok视频生成模型，超越Runway Gen-4.5 、Google Veo3.1和OpenAI Sora 2。功能方面，Vidu Q3支持了16s声画同出、1080P画质、丰富的镜头语言、精准切镜、多国文字渲染和多语言输出。

快手

2月26日，全球知名AI基准测试机构Artificial Analysis近日发布最新的全球视频生成大模型榜单，可灵3.0系列模型(Kling3.0 Pro)以1240的Arena ELO基准测试评分位居文生视频赛道第一位，在前15名中可灵共有7个模型在榜。

据介绍，此前发布的可灵3.0模型在视频真实感、一致性和可控性上具备行业领先优势，意味着AI正式进入影视工业级视觉生产的核心环节。

2月5日，可灵AI正式全球上线3.0系列模型，目前正面向黑金会员开放使用，预计将于近期全量上线。此次发布的可灵视频3.0、可灵视频3.0 Omni及可灵图片3.0、可灵图片3.0 Omni模型，覆盖图片生成、视频生成、编辑及后期等影视级全流程链路。

可灵3.0系列模型基于All-in-One产品和技术理念构建，形成一个多模态输入与输出高度统一的一体化视频模型体系。它并非将功能简单叠加，而是通过统一架构，将影像创作中的理解、生成与编辑整合为一个连续流程，让创作首次在单一模型内完成闭环。

昆仑万维

2 月 27 日，Skywork AI 正式发布多模态视频基础模型 SkyReels V4——全球首个同时支持多模态输入、联合音视频生成、统一生成/修复/编辑任务的视频基础模型。

该模型以双流多模态扩散 Transformer（MMDiT）为核心架构，实现了 1080p 分辨率、32 FPS 帧率、15 秒时长的影院级音视频同步生成，为专业创作者与普通用户提供了高效、精准、一体化的视频创作解决方案。在 Artificial Analysis 基准测试中，SkyReels V4 模型排名全球第二，超越Google Veo 3.1、OpenAI Sora 2、Wan 2.6等主流模型。

2月4日，昆仑天工面向全球正式发布「天工Skywork桌面版」，即桌面端应用Skywork Desktop。「天工Skywork桌面版」直接在本地执行任务，无需上传文件到云端。它可以直接读取电脑上的海量文件，进行汇总、整理，并基于内容生成新产物。同时，它以“内容理解”为核心，而非“文件格式”：无论是图片、视频、表格、PPT 还是各类文档文件，都能在统一语义层下被理解、归类、执行任务，且支持多任务并行。

导航项