中国AI大模型平台排行榜 | 1月

2025-02-14

作者|参商 王玄

编辑|星奈

媒体|AI大模型工场

国内大模型发展趋势|1月份解读

DeepSeek引爆全球,国产AI连续霸榜全球榜单

今年新春顶流,非DeepSeek莫属。

在2025年春节期间,DeepSeek以20天突破2000万日活用户,成为史上最快突破3000万日活的应用,远超ChatGPT早期增速,并登顶中美应用商店下载榜。其开源模型DeepSeek-R1、V3通过强化学习技术,在数学、编程、推理等任务上比肩GPT-4o,但训练成本仅600万美元,仅为OpenAI同类模型的1/27。   

DeepSeek的低成本技术路线导致英伟达股价单日暴跌17%,市值蒸发6000亿美元,并引发美国紧急出台《AI脱钩法案》,意大利、法国、澳大利亚以“国家安全”为由封禁该模型。其开源策略打破西方技术垄断,被《黑神话:悟空》制作人冯骥称为“国运级科技成果”。

此外,1月29日阿里发布义千问Qwen2.5-Max最新大模型,在Chatbot Arena盲测中以1332分位列全球第七,超越DeepSeek-V3、Claude-3.5-Sonnet等模型,在数学、编程、硬提示(Hard Prompts)等专业领域斩获单项第一。   

继而引起OpenAI与硅谷巨头的恐慌与反击,OpenAI随后推出轻量级推理模型o3-mini,试图以低成本策略对抗,但在数学推理、代码生成等核心能力上仍逊于Qwen2.5-Max;谷歌紧急上线“全家桶”服务,整合Gemini-2.0与搜索、办公套件,但闭源模式限制其生态扩展;Meta加速推进Llama系列开源,但模型性能与DeepSeek、Qwen存在代际差距,且缺乏中文场景优化。   

从DeepSeek的“现象级破圈”到Qwen2.5-Max的“全球屠榜”,国产AI以低成本、高性能和开源生态重塑全球竞争格局。这场技术革命不仅 让“星际之门”计划沦为笑谈,更标志着中国从“跟随者”向“规则制定者”的跃 迁。

用AI算命、锐评一切,DeepSeek掀起全民AI玩梗潮

DeepSeek以“3%成本对标OpenAI”的标签横空出世,迅速走红,日活用户15天突破1500万。随着爆火出圈,带来的全民AI玩梗潮。

率先闯入玄学赛道,其“算命功能”刷爆社交网络。网友输入生日可生成星座运势报告,输入姓名能测事业财运,甚至还能预测股票趋势。许多人惊呼“准到离谱”,有人称按其所说蹲点真遇到了新客户,还有人表示它准确预测了自己过去的事业转折点。一时间,年轻人集体陷入“玄学狂欢”,表情包、段子刷屏不断,DeepSeek也被网友称为“赛博半仙”。

又因“毒舌点评”和“接地气表达”屡次登上热搜。它能提供“高情商发疯版”表达,还能生成“高级黑颁奖词”。无论是对生活中的人和事,还是职场现象、社交问题等,DeepSeek都能以独特的视角进行评价和分析,为网友提供了一种全新的看待问题的方式,也引发了众多网友的共鸣和讨论。

从年轻人到广场舞大妈,全民都参与到了这场AI玩梗潮中。年轻人用它写“阴阳辞职信”、生成“糊弄学情书”。广场舞大妈也学会了用它算命,如“你儿子明年找的对象,可能是你最讨厌的同事的女儿”。还有网友让DeepSeek扮演“毒舌男性”模拟争执,或在“恋爱模式”中寻求情感陪伴,将其视为“赛博闺蜜”或“赛博男/女友”。甚至有4岁小孩让它讲超级英雄故事,老年人用它匹配相亲对象等,各种玩法层出不穷。

全行业托举支持,Deepseek激活AI上下游产业链

《哪吒2》登顶全球票房前40,哪吒的成功离不开全行业的托举,AI界有自己的“哪吒”。

DeepSeek不仅让中国生成式人工智能技术进入全球视野,同时也直接激活了整个人工智能产业链,无论是云服务厂商、芯片公司,还是下游应用层,均纷纷进行部署和适配。业内预期接下来一年有望成为AI应用爆发的黄金期。咨询机构Omdia预计,未来五年中国生成式AI的市场规模将增长5.5倍,到2029年将达到98亿美元。

在上游算力基础设施领域,众多关键力量纷纷发力。华为云、腾讯云、阿里云、百度智能云等国内头部云厂商迅速响应,率先上线DeepSeek-R1。三大运营商中国电信天翼云的“息壤”智算平台,同样第一时间完成国产算力与DeepSeek-R1的深度适配;中国移动移动云将DeepSeek-R1深度集成,全国13个智算中心均已具备相关能力;中国联通联通云依托“星罗”平台,实现国产及主流算力与DeepSeek-R1的适配。同时,超过15家国产芯片厂商,像沐曦、天数智芯、摩尔线程等,也完成了对DeepSeek模型的适配,为其运行提供坚实的芯片支持 。

下游应用端同样积极拥抱DeepSeek-R1,金融领域,至少16家券商,如国泰君安、国金证券等,已完成DeepSeek-R1模型的本地化部署,深度应用于信息检索、文档处理等核心业务。智能硬件方面,OPPO宣布即将发布的OPPO Find N5将正式接入DeepSeek-R1,实现便捷语音唤醒使用。汽车行业里,东风旗下岚图汽车、吉利汽车等也先后完成与DeepSeek-R1的深度融合。教育领域,网易有道的AI全科学习助手“有道小P”以及云学堂全系产品,均已接入DeepSeek-R1。

从《哪吒》的138家动画公司到DeepSeek的千企联盟,全行业托举的本质是“竞争逻辑向共生逻辑的进化”。当技术突破、数据共享、场景联动与生态开放形成合力,便能释放并形成“中国式创新”。

国内主要大模型最新进展

DeepSeek

1月20日, DeepSeek发布了其最新的开源模型DeepSeek-R1。该模型以低成本实现了接近于OpenAI开发的GPT-01的性能,打破了“算力至上”的神话。它采用大规模专家混合(MoE)架构,参数规模高达6710亿,在数学计算、代码生成、自然语言推理等关键领域表现出色。随后一周又发布了两款多模态框架——Janus-Pro 和 JanusFlow。

DeepSeek-R1的发布引发了全球AI圈的轰动,受到了国外技术大佬的纷纷点赞。其开源策略也拉拢了大量开发者,让整个AI行业的生态更加开放和多元化。

1月28日QuestMobile数据显示, DeepSeek在当天的日活跃用户数首次超越豆包,随后在2月1日突破3000万大关,成为史上最快达成这一里程碑的应用。自1月20日DeepSeek R1模型发布以来,其日活跃用户数迅速攀升,从1月26日的100万增长到2月1日的3000万,显示了AI技术的强大吸引力和市场潜力。

国内厂商也纷纷接入DeepSeek,从三大运营商平台到云平台,再到各类AI应用,实现万物皆可接入。

业内预期接下来一年有望成为AI应用爆发的黄金期。咨询机构Omdia预计,未来五年中国生成式AI的市场规模将增长5.5倍,到2029年将达到98亿美元。

字节跳动

1月22日,豆包全新基础模型 Doubao-1.5-pro 正式发布,全新的豆包实时语音模型Doubao-1.5-realtime-voice-pro,采用Speech2Speech端到端框架,表现力实现质的飞跃,真正做到会哭会笑、能说方言会唱歌。该模型已在豆包App全量上线。

字节跳动表示,豆包大模型1.5 Pro增强了综合能力,在知识、代码、推理、中文等多个测评基准上,综合得分比GPT-4o更高。豆包大模型1.5Pro使用较小的激活参数进行预训练,训练成本极低,但性能不打折,采用大规模稀疏MoE架构,等效7倍激活参数的Dense模型性能,远超业内MoE架构约3倍杠杆的常规效率。

在多模态方面,字节持续深耕研究。1月9日,字节跳动与南京大学的研究团队、西南大学联合推出了一项创新技术 ——STAR(Spatial-Temporal Augmentation with Text-to-Video Models),旨在利用文本到视频模型,实现真实世界视频的超分辨率处理。该技术结合了时空增强方法,能够有效提高低分辨率视频的质量,尤其适用于在视频分享平台上下载的低清晰度视频。

阿里巴巴

1月初,阿里云先是与与零一万物正式达成模型平台业务的战略合作,双方将成立“产业大模型联合实验室”,联手加速大模型从技术到应用的落地,进一步扩大产业大模型的生态整合。

随后全面上线通义灵码AI程序员,此次上线的AI程序员支持VS Code、JetBrains IDEs前端后端开发全覆盖,相比传统AI辅助编程工具,能力更全面,可以让开发者以更高效、更沉浸的方式完成编码任务,通过全程对话协作的方式,就能完成从0到1的业务需求开发、问题修复、单元测试批量生成等复杂编码任务。

1月9日通义万相 2.1 版本模型重磅升级,视频生成、图像生成两大能力均有显著提升。新发布的模型有两个版本,分别是通义万相 2.1 极速版和专业版,前者注重高效性能,后者瞄准卓越表现力。

在视频生成方面,通义万相 2.1 通过自研的高效 VAE 和 DiT 架构增强了时空上下文建模能力,支持无限长 1080P 视频的高效编解码,首次实现了中文文字视频生成功能,登上 VBench 榜单第一。

大年初一,阿里发布义千问Qwen2.5-Max最新大模型。2月4日三方基准测试平台Chatbot Arena公布最新的大模型盲测榜单,其发布的通义千问Qwen2.5-Max超越DeepSeek-V3、Open AI o1-mini和Claude-3.5-Sonnet等模型,以1332分位列全球第七名,也是非推理类的中国大模型冠军。同时,Qwen2.5-Max在数学和编程等单项能力上排名第一,在硬提示(Hard prompts)方面排名第二。

百度

1月1日是百度成立25周年,百度创始人李彦宏发布全员信表示,技术创新是百度的核心竞争力,“25年来,我们始终走在技术的最前沿,始终相信技术创新才是百度的核心竞争力。”

在全员信中,李彦宏表明了对2025年的期待,“虽然超级应用尚未出现,但AI的实际渗透率已经不低,并且将在2025年继续井喷式增长”。他写道,“我们也期待,我们在2023、2024年种下的种子能够在2025生根发芽、开花结果,并且不断获得市场的验证和认可”。

1月2日消息,百度搜索Web端首页上线了百度“AI搜”(Chat.baidu.com)入口,推动百度搜索改版升级。

据悉,百度“AI搜”是基于百度文心大模型打造的桌面端AI搜索引擎,目前内容侧已经打通百度搜索引擎、百度健康、百度律临、百度文库、百度教育等内容生态。

科大讯飞

1月7日,科大讯飞升级发布了8款办公智能体,同时涵盖C端和B端场景。在C端,讯飞智文、讯飞文书、讯飞绘文和讯飞绘镜升级发布,聚焦智能PPT制作、文书写作、自媒体运营和视频创作,提供全链路AI协同支持,打造每个人的专业级创作平台。

在B端,星火纪要、星火投标、星火陪练和星火快答相继登场,提高会议总结、投标、培训和接待等业务场景效率,打造企业级数字生产力。

同时,“知识中台、AI搜索、星火人设、虚拟数字人、星辰MaaS与多模态交互”六大通用能力首次联合发布。

在基础模型方面,1月15日,科大讯飞推出当前全国产算力平台上唯一的深度推理大模型——讯飞星火X1。该模型中文数学能力国内第一,并率先应用于教育、医疗等刚需场景。

同时,讯飞星火4.0 Turbo底座能力再次迎来全新升级,图文、数学和长文本能力显著提升,并首发混域知识搜索技术,进一步解决行业、企业痛点。

此外,科大讯飞还推出了业界首个具备端到端语音到语音同传能力的大模型——星火语音同传大模型,最快语音同传时延小于5秒。

腾讯

1月21日,腾讯混元3D生成大模型2.0发布即开源,并同步上线混元3D AI创作引擎,官方称是“业界首个一站式3D内容AI创作平台”。

据介绍,2.0版本主要是对3D生成过程中的几何和纹理两个大模型进行了升级。其中,几何大模型的任务是捕捉3D物体的形状和结构,采用Hunyuan3D-DiT和Hunyuan ShapeVAE技术,让生成的白模(没上色的模型)效果堪比设计师手工建模;纹理大模型Hunyuan3D-Paint则可以根据文字或图片描述,为白模“穿”上各种高清纹理,科幻、卡通、写实,风格切换自如。

在1月13日腾讯集团年会上,马化腾表示,TEG(技术工程事业群)方面,期望做腾讯混元的端到端语音交互落地。腾讯会持续投入资源进行算力的储备,希望各个BG都能拥抱大模型的产品化落地场景。TEG进行了架构调整,将更聚焦做技术底座,产品化则希望其他事业群一起推进。

360

去年年底,360集团正式推出全新多模态内容创作引擎——纳米搜索。截至目前,纳米AI搜索的下载量在全球范围内排名第二,仅次于DeepSeek,月活跃用户数(MAU)已超过100万。

1月初,纳米AI搜索、360AI办公上线鸿蒙原生版系统,1月26日,周鸿祎宣布启动一项名为“刺激消费 推广国产品牌——纳米AI搜索送百辆新能源汽车回馈用户嘉年华”的活动。

据了解,360纳米AI搜索的此次抽奖活动,除了分阶段面向纳米AI搜索的用户抽奖送出100辆国产新能源汽车,还会有国产AI硬件、软件产品等多种形式和种类的奖品。

周鸿祎称,希望将纳米AI搜索打造成公众了解AI、学习AI、使用AI、掌握AI的入门产品,“希望通过本次活动,提升国产AI产品的人群覆盖度,提高公众的AI认知和AI使用能力。”

在基础模型研发方面,1月10日,360智脑团队宣布开源360-LLaMA-Factory项目,该项目在LLaMA-Factory的基础上,创新性地加入了序列并行功能,使得开发者仅需通过添加一个参数sequence_parallel_size: 16,即可轻松实现任意长序列的后训练(Post-Training),极大地简化了长序列处理的复杂度。

月之暗面

1月15日,月之暗面发布全新多模态图片理解模型moonshot-v1-vision-preview正式发布,该模型完善了moonshot-v1模型系列的多模态能力,具备图像识别、文字识别和理解能力。Vision模型实行按量计费方式,单张图片按1024tokens合并计算在Input请求的tokens用量中,根据模型不同,每1M tokens价格为12至60元人民币。

1月20日,月之暗面推出多模态思考模型k1.5,实现了SOTA(state-of-the-art)级别的多模态推理和通用推理能力。

据介绍,k1.5多模态思考模型具备多模态推理能力,能够同时处理和分析来自不同模态的信息,如文本、图像、声音等,从而提供更全面、更准确的理解和知识。这种能力对于支持各种复杂任务,如视觉问答、视觉常识推理、视觉语言导航等,具有极其重要的意义。

此外,官方称Kimi k1.5的数学、代码、视觉多模态和通用能力,大幅超越了全球范围内短思考SOTA模型GPT-4o和Claude 3.5 Sonnet的水平;Kimi k1.5的数学、代码、多模态推理能力,也达到长思考SOTA模型OpenAI o1正式版的水平。

智谱AI

1月15日,美国将25家中国实体拉入黑名单,其中就包括知名AI初创「智谱」。对此,智谱已经发文表示,美国商务部工业和安全局(BIS)的这一决定缺乏事实依据,并对此表示强烈反对。

对此,智谱官方表示鉴于智谱掌握全链路大模型核心技术的事实,被列入实体清单不会对公司业务产生实质影响。智谱有能力也将更专注地为我们的用户和伙伴提供世界一流的大模型技术、产品和服务。同时公司将继续参与全球人工智能竞争,坚持最高安全标准和公平、透明、可持续原则,推动人工智能技术发展。

1月21日,智谱宣布旗下AI视频模型清影完成2.0重磅更新。据官方介绍,清影2.0在模型结构、训练方法和数据工程方面进行了全面升级,基础模型能力大幅提升38%。这一改进使得清影2.0能够生成动作更自然、画面更精美且稳定可控的视频内容。用户输入简单的提示词,即可让视频中的画面主体进行大幅度运动,同时保持画面的稳定性。普通用户可免费试用,会员享有快速通道且不消耗积分。

昆仑万维

1月6日消息,昆仑万维集团宣布,「天工大模型4.0」o1版和4o版于2025年正式上线天工网页和APP,供用户免费使用。o1版专注于中文逻辑推理,具备强大的数学、代码、逻辑、常识和伦理决策能力,通过多智能体体系和强化学习等技术提升推理性能。4o版为多模态模型,语音对话助手Skyo具有情感表达和多语言切换能力,提供流畅的实时对话体验。

快手

1月7日,快手宣布其自研的视觉生成大模型可灵AI(Kling)V1.6版本已经开放API。可灵AI V1.6模型在运动、时序类动作和运镜等文字描述的响应上表现出色,文本响应度显著提高,从而使得广告视频素材的生成成功率大幅增加。

此外,该模型在风格保持、画面色彩、光影效果以及细节逼真度等方面也有了显著的提升,能够以更低的成本为用户创造出具有电影级画面质感的作品。

分享