“走先人一步的路,打以少胜多的仗。”走进面壁智能在清华科技园的办公室,可以看到墙上这句醒目的口号。创立仅三年,这家清华系大模型公司在全球“参数军备竞赛”中另辟蹊径,通过“高效为第一性原理”的技术路线,将模型知识密度提升至行业领先水平,以同等参数实现越级性能,覆盖司法、教育、汽车、具身智能等垂直领域。支撑他们先人一步、以少胜多,在实现通用人工智能道路上打持久战的,是使命的感召、是“面壁十年图破壁”的信念。
2018年,刘知远开始带领清华大学计算机系自然语言处理与社会人文计算实验室(THUNLP)跻身国内预训练模型研究的核心阵地。团队研发的THU-ERNIE模型系列,首创知识图谱增强的预训练框架,在法律条文解析、化学指令理解等垂直领域的中文任务中达到国际领先水平。“我们当时确实有点沾沾自喜,觉得自己站到了最前沿。”刘知远回忆道。
2020年6月,OpenAI发布的GPT-3像一颗惊雷,打破了刘知远团队的“技术舒适区”。这个拥有1750亿参数的庞然大物,不仅在语言生成能力上展现出“智能涌现”的奇迹,更揭示了一个残酷现实:当THUNLP团队还在为“用4卡GPU训练模型”而自豪时,OpenAI已用近万张GPU构建超大规模集群。
“震撼之后,随之而来的是危机感,”刘知远谈到,“我们实验室一年的经费不过一两百万元,而OpenAI单次训练成本就高达数千万美元。这种差距不是靠算法优化就能弥补的。”GPT-3的训练需要数百人的工程团队、定制化的分布式框架,以及超算级别的算力支持——这些都是高校实验室难以企及的。
这场技术代差让刘知远清醒意识到:仅凭高校资源,中国AI将永远被困在“单点突破”的陷阱里。他开始思考一个更宏大的命题:如何将实验室的创新转化为产业级的生产力?
同年下半年,作为北京智源研究院青年科学家的刘知远带着“中国需要自己的大模型”的构想,走进了研究院领导的会议室。在听完汇报后,智源研究院迅速批准了10台高性能GPU服务器的采购计划,总投入近千万元。
这10台服务器成为中国大模型研发的“火种”。刘知远团队仅用20天,就基于这些设备训练出26亿参数的CPM模型,验证了技术路线的可行性。更重要的是,这次尝试推动智源于2021年启动“悟道”大模型计划,采购百台级服务器集群,将中国大模型研发带入工程化阶段。
悟道计划的实践让刘知远团队深刻体会到技术研发范式的剧变。“大模型研发就像芯片制造,早已不是实验室里几人协作就能完成的‘手工作业’。”他强调,从数据预处理到分布式训练,从模型优化到工程落地,每个环节都需要专业化团队深度协同。这种系统化工程能力的需求,与高校科研的单点突破模式形成鲜明对比——当“悟道2.0”需要百台级服务器集群支撑时,传统学术体系的资源调配效率已难以满足产业级研发的节奏。
2021年6月,在“悟道2.0”万亿参数模型发布后,刘知远参与孵化面壁智能,以企业化运作推动技术工程化落地。
从实验室到产业深水区,对刘知远来说,“不变”的远比“变化”要多——不变的是对通用人工智能(AGI)的追求,以及“做世界最好模型”的初心,这些价值取向,早已深深融入面壁智能的基因。
在清华科技园办公室的展厅里,一面标注着“AGI演进时间线”的展板格外醒目:以一条通向“2030AGI”的轨道为时间轴,团队为实现这一目标所付出的探索与实践依次铺陈——从参与“悟道”大模型项目、发布MiniCPM系列模型,到推出法信法律基座大模型、打造首个汽车纯端侧智能助手,清晰勾勒出向AGI迈进的技术发展脉络。
“面壁智能自孵化之初即以科技创新为内核,这与清华实验室培育顶尖人才的目标本质相通——共同致力于AGI的终极目标,仅存在分工差异且形成优势互补。”在刘知远看来,高校实验室如“创新苗圃”,专注单点技术突破,为产业输送前沿思路;面壁智能则像“技术转化工厂”,整合数据处理、工程化开发等全链条环节,让学术成果在复杂系统中实现价值落地。这种“源头创新-工程转化”的协作模式,如同精密齿轮高效咬合,共同驱动AGI目标稳步推进。
从象牙塔到产业前沿,另一个不变的初心是“做最好模型”。面壁智能的英文名“Model Best”,正是这一追求的直白诠释。“其实我们当时是先想到了英文名,它表达的愿景非常明确—— 我们就要做这个世界上最好的大模型。”刘知远解释道。
在确定了英文名“Model Best”后,团队希望中文名也能对应地用“M”“B”作为拼音首字母。在构思过程中,“面壁”一词脱颖而出。
一方面,“面壁”取自周恩来总理创作的七言绝句《大江歌罢掉头东》中的“面壁十年图破壁”,刘知远解释道:“研发AGI需长期沉潜,正如‘面壁’般专注执着,最终实现技术突破。”而另一方面,创始人都是三体迷,“面壁计划在小说中象征着人类面对重大挑战时凝聚的最高智慧与战略,这与团队追求AGI的终极目标高度契合,具有使命感与神圣感。”
cpmGO的成功落地,只是面壁智能在端侧大模型领域战略布局中的一个节点。从2024年推出的轻量高性能端侧化模型 MiniCPM系列,到与高通、Intel、MediaTek、德赛西威、中科创达、梧桐车联、安波福等产业标杆企业英特尔、中科创达联合开发车载GUI智能体携手推动“端侧大模型上车”,并与长安汽车、上汽大众汽车、长城汽车等顶级车企合作实现多款量产车型定点,这家成立仅三年的初创公司正以惊人的节奏推进技术突破。
支撑这些落地方案的,是团队在基础理论研究上的持续深耕。2024年7月,刘知远在世界人工智能大会上首次提出“知识密度”概念,将其定义为“单位参数承载的知识量”,颠覆了行业对模型规模只追求模型参数的固有认知。五个月后的中国人工智能大会上,该理论升华为“密度定律”(Densing Law)——类似芯片行业的摩尔定律,揭示了大模型能力密度每100天翻倍的指数级进化规律。这意味着在同等性能下,模型体积和推理成本正以超乎想象的速度缩减。
当几乎整个AI行业都在追逐“规模越大性能越强”的规模法则(Scaling Law)时,面壁智能却选择了一条与众不同的技术路径——聚焦“知识密度”,用更少的参数实现更强的能力。
“首先需要肯定,OpenAI遵循的Scaling Law在特定技术条件下具有合理性,”刘知远坦言,过去五年间大模型参数量从2018年的千万级增长到2024年的数千亿级,证明模型规模扩大确实能提升知识容量。
“然而,若将‘模型越大越好’视为无条件真理,这种发展模式不可持续。”他通过两个生动比喻解释:从生物进化的视角,人类大脑演化并未走向无限增大,骨盆结构对新生儿头颅尺寸的限制,体现了生物系统对物质条件的适应性平衡;而回顾芯片产业的发展历史,过去八十年芯片进步的核心并非物理尺寸扩大,而是通过制程工艺迭代,在单位面积实现电路密度指数级提升,最终推动计算设备从巨型机向便携终端的革命。
“当前大模型发展面临相似的约束条件:2024年训练GPT-4.5级别的模型已经大约需要十万张GPU,成本突破10亿美元,若延续参数规模千倍级增长的路径,未来算力消耗与经济成本将达到不可承受的程度。”刘知远强调,“因此,大模型的演进方向应从‘单纯扩大规模’转向‘提升知识密度’,通过技术创新在相同或更小的参数量基础上实现更强的智能涌现能力。”
这正是面壁智能躬身实践的方向。2024年,其推出的MiniCPM-2.4B模型仅用24亿参数,在MT-Bench等评测中超越70亿参数的Mistral-7B,相当于用一部手机的存储空间承载超级计算机的智慧。
从“知识密度”到“密度定律”,技术战略选择背后更深层的是面壁智能对普惠愿景的坚守。刘知远坦言,团队早期也曾探索云端大模型研发,但逐渐意识到单纯追逐参数规模的模式难以实现“让AI飞入千家万户”的初心。
“我们目标其实是一直没有变过,就是《周易》所说的‘智周万物,道济天下’——让大模型飞入千家万户,让AI技术融入人类生活的方方面面。”刘知远解释道,这一愿景的本质,是希望通过技术创新使大模型足够廉价、普惠,成为所有人都能便捷使用的工具,而非少数机构的专利。
所以对于面壁智能来说,实现AGI并不足够,关键是要让AGI技术足够廉价普惠。刘知远说,“我们始终坚信,这种普惠性才是智能时代的底层逻辑——正如互联网的价值在于连接所有人,大模型的终极意义也在于服务所有人。”
2025年中关村论坛上,面壁智能参与研发的“法信法律基座大模型”作为国家级法律AI基础设施被评为十大科技成果发布之一。该模型依托清华大学千亿参数通用大模型基座,融合最高人民法院“法信”平台3.67万亿字法律专业语料与18万法律知识体系编码,成为司法智能化转型的核心引擎。
刘知远(左4)作为联合研发团队代表出席“法信法律基座大模型”最高法发布会
这一突破在司法场景成效显著:深圳中院应用的辅助审判系统覆盖立案、阅卷、文书生成等85项流程,试运行期间辅助立案29.1万件,辅助生成裁判文书初稿1.16万份,审判效率提升超50%。目前,该模型已覆盖民事、行政、刑事三大诉讼全流程,并在全国多省市试点应用,推动司法资源向基层下沉。
用AI赋能行业,法律大模型是面壁智能实现技术普惠目标的关键抓手。正如面壁智能CEO李大海所言,一个行业的高质量数据,就能快速赋能该行业打造基座大模型。法律领域的独特优势在于,法律条文、裁判文书、案例库等高度结构化的文本数据为专业化训练提供了优质语料;立案、审判、文书生成等标准化流程与AI技术天然契合,能显著提升效率。
选择法律作为突破口,更深层原因在于AI对职业生态的重构价值。当前中国法院系统面临“案多人少”的突出矛盾——经济发展带来诉讼量激增,而“员额制”改革使法官编制固定。数据显示,法官超六成的日常事务属于机械性工作,高强度重复劳动是人才流失的一大原因。“AI的作用是将这类机械性任务自动化,使法官得以聚焦疑难复杂案件,”刘知远强调。
面对“AI取代人类职业”的争议,刘知远提出全新视角:“所谓伦理挑战本质是社会对职业变迁的适应性问题。”以美术设计行业为例子,AI工具普及减少了功能性设计岗位,但创意性岗位需求激增,“这与工业革命中机器替代体力劳动的逻辑一致——技术淘汰低附加值岗位,催生更高价值工作。”
当重复性脑力劳动被机器承担,法官、医生、教师等职业将摆脱低效事务,专注于疑难案件的人性化裁决、复杂病情的综合诊疗等需要人类经验、创造力和情感判断的工作,“这本质上是技术进步对‘人性价值’的回归——让人类从机械劳动中解放,从事更具尊严和创造性的活动,”他总结道。
刘知远提出的另一个看待AI的新视角,在于AI对人类知识范式的革命性重塑。“当前人类正面临‘知识茧房’困境:全球知识总量呈指数级增长,但个体终身能掌握的知识比例却在急剧下降,”他解释道,几百年前的“博物学家”能通晓多领域知识,而现代学者往往局限于细分领域——这种专业化虽推动技术进步,却也导致跨学科创新愈发困难。
而AI的核心价值在于,“通过高效处理和整合全人类知识,帮助个体突破生物限制,变相掌握远超自身记忆能力的信息,使普通人能站在知识前沿进行探索。”对于在探索人类知识边界的科研工作者,这种加速效应更为显著,“在高能物理、蛋白质结构解析等依赖海量数据的领域,AI可替代人类完成重复性分析工作,推动科研从‘拼图式积累’转向‘系统性突破’,避免人类因知识过载陷入创新停滞。”
作为清华大学计算机系副教授,刘知远正在校内开展着“AI+教育”的先锋试验。其团队牵头研发的“清小搭”智能伴学系统,基于大语言模型与知识图谱技术,构建覆盖学业辅导、科研创新、职业规划的全场景服务。截至2025年8月,系统累计注册学生近1.4万人,累计提问问题数超过24.3万次,成为清华学生的“数字学习伙伴”。
刘知远团队还与教育研究院合作开发了MAIC(Massive AI Empowered Courses)平台,通过多智能体系统实现教师备课、授课、答疑全流程AI化。2024年春季试点课程互动超10万条,学生满意度达92%;2025年新开设的《迈向通用人工智能》通识课,更尝试“用AI教授AI”的方法——借助智能体实现个性化教学,首轮课程获84%学生积极评价。
“AI的本质是人类创造的算力工具,其发展应始终服务于拓展认知边界。”刘知远总结道,“正如计算机延伸了人类智力,AI将成为人类突破生物限制、实现知识升维的‘认知外骨骼’。”
全球AI行业持续高热,教育部数据显示,2025年新增人工智能本科专业的高校达217所,计算机科学相关专业招生占比攀升至18.7%;就业市场同步升温——猎聘数据显示,AI技术岗硕博学历需求占比46.98%,50万年薪以上职位占比30.97%,算法工程师需求连续两年居首。
对于这场浪潮中的学习者和探索者,刘知远以研读《论持久战》的体悟给出了寄语:“从我个人经历与多年带学生的观察,在AI领域发展应该注重‘战略’层面的思考,而非具体‘战术’细节。”他解释,投身这个领域的首要问题是厘清内在动机——是追逐行业热潮,还是源于对技术本质的热爱与解决真实问题的渴望?
“回顾2000年互联网泡沫、建筑与金融行业的兴衰,历史经验告诉我们,任何领域都会经历周期波动,AI也不例外。”刘知远坦言,若仅因行业“火热”而进入,当发展遇冷时极易动摇;而人的黄金职业周期不过30年左右,频繁转向终将难成专精。
他更主张一种长期主义的职业观:“真正的坚持需要内生动力——相信AI技术能够推动人类认知进步的信念。这种信念会转化为面对挫折的韧性,支撑个人在行业低谷期持续深耕,最终形成不可替代的核心优势。”
在“战略”上坚定的人才,才更有可能打赢AGI的持久战。以2020年GPT-3作为智能革命的起点,依据密度定律估算,人类社会将在2033年左右迎来AGI。“这个进程我们已经走完三分之一了,因此接下来的十年将至关重要”,刘知远解释。
这种紧迫感,更源于对中国科技创新阶段变迁的深度认知。回顾过去二十年,他指出我国技术发展经历的代际跨越:21世纪伊始的十年,硅谷模式的“Copy to China”运动催生出新浪、百度等第一代互联网企业;随后的十年间,移动互联网浪潮推动“模式创新”井喷,外卖、移动支付、短视频等应用在全球市场开疆拓土,却始终被他国视为“技术应用者”而非“原创者”;步入2020年,质变逐渐发生——国产航母下水、第六代战机试飞、黑神话引爆技术美学、DeepSeek突破算法瓶颈……中国正从模式创新迈向硬科技创新,在AI、芯片、航空航天等领域输出原创技术。
“这不是偶然,而是历史必然。”刘知远解释道,“五千年中华文明始终是技术创新的贡献者,四大发明曾重塑人类文明进程,今天的我们没有理由停留在技术追赶阶段。进入AI时代,中国完全有能力成为技术定义者。”
在清华科技园的办公室里,刘知远身后的书架上,《三体》全集与《论持久战》并列;办公桌对面的墙壁上,一副对联静静舒展:“面壁凝然悟玄理,归来燃却百千灯”,理想主义与实干精神在这里交织。
清华大学是国内最早开展人工智能教学和科研的高校之一。自20世纪70年代至今,学校在人工智能人才培养和科学研究方面积淀深厚,始终注重理论研究与实际应用的深度融合,众多清华人已成为推动我国人工智能领域科研创新与产业发展的中坚力量。
2025年8月出版的《水木清华》AI专刊(2025年第3-4期合刊),特别报道了近50个具有广泛影响力的清华校友AI企业及平台,以及多位院士、教授、行业专家对人工智能时代多维度的思考与建议,展现了清华人在引领智能变革、赋能经济社会创新发展中的重要作用与贡献。


