作者 | 王秋凤
DeepSeek给汽车AI开发带来什么启发?
自从1月20日DeepSeek(深索)大模型发布R1版,很多人都表示在与DeepSeek对话中沦陷了,同样多的人表示从未见过如此聪明的大模型。
不只是国内,整个春节期间DeepSeek狂潮席卷全球,下载量持续在各国各平台居榜首。所有自认在AI上拥有利益边界的实体(包括政府、学术界、产业界)和自然人都行动起来,采取对自己最有利的策略,跟进、学习、对冲、折冲、抵制、诉讼……总之,人类对待新科技的世间百态,都在这两周时间里充分展现。单从舆论影响力角度,DeepSeek都超越了OpenAI公司ChatGPT模型迄今最强的o2版本(2024年5月发布),成为现象级AI应用。
汽车企业也忙乱起来,他们倒没有抵制的想法,都在琢磨如何与DeepSeek有关联,至少不能让自己显得落伍。“接入”是很容易的,类似我们在手机上装个App。到目前为止,DeepSeek对汽车带来的影响都是潜在的。大家隐约觉得汽车AI的应用,已经产生了新的路径或者方法论,但具体如何做,暂时还来不及提出更多想法。
DeepSeek打破了AI投资逻辑
DeepSeek团队也承认,稍早一点的V3版本,比不过ChatGPT的o2版本,但R1版本在语义理解和推理能力上,与o2相当。比较重要的有两点,DeepSeek是开源的,只用了几百块二流GPU(可能是H800,或者H20),花了550万美元,就训练出V3。和ChatGPT动辄几亿美元的迭代成本,相差两个数量级。更重要的是,DeepSeek迭代太快了,只有两周左右,而ChatGPT迭代一次花半年。即便后者领先,几个回合下来,很可能落后(当然不能把训练成果视为线性能力增长)。
大家都说DeepSeek太香。对于个人来说,DeepSeek香就香在免费且好用(以Token计价的API也比对手便宜得多)。OpenAI的CEO山姆·奥特曼很尴尬地取消了每月200美元月租,并紧急上线了o3 mini版,应对前者挑战。奥特曼甚至表示OpenAI走错了路,站在多数人的对立面。OpenAI一开始是开源的,现在则是闭源。有人讥讽他领导的企业应称为“CloseAI”。
DeepSeek的开源策略,让除了中美以外、原本在AI竞争中毫无希望的国家和企业,都能部署大模型。他们一定会采用开源模型,而不会追随OpenAI,让后者依靠提供AI服务,每月割韭菜。当与全世界逆行之后,“小院高墙”很难维持。美国一系列反应(比如制定下载和使用DeepSeek为重罪的法律条文),尚处于悲伤五步曲(否认、愤怒、妥协、沮丧、接受)中的第二步。
DeepSeek的固定套路
以上可以看出,我们非常强调版本。原因在于,至少DeepSeek两个版本之间,从人的角度看过去,AI表现有质的差异。
在此之前,很多大模型或者AI助手,回答的都像模像样,但你要认为它真知道,很可能错了,因为很多内容都是胡编的。矩阵算出来的Token是啥,就输出啥。
在这里解释一下token,这个概念在AI大模型里很重要,但不是大模型首先应用的。如果搜索一下,这个词被翻译成“令牌”,简直不知所云。AI重构了很多“熟词”,赋予其新的意思,让没有基础的人难以理解(蒸馏也是一样)。token应该翻译成“基本语义”或者“词元”。它是跨语种的,汉语一个词(也可能是一个单字)就可以提炼出一个token(多义对应不同的token);而英语或拉丁语,可能一个单词包含一个或多个token(众所周知,英语是典型的多语种代码屎山)。所以,大模型天生都是多语言高手,但底层思考逻辑则要偏向特定语言体系。
所有的语义大模型,先要做的工作,就是将语言拆解成token,比如DeepSeek的V3就有12.9万个token(依赖分词算法)。然后将token做成一维数组,只不过这个数组的元素量相当大,一个token通常转化好几千“元素”构成的一维向量。所谓“大模型”,首先就大在这里。
具体算法不展开(称之为“嵌入”算法,形成矩阵),到这里,就完成了自然语言“数学化”的过程。剩下的,从输入语义(我们提问)到输出(大模型给出答案),都是数学计算过程。输入语义会被大模型,由一维数组(token)组成多维矩阵,思考过程就是矩阵做运算(加或者乘),并依靠参数矩阵(训练结果),形成中间矩阵和最终矩阵。
最终矩阵就是大模型给出的答案。中间矩阵在人类看来,就是思考过程。我们看到,DeepSeek在给答案之前的分析思考过程,就是多个中间矩阵,相当于解题的中间过程。
从V3到R1,不难发现,DeepSeek“深度思考”的能力急剧攀升。自言自语的过程很像人的思考模式。不需要人在中间提示,就能自己运用多种手段,找到最终答案。
有人给这种变化起了个名字,叫“顿悟”。和当初ChatGPT从3.5到4.0的“涌现”对应,实际上就是思维链越来越长,逻辑越来越严谨。而消除语言混乱则依靠训练系统的评分制。
在这些天的使用中,DeepSeek答案文本的样子大家都看熟了,套路也被大体摸清了。如果一个问题,能通过已有的思考范式处理,那么结果相当准确而且丰富;反之则有点敷衍了事的感觉;第三种情况,如果一个问题有多重路径,那么可能明显依赖特定路线。相比而言,资料库陈旧什么的,可以通过联网搜索解决,不是问题。
路线分歧
全世界都知道DeepSeek开源。开源开的是权重和推理的源代码。所谓“权重”即人类知识的压缩,而推理就是它本来的意思。而训练代码(就是能够生成参考矩阵的部分),不会被开源。所有人都可以抄袭DeepSeek的推理过程,用自己的训练方法,构成自己的大模型。总体而言,训练比推理难得多。
经过最初的慌乱之后,OpenAI开始指责DeepSeek“蒸馏”自己的数据。这个词也多次被引用,其意思就是用其他大模型的输出数据作训练集,进一步压缩权重。除了最初的大模型,所有大模型都不可避免地蒸馏其他模型,也算是个后发优势吧。
DeepSeek的核心技术有两个:自己生成的训练矩阵、独创的高效推理结构。而这两者都基于token的解析方式。这方面,中文的多义性和高信息熵提供了底层优势。
都是大模型,两者走上了不同的进化路线。ChatGPT对算力的运用是相当奢靡浪费的,因为它拥有美国的算力硬件霸权,带来的附加优势是算法可以很简单。而中企因为算力卡被卡脖子,只能极力挖掘算法,以信息的高压缩率换取对硬件较少的依赖。高压缩率精度损失很少,不算代价。
这两种路线各自演进,变成了今天这样的局面:中企带着全世界绝大多数国家和企业,在开源生态下走相近技术路线。而美国则继续堆高算力边界,割盟友的韭菜。近期宣布禁止或限用DeepSeek的国家,都是瓦森纳协议成员。他们各自的企业,特别是云服务商和开发环境服务商,接入DeepSeek是早晚的事,有些已经接入了。
国内企业第一批接入DeepSeek的,是云服务商。目前所有主流公有云,都已接入。AI三要素:算力、算法、数据,后两者结合,能不能降低对前者的依赖,这是所有被卡脖子的企业,包括正在谋求堆算力的车企和供应商,都非常关心的问题。换句话说,智舱和智驾被确立为汽车核心竞争力之后,第一次遇到路径问题。
车企还未评估清楚DeepSeek影响力
将这个问题抛给Deepseek,后者给出的回答,也大体上基于算法的。DeepSeek表示,在多模态感知融合、智能决策算法、边缘计算优化、持续学习架构上,它可以“帮忙”训练智驾系统。这不是说,DeepSeek直接构成一个训练矩阵,供智驾系统使用,而是从方法和数据预处理上,大幅度压缩数据权重,让智驾对算力的需求降低。
看来,中国人发明的大模型,已经将“降低对算力依赖”的诉求,渗透到固有逻辑链,无时无刻都用这条标准卡。这种类似混合专家系统(MoE),对于简化数据,降低场景复杂度,具有现实意义。
DeepSeek透过对自然语义和其他逻辑规则的理解,谋求用数学方法解决以上所有问题。智驾则是将场景数字化之后,也转化为数学问题,利用经过训练的深度学习决策模型,形成规控指令。穿透了表层之后,两者实际上做的是同一类事情,方法也有很多相似之处。
DeepSeek将自己定位为“智驾训练”的助手和参考集,不是谦虚(它没有人的情感),而是没有认识到两者在底层构造上的共同点。这就引出了DeepSeek这类大模型的局限性:一旦逻辑层数超过一定数量(比如超过4层),DeepSeek现有逻辑链无法触及隐藏在底层的答案。不过,这可以扩张参数量和优化训练模型来解决。也就是说,如果谋求再度提升逻辑能力,算力这道坎,并不能一直绕过去。
近期看,DeepSeek这类大模型,可以帮助缩短软件开发周期,降低智驾智舱系统的误检率;长远看,有望构建车路云一体化智能体系,并组建以车为节点的百万级信息共享网络(基本上是一座大城市的保有量)。
截止2月6日,已经有多家车企宣布在智舱交互端侧接入DeepSeek,但在智驾端侧,尚无接入的消息。很多人怀疑DeepSeek在汽车产业的商业价值,的确现在没有好的商业模式。但它的价值在于打破了美企(尤其是美股“七姐妹”)的商业逻辑。
这就意味着,买了一大堆算力卡的主机厂商,反而面临短期的、潜在的商业价值走低问题。但从长期看,这笔钱可能不会白花。
当前,汽车AI的走向,感受到DeepSeek开发的“偏转力”。孙正义和奥特曼所谓“算力越多,智能越高”的线性关系妄想已被打破,但车控和交互端侧的训练矩阵,在可见的未来,很难依靠蒸馏数据、降低权重的方式避开算力负荷。如果DeepSeek再往前一步,对算力的需求,可能要上升一个数量级。像英伟达这样的算力卡供应商,虽然不会如他们构想的那样呼风唤雨,但对汽车AI的部署仍是不可或缺的。
作者简介
王秋凤,先后就职于《经济观察报》、《第一财经日报》等主流平面媒体,搜狐汽车新闻中心、腾讯汽车等主流互联网平台,前北汽极狐汽车总裁,现任快手汽车负责人,中国汽车记协常务理事。
- E N D -