AL123 人文社科会员免费专区文学 2025-08-20

DeepSeek：打开财富密码_陈根_AZW3_MOBI_EPUB_PDF_电子书（无页码）_陈根

内容节选

第2章普惠AI的“中国方案” 2.1 AI领域的拼多多提到拼多多，很多人的第一反应，可能就是“白菜价”、“砍一刀”或者“农村包围城市”的商业模式。现在，AI界也迎来了一个类似的“搅局者”——DeepSeek。这家中国人工智能公司，以极致性价比搅动了整个AI市场，因此被称为“AI领域的拼多多”。那么，DeepSeek到底是怎么成为AI领域的拼多多的？它的崛起，为什么就引发了整个国际科技界的震动，这又让我们看到了什么？ 2.1.1 白菜价的大模型 DeepSeek之所以被称为AI领域的拼多多，其实就是因为它的策略和拼多多的成功路径非常相似。拼多多的崛起并非靠着传统电商的打法，而是另辟蹊径，依靠“价格便宜、够用就行、农村包围城市”的策略打开市场；而DeepSeek在AI领域的崛起，恰恰也体现了类似的逻辑。拼多多最吸引人的地方就是便宜，这是它能够在淘宝、京东等巨头盘踞的市场中杀出一条血路的关键。 DeepSeek在AI界也是一样的，主打极致性价比。目前，AI模型的训练成本极其昂贵，OpenAI CEO山姆·奥特曼曾表示，GPT-4的训练成本大约1亿美元（约合人民币7.3亿元），未来训练大模型的成本将高于10亿美元。尚未完成训练的GPT-5大模型，为时约半年的一轮训练就消耗了大约5亿美元，可见AI公司的支出成本有多高。这种超高成本就意味着，一方面AI几乎是巨头们的专属技术；另一方面AI巨头们必然需要通过昂贵的API订阅和付费服务来回收投入，这就导致AI的应用门槛越来越高，普通用户很难享受到最先进的AI能力。而DeepSeek的出现，打破了这种局面。DeepSeek把模型训练成本压缩到极致，根据公开数据，DeepSeek-V3模型的训练成本仅为557.6万美元（约合人民币4070万元），大概是GPT-4的1/20，总计约消耗278.8万个GPU小时，参数为6710亿个，单token激活参数为370亿个。更关键的是，DeepSeek是完全免费开放的，这直接降低了开发者和企业接入AI的门槛。在过去，如果一家创业公司想要用AI技术来改进自己的产品和工作流，通常要花高价去调用AI巨头的API。而DeepSeek类似于拼多多“9.9包邮”的策略，让AI能力变得触手可及。AI用户不需要再为昂贵的API调用费发愁，甚至可以本地部署DeepSeek模型实现免费使用。这种做法直接打破了传统AI巨头对市场的垄断，让AI不再是少数大公司的专属工具，而是可以被更多的中小公司甚至个人开发者使用。 DeepSeek的模型虽然便宜，性能却不差，甚至可以说是超级好。DeepSeek的DeepSeek-V3模型，在多个基准测试中表现出色（见图1）。举例来说，DeepSeek-V3在大规模多任务语言理解MMLU和MMLU-Pro等测试中表现优异。其表现不仅与Claude-3.5-Sonnet接近，还超越了GPT-4o。在中文任务（C-Eval、C-SimpleQA）上，DeepSeek-V3的表现尤其出色，展现了其在语言理解和多语言处理能力上的领先优势。图1 DeepSeek-V3与主流模型在各类基准测试中的表现对比不仅如此，DeepSeek-V3在代码生成（HumanEval-Mul）、逻辑推理（DROP）和长文本处理（LongBench v2）等复杂场景中也展示了强大的专业性。特别是在数学任务（如CNMO 2024）上的突出表现，展示了DeepSeek-V3对专业任务的支持能力。既便宜又好用，DeepSeek受到欢迎自然不让人意外。举个简单的例子，如果一家中小企业想要增加智能客服、自动生成营销文案或者做一些基础的数据分析，通常的选择就是接入现有的大模型。但GPT-4的API价格相当昂贵，而DeepSeek的开源模型则提供了一个更便宜、更灵活的选择——中小企业完全可以把DeepSeek模型下载到自己的服务器上运行。这样不仅可以节省API调用费，还可以根据自己的需求进行模型优化。对个人开发者来说，DeepSeek更是一种福音。过去，如果个人开发者想要搭建一个AI应用，大多数情况下只能依赖AI厂商的API。这不仅意味着每次调用都要花钱，而且还可能受到各种限制，如访问速度、数据隐私风险、API调用次数等。而DeepSeek不仅让API的使用成本降到了“白菜价”，更是直接对大模型进行了开源，让个人开发者可以完全自主地运行AI模型，不用再受制于商业公司。对于科研人员来说，DeepSeek的出现更是极大降低了AI研究的门槛。在传统的AI研究中，许多高性能模型都是封闭的，如GPT-4和Gemini Ultra，研究人员只能通过有限的API调用进行实验，有时连模型的架构都无法完全了解。而DeepSeek的开源策略使得科研人员可以自由地使用和研究它的模型，从优化......