DeepSeek:打开财富密码_陈根_AZW3_MOBI_EPUB_PDF_电子书(无页码)_陈根

内容节选

第2章 普惠AI的“中国方案” 2.1 AI领域的拼多多 提到拼多多,很多人的第一反应,可能就是“白菜价”、“砍一刀”或者“农村包围城市”的商业模式。现在,AI界也迎来了一个类似的“搅局者”——DeepSeek。这家中国人工智能公司,以极致性价比搅动了整个AI市场,因此被称为“AI领域的拼多多”。 那么,DeepSeek到底是怎么成为AI领域的拼多多的?它的崛起,为什么就引发了整个国际科技界的震动,这又让我们看到了什么? 2.1.1 白菜价的大模型 DeepSeek之所以被称为AI领域的拼多多,其实就是因为它的策略和拼多多的成功路径非常相似。拼多多的崛起并非靠着传统电商的打法,而是另辟蹊径,依靠“价格便宜、够用就行、农村包围城市”的策略打开市场;而DeepSeek在AI领域的崛起,恰恰也体现了类似的逻辑。 拼多多最吸引人的地方就是便宜,这是它能够在淘宝、京东等巨头盘踞的市场中杀出一条血路的关键。 DeepSeek在AI界也是一样的,主打极致性价比。目前,AI模型的训练成本极其昂贵,OpenAI CEO山姆·奥特曼曾表示,GPT-4的训练成本大约1亿美元(约合人民币7.3亿元),未来训练大模型的成本将高于10亿美元。尚未完成训练的GPT-5大模型,为时约半年的一轮训练就消耗了大约5亿美元,可见AI公司的支出成本有多高。 这种超高成本就意味着,一方面AI几乎是巨头们的专属技术;另一方面AI巨头们必然需要通过昂贵的API订阅和付费服务来回收投入,这就导致AI的应用门槛越来越高,普通用户很难享受到最先进的AI能力。 而DeepSeek的出现,打破了这种局面。DeepSeek把模型训练成本压缩到极致,根据公开数据,DeepSeek-V3模型的训练成本仅为557.6万美元(约合人民币4070万元),大概是GPT-4的1/20,总计约消耗278.8万个GPU小时,参数为6710亿个,单token激活参数为370亿个。 更关键的是,DeepSeek是完全免费开放的,这直接降低了开发者和企业接入AI的门槛。在过去,如果一家创业公司想要用AI技术来改进自己的产品和工作流,通常要花高价去调用AI巨头的API。而DeepSeek类似于拼多多“9.9包邮”的策略,让AI能力变得触手可及。AI用户不需要再为昂贵的API调用费发愁,甚至可以本地部署DeepSeek模型实现免费使用。这种做法直接打破了传统AI巨头对市场的垄断,让AI不再是少数大公司的专属工具,而是可以被更多的中小公司甚至个人开发者使用。 DeepSeek的模型虽然便宜,性能却不差,甚至可以说是超级好。DeepSeek的DeepSeek-V3模型,在多个基准测试中表现出色(见图1)。 举例来说,DeepSeek-V3在大规模多任务语言理解MMLU和MMLU-Pro等测试中表现优异。其表现不仅与Claude-3.5-Sonnet接近,还超越了GPT-4o。在中文任务(C-Eval、C-SimpleQA)上,DeepSeek-V3的表现尤其出色,展现了其在语言理解和多语言处理能力上的领先优势。 图1 DeepSeek-V3与主流模型在各类基准测试中的表现对比 不仅如此,DeepSeek-V3在代码生成(HumanEval-Mul)、逻辑推理(DROP)和长文本处理(LongBench v2)等复杂场景中也展示了强大的专业性。特别是在数学任务(如CNMO 2024)上的突出表现,展示了DeepSeek-V3对专业任务的支持能力。 既便宜又好用,DeepSeek受到欢迎自然不让人意外。 举个简单的例子,如果一家中小企业想要增加智能客服、自动生成营销文案或者做一些基础的数据分析,通常的选择就是接入现有的大模型。但GPT-4的API价格相当昂贵,而DeepSeek的开源模型则提供了一个更便宜、更灵活的选择——中小企业完全可以把DeepSeek模型下载到自己的服务器上运行。这样不仅可以节省API调用费,还可以根据自己的需求进行模型优化。 对个人开发者来说,DeepSeek更是一种福音。过去,如果个人开发者想要搭建一个AI应用,大多数情况下只能依赖AI厂商的API。这不仅意味着每次调用都要花钱,而且还可能受到各种限制,如访问速度、数据隐私风险、API调用次数等。而DeepSeek不仅让API的使用成本降到了“白菜价”,更是直接对大模型进行了开源,让个人开发者可以完全自主地运行AI模型,不用再受制于商业公司。 对于科研人员来说,DeepSeek的出现更是极大降低了AI研究的门槛。在传统的AI研究中,许多高性能模型都是封闭的,如GPT-4和Gemini Ultra,研究人员只能通过有限的API调用进行实验,有时连模型的架构都无法完全了解。而DeepSeek的开源策略使得科研人员可以自由地使用和研究它的模型,从优化......

  1. 信息
  2. 内容简介
  3. 前言
  4. 第1章 DeepSeek的前世今生
  5. 第2章 普惠AI的“中国方案”
  6. 第3章 实战DeepSeek:从入门到精通
  7. 第4章 DeepSeek引领AI商业新浪潮
  8. 第5章 DeepSeek时代行业新图景
  9. 第6章 新的挑战,新的机遇
  10. 后记 创业者精神才是创新原动力