微信扫码
添加专属顾问
我要投稿
DeepSeek如何以545%利润率逆袭OpenAI?揭秘其背后的黑科技! 核心内容: 1. DeepSeek-V3/R1推理系统概览:理论成本利润率高达545%,日赚346万人民币 2. 专家并行(EP):将模型分散到多级多卡上并行计算,实现更大吞吐、更低延迟、更省成本 3. 计算通信重叠、负载均衡等技术,榨干每一块GPU,单块H800吞吐量突破73.7k tokens/s
开源周连发五天,正当大家以为DeepSeek要收工时,它突然在知乎甩出一个彩蛋:《DeepSeek-V3/R1推理系统概览》。
原文:https://zhuanlan.zhihu.com/p/27181462601
弱弱说一句,DeepSeek刚入住知乎,这是第一篇也是唯一一篇文章,已收获粉丝2.2万。
看完之后,只有一句,牛逼!
文章直接明牌——理论成本利润率高达545%,比OpenAI便宜几十倍,还能日赚346万人民币。
下面给大家分享下这篇文章的主要内容。
——推理系统如何榨干每一块GPU?
DeepSeek这次公开的推理系统,目标简单粗暴:更大吞吐、更低延迟、更省成本。
专家并行(EP):传统大模型,一块GPU干所有活。DeepSeek的专家并行(EP)则把模型分散到多级多卡上并行计算。白天高峰时,278个节点(每节点8块H800 GPU)全力推理;夜间闲置时,直接切到研发训练,硬件利用率拉满。
计算通信重叠:跨节点协作最大的问题是通信延迟。DeepSeek的操作是:让计算和传输同时进行!
负载均衡:系统里最怕有的GPU累死,有的闲死。DeepSeek设计了三套动态均衡器:
最终单块H800的吞吐量:
DeepSeek技术开源如火如荼,OpenAI却给出了个那样的GPT-4.5。
真像别人说的:以前OpenAI负责技术,DeepSeek负责高情商,现在,反过来了。
哦不对,DeepSeek贴吧老哥一样的情商,GPT-4.5估计还达不到。
以下是最近开闭源动作的合订本,方便大家了解(参考知乎“吕阿华”回答)。
DeepSeek开源的技术很牛,但我感觉更牛的是:它证明了,除了“创意-PPT-讲故事”的模式外,专注于技术研发同样能够走向成功。
虽然成功的不是我,但同行者的光芒已经照亮了前行的路。
大家继续加油!
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-11-01
零一万物联合开源中国推出OAK平台,目标打造Agent世界的“基础设施”
2025-11-01
Unsloth发布Qwen3-VL本地运行和微调指南,修复隐藏bug
2025-10-31
Google DeepMind揭秘:开源AI模型如何泄露训练秘方
2025-10-31
有人问我会不会用 AI,我直接拿出这个 Ollama + FastGPT 项目给他看
2025-10-30
开源可信MCP,AICC机密计算新升级!
2025-10-30
OpenAI 开源了推理安全模型-gpt-oss-safeguard-120b 和 gpt-oss-safeguard-20b
2025-10-29
刚刚,OpenAI 再次开源!安全分类模型 gpt-oss-safeguard 准确率超越 GPT-5
2025-10-29
AI本地知识库+智能体系列:手把手教你本地部署 n8n,一键实现自动采集+智能处理!
2025-08-20
2025-09-07
2025-08-05
2025-08-20
2025-08-26
2025-08-22
2025-09-06
2025-08-06
2025-10-20
2025-08-22
2025-10-29
2025-10-28
2025-10-13
2025-09-29
2025-09-17
2025-09-09
2025-09-08
2025-09-07