我要投稿

Ray开启AI原生时代的到来：这是AI领域的“Hadoop时刻”

发布日期：2025-12-07 10:52:59 浏览次数： 2017

作者：译数据

微信搜一搜，关注“译数据”

当我们回顾计算机发展的历史，会发现一个清晰的规律：每一个计算时代，都建立在一个全新的计算堆栈之上，并由一个为该时代量身定制的“计算引擎”所驱动。

在客户机/服务器时代，是以Windows Server或Unix为核心；在互联网时代，是LAMP架构（Linux, Apache, MySQL, PHP）；在移动云时代，是容器化（Docker/Kubernetes）和大数据（Hadoop/Spark）。

而现在，我们正站在一个新的起点：AI原生时代（AI-Native Era）。

在这个时代，所有的应用、所有的基础设施，都在围绕AI模型重构。而Ray，正是这个AI原生时代的“计算引擎”。

在Ray Summit 2025上，Anyscale的联合创始人兼执行主席Ion Stoica深刻地指出了当下的痛点。很多企业面临“创新者的窘境”，试图通过“搬运（Lift and Shift）”的方式，将现有的Web架构强行套用在AI应用上。

然而，AI工作负载与传统的微服务有着本质的区别。面对构建AI堆栈，你只有三个选择：

为什么必须是Option 3？因为AI的底层逻辑变了。

首先，硬件变得极度异构化。不再是单纯的CPU集群，而是CPU、GPU、TPU以及各种AI加速器的混合体，配合着RDMA和高速网络互连。

(图：多模态数据，经历预训练、推理、强化学习等处理流程，涉及到多种类型的算力资源)

(图：跨节点的算力资源调度复杂度)

其次，处理流程变得极度复杂。过去我们认为的数据处理（CPU）、训练（GPU）、推理（单节点）的界限正在模糊。现在的AI管道是多模态的：数据处理需要GPU加速，后训练（Post-training）和强化学习（RL）需要异构计算，而推理（Inference）正在变成复杂的分布式系统。

正是为了解决这种复杂性，Ray应运而生。

故事要回到2016年的UC Berkeley，当时Robert Nishihara, Philipp Moritz和Ion Stoica正在研究强化学习（Reinforcement Learning）。他们发现现有的工具根本无法满足RL所需的动态、分布式和低延迟要求。于是，他们构建了Ray。

(图：Ray的创始团队在2016年的UC Berkeley，Ray最初是为了解决最复杂的强化学习问题而生)

Ray的核心优势在于它填补了底层硬件（Kubernetes, GPUs）与上层应用框架（PyTorch, vLLM, Hugging Face）之间的巨大鸿沟。

(图：Ray位于AI堆栈的核心位置，向下管理异构硬件，向上支撑AI应用)

Ray不仅是一个简单的调度器，它是AI原生堆栈的计算引擎。它提供了四大核心能力来满足AI时代的需求：

(图：AI原生计算的四大核心需求)

在过去的一年里，Ray的下载量增长了5倍。为什么是现在？

Ion Stoica将AI的发展分为三个阶段，这也解释了Ray的增长曲线：

在这个阶段，重心从单纯的“预训练”转向了后训练（Post-training）、多模态处理和复杂推理（Reasoning/Agents）。

维度	经典 DNN (2016-2022)	GEN AI - 第一阶段 (2022-2024)	GEN AI - 第二阶段 (2024 - )
数据处理 (Data processing)	日志处理 (Log processing)	大规模文本处理 (Large text processing)	多模态处理 (Multi-modal processing)
训练 (Training)	稠密模型 (Dense models) (数据并行)	稠密模型 (Dense models) (数据并行，模型并行)	MoE 模型 (MoE models) (数据并行，张量并行，流水线并行，序列并行，Token 并行，上下文并行)
推理服务 (Serving)	单 GPU 模型 (Single-GPU models)	单节点模型 (Single-node models)	多节点模型 (Multi-node models) (专家路由 Expert-routing，预填充解耦 Prefill disaggregation 等)

维度

经典 DNN

(2016-2022)

GEN AI - 第一阶段

(2022-2024)

GEN AI - 第二阶段

(2024 - )

数据处理

(Data processing)

日志处理
(Log processing)

大规模文本处理
(Large text processing)

多模态处理