我要投稿

AI科普｜理解那些看似高级的AI概念和热词（上）

发布日期：2025-06-15 13:41:07 浏览次数： 2233

作者：WonderLearner

微信搜一搜，关注“WonderLearner”

引言

近一年多来，相信大家经常能看到网络上各种AI科技新闻和遍布城市的AI模型和应用的宣传广告。各种大模型、人工智能APP和技术热词层出不穷，眼花缭乱。更有一些“观点”在散播着AI将替代某些行业某些工作的焦虑，试图为我们这些普通人敲响警钟。

作为普通人，尤其是IT行业的从业者以及认为自己的岗位有可能被替代的人群，我们能做些什么？是马上把DeepSeek所有技巧都学起来？还是开始学着自己搭建AI工作流？甚至开始学习AI算法？

在知道自己能做什么之前，我们应该先了解AI能做什么和不能做什么，它的能力边界在哪里，它的能力又如何可以为我所用。我们不需要深入技术细节，但是我们需要能够了解基本的背景知识，包括但不限于概念、宏观视角的AI产业链以及直接能让我们接触的优秀应用，我们才能参与到AI这个大话题。这个过程不着急，只要一直在路上就好。

（一）

有哪些我们似乎需要理解的AI基本概念和热词？

我们从实际出发，从那些看起来很高级又不是很懂的词出发。比如：

智能体、多模态、大模型、通用智能、机器学习、深度学习、强化学习、AI Agent、copilot、transformer、提示词、prompt、自然语言处理、计算机视觉、cursor、AI Gen，相信这些名词大家都见过，但是又都是什么？

它们之间是什么关系？很多人都还没用过chatgpt，还在求如何使用chatgpt的时候，突然发现这个问题不再是问题了。因为deepseek横空出世，我们有了chatgpt的替代。deepseek爆火后，各大厂商都在说“我们已接入deepseek”，这句话又到底是个什么意思？满血版？蒸馏版？推理模型？基础模型？私有小模型？这些又是什么？
我们普通人目前在用的这些AI应用，比如deepseek、豆包这类一问一答形式AI和上面这些热词又是什么关系？更有很多平台上的牛人都在教大家写提示词，据说这样能让AI的回答更好，又是怎么个事？用个AI还要让我学新技能？

（二）

你不得不先了解的一些又大又基本的概念，其实不难懂

人工智能（AI）是一个广泛的领域，是一种模仿人类行为和能力的系统，这些系统能够执行通常需要人类智能才能完成的任务，例如感知、推理、学习、问题解决和决策。AI 是对各种技术和方法的总称，包括机器学习、深度学习和生成式人工智能等。

机器学习（ML）是 AI的子领域，机器学习是关注于开发和研究能够从经验（数据）中学习的方法论（注意及机器学习的概念不等于机器学习算法），它的核心思想是从数据中提取模式，通过数据训练模型，使其能够进行预测或决策。机器从数据中学习，数据科学家可使用使用各种来源的数据来训练机器学习模型，这些模型可以根据它们在数据中找到的关系进行预测和推断。

按照数据使用的方式不同，机器学习可以分为以下几种范式：

监督学习：监督学习是机器学习的一种范式，在其中输入对象和期望的输出值（标注数据）用于训练模型，学习输入与输出之间的映射关系。训练数据被处理以优化模型的性能。比如通过提供一组动物图片数据并且正确标记了图片中的动物名称，来训练模型能够进行正确的动物识别。
无监督学习：无监督学习与监督学习相对，是一种从未标注的数据中学习的方法，发现输入数据中固有的模式、结构或关系。比如通过提供一组动物图片但是并不标记图片里包含了哪些动物，而是让机器自己去学习其中的规律。
强化学习：强化学习是机器学习和最优控制的一个交叉领域，在强化学习中，仅向机器提供性能分数作为指导和半监督学习，其中仅标注一部分训练数据。反馈以奖励或惩罚的形式提供，机器会从这些反馈中学习，从而随着时间的推移改善其决策。
迁移学习：将在一个任务上学到的知识应用到另一个相关任务上。
基于人类反馈强化学习（RLHF）：一种强化学习方法，其中模型的学习过程受到人类反馈的指导，以提高学习效率和结果的质量。

深度学习（DL）是机器学习的一个分支。上面我们提到机器学习是一种从数据中挖掘模式的方法论。那么深度学习是一种基于深层神经网络来自动从数据中提取多层次特征的一种机器学习方法，因此，深度学习是机器学习的子领域或者一个分支，是通过深层神经网络实现机器学习的目标。深度学习领域的灵感来自于大脑的结构和功能，通过神经网络模拟人脑处理信息的方式。深度学习的核心是神经网络。就像我们的大脑有相互连接的神经元一样，神经网络也有许多相互连接的称为节点的微小单元。这些节点组织于不同的层。其中包括一个输入层、一个或多个隐藏层以及一个输出层。深度学习中的“深度”通常就被狭义地理解为是对神经网络的这种多层特征的表达。

神经网络的结构可以有不同的设计，神经网络架构指的就是神经网络的结构设计，包括层数、连接方式、核心组件（如卷积层、注意力层）等，不同的架构自然有不同的优劣势。卷积神经网络（CNN）、循环神经网络（RNN）、Transformer是深度学习的三种核心架构。采用什么样的架构就取决于具体的任务需求或者说使用场景，卷积神经网络（CNN）用于图像识别，Transformer架构在自然语言处理方面表现出色。目前，Transformer 架构已成为深度学习领域（尤其是自然语言处理和跨模态任务）的绝对主流，几乎所有前沿大模型均基于其构建。

生成式人工智能（Generative AI）是深度学习的子集，指的是能够自主生成新内容（如文本、图像、音频、视频、代码等）的人工智能技术。其核心目标是模仿人类创造力，从数据中学习规律并输出原创性内容。可以调整使用深度学习构建的模型，但无需进行重新训练或微调。生成式人工智能系统能够根据从训练数据中学到的模式和结构生成新数据。

人工智能生成内容（AIGC）是AI产生内容，也是现在广泛被大家使用的一种能力，指的是AI能够使用生成模型来产生文本、图像、视频或其他数据内容。比如我们使用即梦APP帮我们生成头像图片，一些作者让人工智能帮助生成一篇某个主题的小说等等。（这个概念结合UGC就很好理解，像知乎、小红书、抖音等内容平台其实依赖的是UGC，也就是用户产生内容，因为平台中用户产生的优质内容而吸引和留存更多的用户）。

简单总结，机器学习是人工智能的核心方法论，分为不同学习范式（监督、无监督、强化学习）。深度学习（DL）是机器学习的一个子领域，其核心是使用深层神经网络（如CNN、Transformer）进行特征学习和模型构建。深度学习可以与所有机器学习范式（监督、无监督、强化学习）结合，形成具体的技术分支。为了更细节地了解这些概念之间的关系，我找DeepSeek帮忙总结了这张图，更详细的解释了机器学习、深度学习、机器学习几大范式的这些概念之间的关系。