微信扫码
添加专属顾问
我要投稿
AI概念太多看不懂?这篇文章帮你理清思路,轻松掌握AI基础知识。核心内容: 1. 解析常见AI热词和概念,如大模型、多模态、机器学习等 2. 介绍AI的基本能力边界和应用场景 3. 普通人如何有效利用现有AI工具提升效率
(一)
有哪些我们似乎需要理解的AI基本概念和热词?
智能体、多模态、大模型、通用智能、机器学习、深度学习、强化学习、AI Agent、copilot、transformer、提示词、prompt、自然语言处理、计算机视觉、cursor、AI Gen,相信这些名词大家都见过,但是又都是什么?
它们之间是什么关系?很多人都还没用过chatgpt,还在求如何使用chatgpt的时候,突然发现这个问题不再是问题了。因为deepseek横空出世,我们有了chatgpt的替代。deepseek爆火后,各大厂商都在说“我们已接入deepseek”,这句话又到底是个什么意思?满血版?蒸馏版?推理模型?基础模型?私有小模型?这些又是什么?
我们普通人目前在用的这些AI应用,比如deepseek、豆包这类一问一答形式AI和上面这些热词又是什么关系?更有很多平台上的牛人都在教大家写提示词,据说这样能让AI的回答更好,又是怎么个事?用个AI还要让我学新技能?
(二)
你不得不先了解的一些又大又基本的概念,其实不难懂
人工智能(AI)是一个广泛的领域,是一种模仿人类行为和能力的系统,这些系统能够执行通常需要人类智能才能完成的任务,例如感知、推理、学习、问题解决和决策。AI 是对各种技术和方法的总称,包括机器学习、深度学习和生成式人工智能等。
机器学习(ML)是 AI的子领域,机器学习是关注于开发和研究能够从经验(数据)中学习的方法论(注意及机器学习的概念不等于机器学习算法),它的核心思想是从数据中提取模式,通过数据训练模型,使其能够进行预测或决策。机器从数据中学习,数据科学家可使用使用各种来源的数据来训练机器学习模型,这些模型可以根据它们在数据中找到的关系进行预测和推断。
按照数据使用的方式不同,机器学习可以分为以下几种范式:
监督学习:监督学习是机器学习的一种范式,在其中输入对象和期望的输出值(标注数据)用于训练模型,学习输入与输出之间的映射关系。训练数据被处理以优化模型的性能。比如通过提供一组动物图片数据并且正确标记了图片中的动物名称,来训练模型能够进行正确的动物识别。
无监督学习:无监督学习与监督学习相对,是一种从未标注的数据中学习的方法,发现输入数据中固有的模式、结构或关系。比如通过提供一组动物图片但是并不标记图片里包含了哪些动物,而是让机器自己去学习其中的规律。
强化学习:强化学习是机器学习和最优控制的一个交叉领域,在强化学习中,仅向机器提供性能分数作为指导和半监督学习,其中仅标注一部分训练数据。反馈以奖励或惩罚的形式提供,机器会从这些反馈中学习,从而随着时间的推移改善其决策。
迁移学习:将在一个任务上学到的知识应用到另一个相关任务上。
基于人类反馈强化学习(RLHF):一种强化学习方法,其中模型的学习过程受到人类反馈的指导,以提高学习效率和结果的质量。
深度学习(DL)是机器学习的一个分支。上面我们提到机器学习是一种从数据中挖掘模式的方法论。那么深度学习是一种基于深层神经网络来自动从数据中提取多层次特征的一种机器学习方法,因此,深度学习是机器学习的子领域或者一个分支,是通过深层神经网络实现机器学习的目标。深度学习领域的灵感来自于大脑的结构和功能,通过神经网络模拟人脑处理信息的方式。深度学习的核心是神经网络。就像我们的大脑有相互连接的神经元一样,神经网络也有许多相互连接的称为节点的微小单元。这些节点组织于不同的层。其中包括一个输入层、一个或多个隐藏层以及一个输出层。深度学习中的“深度”通常就被狭义地理解为是对神经网络的这种多层特征的表达。
神经网络的结构可以有不同的设计,神经网络架构指的就是神经网络的结构设计,包括层数、连接方式、核心组件(如卷积层、注意力层)等,不同的架构自然有不同的优劣势。卷积神经网络(CNN)、 循环神经网络(RNN)、Transformer是深度学习的三种核心架构。采用什么样的架构就取决于具体的任务需求或者说使用场景,卷积神经网络(CNN)用于图像识别,Transformer架构在自然语言处理方面表现出色。目前,Transformer 架构已成为深度学习领域(尤其是自然语言处理和跨模态任务)的绝对主流,几乎所有前沿大模型均基于其构建。
生成式人工智能(Generative AI)是深度学习的子集,指的是能够自主生成新内容(如文本、图像、音频、视频、代码等)的人工智能技术。其核心目标是模仿人类创造力,从数据中学习规律并输出原创性内容。可以调整使用深度学习构建的模型,但无需进行重新训练或微调。生成式人工智能系统能够根据从训练数据中学到的模式和结构生成新数据。
人工智能生成内容(AIGC)是AI产生内容,也是现在广泛被大家使用的一种能力,指的是AI能够使用生成模型来产生文本、图像、视频或其他数据内容。比如我们使用即梦APP帮我们生成头像图片,一些作者让人工智能帮助生成一篇某个主题的小说等等。(这个概念结合UGC就很好理解,像知乎、小红书、抖音等内容平台其实依赖的是UGC,也就是用户产生内容,因为平台中用户产生的优质内容而吸引和留存更多的用户)。
简单总结,机器学习是人工智能的核心方法论,分为不同学习范式(监督、无监督、强化学习)。深度学习(DL)是机器学习的一个子领域,其核心是使用深层神经网络(如CNN、Transformer)进行特征学习和模型构建。深度学习可以与所有机器学习范式(监督、无监督、强化学习)结合,形成具体的技术分支。为了更细节地了解这些概念之间的关系,我找DeepSeek帮忙总结了这张图,更详细的解释了机器学习、深度学习、机器学习几大范式的这些概念之间的关系。
其实这一部分看完非常建议再看一遍AI发展史那篇文章,相信更能深刻理解整个发展的过程,以及以上提到的一些技术的意义。
(三)
从理解AI产品的背后逻辑出发,去理解的一些概念
DeepSeek、豆包、通义千问、ChatGPT这些聊天机器人是目前大众直接接触和使用的最多的一类AI产品,那么要实现这样的一些智能问答应用,需要经过什么样的过程?我们从这个问题出发,顺便去理解一些基本概念。
AI类产品自底向上一般可以分为四层:
基础层主要涉及数据、算法和算力,为模型提供最基础的底层支撑。在这一层我们会涉及到数据、算法、CPU和卡相关的概念。
模型层是AI产品的“大脑”,主要涉及基础模型、领域模型、多模态等概念,会讲到各类模型的概念。
应用层负责将AI技术转化为实际的用户应用,我们会涉及提示词、Agent、智能体、RAG等概念。
用户层是AI产品的用户交互形态,比如目前比较常见的聊天对话,这里我们会涉及分析现有AI产品的主流模式(agent、copilot、embedding)。
因为这些内容篇幅也比较长,这部分详细内容会在下篇文章中分享。
感谢您能阅读到此处,希望通过这篇文章能够让大家对AI产生一些新的认识和收获。欢迎大家关注,一起在路上~
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-03-25
2025-04-05
2025-04-05
2025-03-21
2025-04-14
2025-04-13
2025-04-29
2025-03-30
2025-04-13
2025-05-22
2025-06-13
2025-06-12
2025-06-08
2025-06-08
2025-05-27
2025-05-24
2025-05-23
2025-05-22