我要投稿

一文彻底搞懂大模型 - 人工神经网络与贝叶斯网络

发布日期：2024-09-03 05:14:01 浏览次数： 3962

作者：架构师带你玩转AI

微信搜一搜，关注“架构师带你玩转AI”

ANN History

大模型，特别是那些拥有数十亿甚至更多参数的深度学习模型，往往是以人工神经网络为基础的。这些模型通过堆叠多个隐藏层、增加神经元数量和使用复杂的非线性激活函数，来构建能够处理复杂任务（如自然语言处理、图像识别等）的深度神经网络。

大语言模型

一、大模型与人工神经网络的关系

什么是人工神经网络（ANN）？人工神经网络（ANN）是一种模仿生物神经网络结构和功能的计算模型。它由多个层组成，包括输入层、隐藏层（可能有多层）和输出层。每一层都包含多个神经元（或称为节点），这些神经元通过带权重的连接相互连接。

ANN

输入层接收外部数据，隐藏层对数据进行处理，输出层则产生最终的输出。神经元的激活通常通过一个非线性函数（如sigmoid、ReLU等）来实现，这使得网络能够学习复杂的非线性关系。

ANN

大模型与人工神经网络的关系：LLM的核心是ANN（人工神经网络），基于人工神经网络构建更大规模和复杂度更高的深度学习模型。

PLM（预训练模型）：预训练语言模型通常使用互联网上的海量文本数据作为训练语料，这些语料库可能包含数十亿甚至数千亿个单词。这些模型通过在大量的未标注文本数据上进行学习，掌握了语言的共性和规律，进而能够应用于各种NLP下游任务。
数据 + 算力：算力作基础，数据为驱动；无监督预训练（Pre-training），有监督微调（Fine-tuning）。
权重w和偏置b：模型参数包括每一层的权重(weight)和偏置项(bias)。这些参数在训练过程中通过反向传播算法进行调整，以最小化损失函数。

LLM 》DL 》ANN

二、人工神经网络与贝叶斯网络的关系

什么是贝叶斯网络（BN）？贝叶斯网络（Bayesian Network，简称BN）是一种基于概率推理的图形模型，用于表示变量之间的依赖关系。它由一个有向无环图（Directed Acyclic Graph，DAG）和条件概率表（Conditional Probability Table，CPT）组成。

Bayesian Network

有向无环图（DAG）：用于表示变量之间的依赖关系。图中的节点代表变量，有向边（或称为弧）则表示变量之间的依赖关系。如果两个节点之间存在有向边，则意味着一个节点的状态会影响另一个节点的状态。
条件概率表（CPT）：与DAG中的每个节点相关联，用于描述节点与其父节点之间的概率关系。条件概率表详细列出了在给定父节点状态下，当前节点取各个可能值的概率。

Bayesian Network

人工神经网络与贝叶斯网络的关系：两者都是有向图模型，其中每个节点的取值或状态仅依赖于其直接前驱节点，即遵循马尔可夫假设。这种结构使得模型能够清晰地表示变量之间的依赖关系。

ANN vs Bayesian Network

有向图模型：一种使用有向图来表示变量之间关系的数学模型。在有向图中，节点代表变量，而有向边则代表变量之间的依赖关系。

Direction Graph

马尔可夫假设：一种简化模型复杂性的假设，它指出一个节点的状态（或取值）仅依赖于其直接前驱节点的状态（或取值），而与更前面的节点状态无关。

Markov Chain

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-02-04

Skills使用体验

2026-02-04

AgentScope 正式发布 Skills 支持 - 实现渐进式披露

2026-02-04

从“回答者”进化为“研究员”：全面解析 Deep Research

2026-02-04

刚刚，Xcode 史诗级更新：原生集成 Claude Agent SDK，苹果开发直接起飞！

2026-02-04

国产 Cowork 它来了！MCP、Skills和Expert Agents都支持，全部免费体验！

2026-02-04

混元研究博客上线姚顺雨团队最新成果：从 Context 探索语言模型的范式转变

2026-02-04

通俗讲解大模型短期记忆 vs 长期记忆

2026-02-04

谁动了我的电脑？谁应该抱怨？

联系获取

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Pencil：设计和写代码，以后就全让AI干了

2026-01-24

独家实录｜唐杰、杨植麟、林俊旸、姚顺雨...All Star 对话上，大家聊了啥？

2026-01-10

我挖到Gemini 3.0 Pro十大隐藏玩法，做网页已经落后N个版本了

2025-11-19

深度体验TRAE SOLO 正式版，总结一点技巧(附完整可重现提示词和源码)

2025-11-13

从0到1玩转Clawdbot：我花了40小时，把这些坑都踩完了

2026-01-26

2026 开年 AI 工具推荐，让你新的一年效率起飞！（建议收藏）

2026-01-01

Codex 史诗级更新！引入 Skills 技能库，直接兼容 Claude 生态，开发效率原地起飞

2025-12-09

国内版的 NotebookLM 来了，甚至更强

2025-11-12

终于！Gemini CLI支持Agent Skills，一键搬运Claude Code的“绝招”

2026-01-09

Claude赢麻了？OpenAI Codex正式支持Skills，GitHub连夜上车！

2025-12-21

大家都在问

谁动了我的电脑？谁应该抱怨？

2026-02-04

刚刚！OpenAI 正式发布 Codex App，一人指挥一支 AI 军队，Cursor 慌了？

2026-02-03

谷歌Genie 3打崩游戏股！1小时500元的AI生成游戏，真能革游戏的命？

2026-02-03

史上最强编程模型Claude 5泄露，最慌的是黄仁勋？

2026-02-02

X上点赞近万的Claude Agent SDK教程，到底讲了什么？

2026-02-02

人人都在谈论ClawdBot，但你真的懂它的技术原理吗？

2026-02-02

刚刚，谷歌版「世界模型」震撼公测！网友实测炸翻天：游戏末日来了？

2026-01-31

Transformers V5正式发布！这次更新到底香不香？

2026-01-30

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB Palantir Glean

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部