微信扫码
添加专属顾问
我要投稿
一、大模型与人工神经网络的关系
PLM(预训练模型):预训练语言模型通常使用互联网上的海量文本数据作为训练语料,这些语料库可能包含数十亿甚至数千亿个单词。这些模型通过在大量的未标注文本数据上进行学习,掌握了语言的共性和规律,进而能够应用于各种NLP下游任务。
数据 + 算力:算力作基础,数据为驱动;无监督预训练(Pre-training),有监督微调(Fine-tuning)。
权重w和偏置b:模型参数包括每一层的权重(weight)和偏置项(bias)。这些参数在训练过程中通过反向传播算法进行调整,以最小化损失函数。
二、人工神经网络与贝叶斯网络的关系
有向无环图(DAG):用于表示变量之间的依赖关系。图中的节点代表变量,有向边(或称为弧)则表示变量之间的依赖关系。如果两个节点之间存在有向边,则意味着一个节点的状态会影响另一个节点的状态。
条件概率表(CPT):与DAG中的每个节点相关联,用于描述节点与其父节点之间的概率关系。条件概率表详细列出了在给定父节点状态下,当前节点取各个可能值的概率。
Bayesian Network
有向图模型:一种使用有向图来表示变量之间关系的数学模型。在有向图中,节点代表变量,而有向边则代表变量之间的依赖关系。
Direction Graph
马尔可夫假设:一种简化模型复杂性的假设,它指出一个节点的状态(或取值)仅依赖于其直接前驱节点的状态(或取值),而与更前面的节点状态无关。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-02-04
Skills使用体验
2026-02-04
AgentScope 正式发布 Skills 支持 - 实现渐进式披露
2026-02-04
从“回答者”进化为“研究员”:全面解析 Deep Research
2026-02-04
刚刚,Xcode 史诗级更新:原生集成 Claude Agent SDK,苹果开发直接起飞!
2026-02-04
国产 Cowork 它来了!MCP、Skills和Expert Agents都支持,全部免费体验!
2026-02-04
混元研究博客上线姚顺雨团队最新成果:从 Context 探索语言模型的范式转变
2026-02-04
通俗讲解大模型短期记忆 vs 长期记忆
2026-02-04
谁动了我的电脑?谁应该抱怨?
2026-01-24
2026-01-10
2025-11-19
2025-11-13
2026-01-26
2026-01-01
2025-12-09
2025-11-12
2026-01-09
2025-12-21
2026-02-04
2026-02-03
2026-02-03
2026-02-02
2026-02-02
2026-02-02
2026-01-31
2026-01-30