2026年7月2日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

学习大模型开发,需要具备人工智能或深度学习理论基础吗?

发布日期:2024-10-17 12:00:19 浏览次数: 2857
作者:AI探索时代

微信搜一搜,关注“AI探索时代”

 学以致用,问题才是学习的真正驱动力 



最近发表了几篇关于学习人工智能技术的文章,然后就有人问没有深度学习的基础可以学习人工智能吗?


答案是肯定的,学习人工智能技术并不一定非要懂得深度学习,虽然深度学习是大模型的基础。





怎么学习大模型?




很多人学习大模型技术,第一步就卡在了入门上,也就是说不知道应该怎么学习人工智能技术。


可能在很多人的认知中,学习人工智能就要学习机器学习和深度学习,面对着复杂的机器学习模型以及复杂的算法实现,直接导致很多人的人工智能学习之路自此中断。


其实大家完全没必要把人工智能或者说大模型想的那么复杂,作者在之前的文章中曾不只一次的说过,技术的本质就是一个工具;而会不会制造和使用工具是人和动物的根本区别。


既然大模型技术是一种工具,我们即使不会制造大模型这个工具;但我们可以学会使用这个工具。所以,对不懂机器学习和深度学习的人来说,学习大模型技术最好也是最简单的方式就是先学会使用大模型。


学习使用大模型也有两种情况,一种是完全不懂技术的人,只需要学会使用基于大模型作为底座开发的产品,比如一些音视频生成工具等。


第二,就是懂技术的人,他们有一定的编程基础,这时他们可以学习在大模型之上构建上层应用,也就是给不懂技术的人使用的工具。


第一种没什么好说的,不论是人工智能还是微信,淘宝,拼多多对第一种人来说没什么区别。


我们今天主要讨论的是学习大模型技术的人,当然,第二种情况下也会有那种特别喜欢大模型技术本身的人,比如学习机器学习模型,算法,架构等等;这种就不在我们今天讨论的范围。



为什么我说学习大模型可以不懂的机器学习和深度学习?


原因就是学习的方式有多种,在学生时代学校采用填鸭式的教学方式,上来就给我们讲高大上的理论还一些不知所以的概念。


因此,也有人开玩笑说我只需要上街买个菜,需要知道什么是牛顿莱布尼茨公式吗? 


而我们很多人学习人工智能或者学习大模型技术的时候也是一样,他们根本不知道什么是人工智能,也不知道什么是大模型;就知道这玩意现在比较火,说起来比较牛逼,然后就去学。


但你问他为什么要学,他们又说不出个一二三。


所以,很多人学习大模型的时候听了一堆概念,看了一堆书,然后也不知道到底能干什么,为什么这么干。


因此,踏入社会之后我们就要学会另一种学习方式,那就是从问题出发,从应用出发,在问题中寻找答案。


先不要去学习哪些高大上的理论和一些乱七八糟的概念,我们首先要做的就是先学会大模型的使用,比如让它帮我们生成一张图片,回答一个问题。


这时问题就来了,大模型为什么可以生成图片,为什么可以回答问题?


然后去思考它是怎么做到的,以及它为什么能做到。



这时,你带着问题去寻找答案,你就会发现原来看不懂的概念现在好像有点懂了;之所以可以生成图片和回答问题,是因为现在的模型叫生成式模型,使用特殊的架构实现的一种能够通过预训练习得知识的能力。


然后你就又发现了一个问题,什么是预训练? 以及预训练是怎么做的?


这时你就会去学习大模型的预训练流程,选择模型,数据清洗,数据训练,正向传播,反向传播,损失计算等等。


这时的你可能对大模型技术就有了一个大致的认识,虽然你并不知道大模型到底是怎么实现的,但你知道通过预训练流程就可以打造一款适合某个场景的模型。



这时你就开始思考怎么才能训练一个能解决某个问题的模型? 


怎么选择合适的模型,从哪里找到这些模型,这些模型需要什么样的以及什么格式的数据,预训练需要多少算力,需不需要分布式并行计算等等。


这时你就会发现,原来训练一个模型这么复杂,这么困难;那该怎么办呢?


这时你又看到了微调,通过少量的数据就可以实现把类似功能的预训练模型调整成适合你指定任务的模型。


这时你就会发现,原来训练和微调在技术上没有本质的区别;唯一的区别就是预训练模型的参数是经过训练的,而微调只需要对部分参数进行调整即可。如果是全量微调,那就和训练没什么本质的区别了。


这时,你已经明白了大模型的基本运作原理,以及训练和微调的方法;这时你可能会想我也自己设计一个大模型出来给别人用?


这时你通过一通查资料发现想实现这个目标确实比较复杂,不但要深入了解各种机器学习的理论和算法,还是懂得足够的数学基础。


所以,这时你可能会转变方向,先去基于大模型开发一款工具或应用;比如AIGC或知识库等。


然后,你就会思考怎么用大模型开发应用呢?


是自己训练或微调一个大模型,还是使用第三方的大模型?如果使用三方大模型只需要懂得接口调用,甚至不需要知道一点人工智能的东西就可以开发,技术要求低,成本也低。


而如果自己使用其它的开源模型,那么自己怎么部署,怎么动态扩容等等。

等你真正决定自己部署大模型的时候,你才发现原来自己独立运维部署大模型是如此复杂的一个工程,不但要考虑模型的选择,还要负责大模型的集群部署和扩容;而如此庞大的系统工程依靠人力是无法完成的,因此自动化运维就成了必不可少的东西。


最终,你经过一通乱七八糟的操作,最终成功部署了大模型;这时,你又发现模型的生成效果好像并不是太好,使用了现有的训练和微调方式都没办法解决这个问题。



这时,你就需要开始真正的研究大模型的底层实现,使用了什么算法,什么架构,可能是什么问题导致大模型表现不好等等。


或者说,你在使用大模型的过程中,突然发现一些之前没有注意到的好玩的地方,比如大模型的幻觉问题,一本正经的胡说八道。


而产生这个问题的根本原因是什么? 


这时,你就会发现你自己好像懂了什么是大模型;但又好像什么都不懂;感觉自己什么东西都知道一点,但又没办法说个所以然。


为什么会产生上面的情况,原因就是大模型是一个复杂的系统性工程,没有人上来就能把它说个一二三;大家都是在不断学习,不断使用的过程中,发现问题,改正问题,在问题中成长。


所以说,你没有机器学习和深度学习的基础,你会有上面的各种疑问;而你有机器学习和深度学习的基础,你同样会有上面的疑问。


学习最重要的是学以致用,不论是你先从应用学起,还是从底层理论学期,你可以根据自己的喜好,选择适合自己的学习方式;没有人规定有了深度学习技术就一定能学会大模型技术;也没有人规定,没有深度学习技术的基础就学不会大模型技术。




53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅