2026年7月9日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

IBM生成式AI安全框架

发布日期:2024-11-26 14:00:09 浏览次数: 2716
作者:刀媒体

微信搜一搜,关注“刀媒体”

虽然生成人工智能(AI)正在成为顶级技术投资领域,但许多组织尚未准备好应对与之相关的网络安全风险。

与任何新技术一样,我们必须认识到生成式人工智能带来的新安全风险,因为毫无疑问,对手会试图利用任何弱点来实现其目标。事实上,根据IBM 商业价值研究院的数据,96% 的高管表示,采用生成式 AI 可能会在未来三年内导致其组织出现安全漏洞。

随着人工智能模型将大量有价值且敏感的数据摄入到训练集中,再加上企业领导者研究这些模型如何优化关键运营和输出,风险非常高。组织无法将不安全的人工智能引入其环境。

用于保护生成式 AI 安全的 IBM 框架

在本博客中,我们介绍了IBM 保护生成式 AI 的框架。它可以帮助世界各地的客户、合作伙伴和组织更好地了解最有可能的人工智能攻击,并优先考虑对快速保护其生成人工智能计划最重要的防御方法。

IBM framework for securing generative AI

我们在人工智能管道的每个阶段确保人工智能的安全至关重要,这包括数据收集和处理、模型开发和训练以及模型推理和使用期间。因此,组织需要保护数据、模型和模型的使用。他们还必须保护构建和运行人工智能模型的基础设施。最后,他们需要建立人工智能治理并监控随着时间的推移的公平性、偏见和偏差。

下面我们详细介绍了人工智能管道每个阶段的风险以及如何保护它免受主要已识别的攻击。

Risks in each stage of the AI pipeline

保护数据

在数据收集和处理阶段,您不仅需要收集大量数据来喂养AI模型,还需要向包括数据科学家、工程师、开发人员和其他许多人提供访问权限。将所有这些数据集中在一个地方,并授予各种利益相关者——其中大多数没有安全经验的人——访问权限,本身就存在固有的风险。

只需考虑一下,如果由于训练数据的处理不当而暴露了与业务基本相关的知识产权(IP),可能会对业务构成生存威胁。利用大量数据为AI模型服务意味着组织需要评估与个人身份信息(PII)、隐私问题和其他敏感信息相关的各种风险,然后在该数据周围建立适当的安全控制。

针对最可能攻击的防护措施和防御手段

数据收集阶段的主要目标是底层数据集,数据泄露被视为攻击者试图获取有价值且可货币化信息的最可能的技术手段。由于攻击者寻求阻力最小的路径,底层数据集就像一个闪烁的灯,承诺着高回报。

组织不能忽视安全基础的重要性——事实上,它们应该优先考虑。如果正确应用,这些基础可以显著影响组织的网络安全态势。这包括关注数据发现和分类、静态和传输中的加密,以及来自IBM Security® Guardium®等数据安全平台的关键管理。这也意味着关注由IBM Security® Verify等解决方案强制执行的标识和访问管理基础,这些解决方案有助于确保没有任何单一实体可以无限制地访问AI模型。最后,组织必须提高数据科学家和研究人员的网络安全意识,并确保安全团队与这些团队紧密合作,以确保适当的防护措施。

保护模型

在模型开发过程中,您正在以新的方式构建应用程序,这通常涉及引入新的、可利用的漏洞,攻击者可以利用这些漏洞作为进入环境并进而进入您的AI模型的入口点。考虑到组织历史上一直难以管理其环境中发现的已知漏洞的不断增加的债务,这种风险将延续到AI。

开发AI应用程序通常从数据科学团队重新利用来自在线模型存储库的预训练、开源机器学习(ML)模型开始,这些模型通常缺乏全面的安全控制。然而,它们为组织提供的价值,如显著减少生成式AI采用所需的时间和精力,通常超过了这种风险,最终将其传递给企业。围绕ML模型的安全普遍稀缺,加上ML模型所接触到的数据越来越敏感,这意味着针对这些模型的攻击具有很高的破坏潜力。

针对最可能攻击的防护措施和防御手段

模型开发阶段的主要攻击技术是供应链攻击,这是由于对用于加速开发工作的在线模型存储库中预训练、开源ML模型的严重依赖。攻击者可以访问这些在线存储库,并将后门或恶意软件部署到其中。一旦上传回存储库,它们就可以成为任何下载受感染模型的用户的入口点。如果这些模型被感染,检测它们可能非常困难。组织必须非常谨慎地考虑他们从何处获取模型以及来源的可靠性。

应用程序编程接口(API)攻击也是一个担忧的问题。没有资源或专业知识来构建自己的大型语言模型(LLM)的组织依赖于API来消费预包装、预训练模型的能力。攻击者认识到这将是LLM的主要消费模型,并将寻求针对API接口进行攻击,以访问和利用通过API传输的数据。

攻击者还可能试图利用具有过多权限以访问开放式功能或下游系统(这些系统可以在业务工作流程中执行特权操作)的LLM代理或插件。如果攻击者可以损害授予AI代理的特权,造成的损害可能是毁灭性的。

组织应关注以下方面:

保护使用

在推理和实际使用过程中,攻击者可以通过操纵提示来绕过防护措施,并通过生成不允许的响应来诱使模型表现出不良行为,这些响应包括偏见、虚假和其他有害信息。这可能会对企业声誉造成损害。攻击者还可能试图操纵模型并分析输入/输出对,以训练一个模仿目标模型行为的代理模型,从而有效地“窃取”其功能,并使企业失去竞争优势。

针对最可能攻击的防护措施和防御手段

在AI管道的这个阶段,几种类型的攻击令人担忧。首先,提示注入——攻击者使用恶意提示来绕过模型并获得未经授权的访问,窃取敏感数据或将偏见引入输出。另一个担忧是模型拒绝服务,攻击者通过输入压倒LLM,降低服务质量并产生高昂的资源成本。组织还应准备防御模型盗窃,其中攻击者构建输入以收集模型输出,以训练一个模仿目标模型行为的代理模型。

我们的最佳实践包括监控恶意输入,如提示注入,以及包含敏感数据或不适当内容的输出,并实施新的防御措施,以检测和响应AI特定的攻击,如数据中毒、模型规避和模型提取。以机器学习检测和响应(MLDR)的名义进入市场的新AI特定解决方案。由这些解决方案生成的警报可以集成到安全运营解决方案中,如IBM Security® QRadar®,使安全运营中心(SOC)团队能够快速启动响应剧本,拒绝访问、隔离或断开受损害的模型。

保护基础设施

第一道防线是安全的基础设施。组织应利用现有专业知识来优化在托管AI系统的分布式环境中实施的安全、隐私和合规性标准。他们必须加强网络安全、访问控制、数据加密以及AI环境周围的入侵检测和预防。他们还应考虑投资于专门设计用于保护AI的新安全防御。

建立治理

IBM不仅提供AI安全,还提供AI的运营治理。IBM在AI治理方面处于行业领先地位,以实现可信赖的AI模型。随着组织将运营业务流程外包给AI,他们需要确保AI系统没有偏离预期,并按预期行事。这使得运营防护措施成为有效AI战略的核心。一个在运营上偏离其设计目的的模型可能带来的风险与攻击者破坏您的基础设施的风险相同。

负责任的人工智能的领导者

IBM 拥有悠久的信任传统和对以安全、道德、隐私和治理为核心的人工智能的坚定承诺。这些原则支撑着我们的人工智能,这就是为什么我们知道人工智能模型的构建和训练方式对于实现由人工智能驱动的成功、负责任的结果至关重要。

我们基础模型的数据质量、数据血缘和数据保护是我们的首要任务之一。在 IBM,我们对模型的训练流程实施强有力的控制和细致的流程。他们接受精心策划的数据培训,以实现数据的准确性、完整性和来源,同时降低模型幻觉的风险。

我们的承诺通过推出 IBM® watsonx.governance ™ 得到体现,该平台旨在帮助使用大型 AI 模型的公司获得公正、事实正确且可解释的结果。

我们还构建了流程来解决数据透明度和对客户的完全可追溯性,并能够展示我们的数据源。我们最近发布了Granite 模型训练数据集的详细信息,表达了我们对透明度和负责任的人工智能的承诺。IBM 还为其基础模型提供知识产权赔偿(合同保护)。

IBM 继续展示并进一步推进其对有效、负责任地部署 AI 的承诺,设立了5 亿美元的企业 AI 风险基金,不仅推动创新,还投资于有助于保护 AI 安全并为客户不断变化的需求构建负责任的解决方案的能力。

有关组织如何安全地采用生成式人工智能的更多信息,请查看:

  • CISO 指南:生成式 AI 时代的网络安全
  • 如何建立安全的AI+商业模式
  • 人工智能加速您的安全防御
  • 观看:生成式 AI 如何改变网络安全格局
  • 人工智能的力量:安全

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅