2026年6月11日 周四晚上19:30,报名腾讯会议了解“业务抓夹如何成为前线部署工程师(FDE)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


我要投稿

【Skill分享】:网络安全领域标讯采集助手Skill

发布日期:2026-06-09 18:09:44 浏览次数: 1516
作者:SecNewsAI攻防

微信搜一搜,关注“SecNewsAI攻防”

推荐语

告别手动翻查,AI助手让每个销售都能实时获取定制化标讯,抢占网络安全项目先机。

核心内容:
1. 金融网络安全标讯来源分散,传统采集方式耗时且易遗漏
2. 利用AI技能(Skill+AI Agent)实现多渠道自动化标讯采集
3. 从10个渠道扩展到40个渠道的实践过程与效率提升

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家


标讯就是知己知彼,百战不殆的关键来源。

通常企业有相关标讯系统进行漫长的信息搬运——中国政府采购网、采招网、深交所电子招投标系统、知了标讯、金融采购网……然后通过CRM等平台同步到一线团队,随着AI时代的到来,标讯的获取或许不需要从总部一级一级传递下来,每个前场,销售都可以尝试通过Skill+AI Agent的方式获取定制化的标讯。

我算过,如果手工采集标讯,时间少则两三个小时,多则半天。做的都是机械的事情,但没有捷径可走。而且金融行业的网络安全标讯来源实在太分散了,你少看一个网站,可能就漏掉一条几十万甚至上百万的项目信息。

Part.01 那些年,我翻过的标讯网站

做安全行业的朋友,大概多少都经历过类似的事情。

金融行业的网络安全标讯,来源极其分散。国家级平台有中国政府采购网、招标投标公共服务平台、全国公共资源交易平台、中央政府采购网、中国采购与招标网五个,这五个是最权威的,覆盖率高,公告格式也规范。但光靠它们远远不够。

金融直连平台更多。深交所有自己的电子招投标系统,上交所、中金所各有各的采购信息页面。央行集中采购中心负责央行及下属机构的采购公告,成方金融信息技术经常发布安全产品的采购项目。国家开发银行用的是"征集+采购"模式,金融采购网则聚合了大量银行、证券、保险机构的标讯。

再往外围看,三大运营商的采购平台——中国移动、中国电信、中国联通,还有能源央企——国家电网、南方电网、国家能源集团、华能、大唐、华电、中石化,这些看起来跟金融行业关系不大,但实际上它们的信息安全采购量不小,而且供应商群体跟金融机构高度重叠。如果你在做市场分析或者竞争情报,这些信息必不可少。

更不用说采招网、千里马、乙方宝、政采云这些商业聚合平台,加上深圳公共资源交易中心、蚂蚁投标等辅助渠道。

加在一起,一个比较完整的标讯采集,需要覆盖的信息源至少有几十个。一个人每天要翻完这些网站,还要确保不遗漏、不重复、不记错金额和日期,几乎是不可能完成的任务。

但过去很长一段时间,我就是这么过来的。因为这是工作需要,因为没有更好的办法。

Part.02 从10个渠道到40个渠道

转机出现在我开始认真研究AI技能的时候。

我想的是:既然AI已经能帮我做很多事情了,标讯采集这件事,能不能也交给它?

说干就干。最先做出来的版本叫 bid-news-collection,v1.0,只覆盖了10个采集渠道,三线关键词体系——安全服务线、安全产品线、运维平台线。每条线配一组关键词,用AND和OR的组合去搜索引擎里搜。

跑完第一轮,结果出来了。十几二十条标讯,不多,但确实能用。比手动翻快了不少,我心里清楚,10个渠道远远不够。

问题在哪?覆盖面太窄。央行系的项目在中国政府采购网上能看到一些,但深交所、上交所的采购公告要去各自的平台才能找到。能源央企的安全采购虽然不是金融机构发的,但那些项目背后的供应商信息,对于判断市场趋势有参考价值。10个渠道只是冰山一角。

于是开始了迭代。

v1.3,加了中国移动和国家电网两个渠道,10变成12。

v1.4,做了一个比较重要的改动——关键词体系重构。原来三线的颗粒度太粗,我重新梳理了一遍。安全服务线从几个关键词扩展到了12个——等保、等级保护、密评、密码评估、渗透测试、攻防演练、重保、护网、安全评估、安全检测、安全审计、风险评估。安全产品线扩展到15个——防火墙、IPS、IDS、WAF、漏洞扫描、态势感知、堡垒机、数据库审计、邮件安全、DLP、零信任、EDR、XDR、数据安全、数据防泄漏。运维平台线9个词。

同时引入了第四条线——"行业搜索线"。工控安全、电力监控安全、物联网安全、云安全、数据分类分级、主机安全、终端安全,7个垂直领域的关键词。

这四条线形成了一个交叉搜索网络:前三线按采购内容纵向切分——你要找什么类型的服务或产品;行业线按应用领域横向切分——你要覆盖哪些行业场景。纵线和横线交叉,理论上能把绝大部分金融行业网安标讯都捞到。

v1.5正式定型了四线43词体系,搜索策略从原来的几轮变成了8轮横纵交叉搜索——每条线配不同的机构限定词(银行/证券/保险/金融),再叠加时效过滤(2026),形成完整的查询组合。

到了v1.6,我做了一次比较大的渠道扩展。12个渠道一下子扩到了40个,按优先级分成四个层级:

P0是5个国家级官方平台,必须采集,这是最权威的数据源。P1是22个重点渠道——9个金融直连平台、3个运营商、10个能源央企,覆盖了金融行业和关联行业的主要采购信息源。P2是12个商业聚合平台,用来扩大覆盖面,从不同搜索引擎的角度补充数据。P3是4个辅助渠道,按需查询,补漏用。

从10到40,看起来只是一个数字的变化,但背后的工作量不小。每个新渠道都要研究它的页面结构、搜索方式、注意事项——深交所的页面是JS渲染的,搜索引擎抓不全;采招网和知了标讯部分内容需要会员才能查看;国家电网的ECP2.0平台公告格式有自己的一套规范。这些细节不处理好,采集出来的数据质量就会大打折扣。

整个迭代过程大概花了两天。从v1.0到v1.6,一天之内完成了六次版本更新。说实话,我自己都有点惊讶迭代的速度——与其说是因为效率高,不如说是因为痛点足够深。每天手动翻网站的痛苦给了我很强的动力去完善它。

Part.03 它到底干了什么

很多人可能好奇,这个Skill跑起来之后,产出的东西长什么样。

我不想按功能列表的方式来讲,那太像产品说明书了。我想从一个实际的场景说起。

每天早上,它会在设定的日期范围内自动执行采集——以当天为基准,往前推5天,共6天的标讯数据。40个渠道按优先级分批搜索,四线关键词交叉覆盖,8轮搜索组合跑下来,去重后大概能拿到30到40条有效标讯。

每条标讯会提取12个标准字段——项目名称、内容总结、服务类型、招标方、机构类型、时间、金额、采购方式、状态、原文链接、链接核实状态、备注。12个字段看起来不多,但每一条都需要从原始公告中准确提取。比如金额,有的公告写"98.07万元",有的写"约500万",有的写"¥1,063.00",还有的写"以最终合同为准"——我专门写了一个金额解析函数来处理这些五花八门的格式。

提取完成后,所有标讯按四种分类规则归档:本期重大更新(新中标、新公示)、近期结果公示汇总、本期已截止(截止但结果未公布)、持续跟进项目(仍在招标中)。每种类别有对应的颜色标记和紧迫度分级——3天内截止的标⚠️,今天或明天截止的标⚠️⚠️。

输出两份报告。一份是Markdown格式的详细报告,8个章节,从采集概况到市场动态分析,适合阅读和分享。一份是Excel数据报告,两个Sheet——标讯明细16列数据,带四色编码和冻结窗格;统计分析含机构类型分布和服务类型分布的柱状图,适合进一步筛选和汇报。

如果你配了IMA(在线知识库),报告还会自动同步到指定的笔记本里。团队其他人打开企业微信就能看到最新标讯,不需要你额外转发。

坦白讲,这个Skill对我来说最大的价值,不是它能覆盖40个渠道或者提取12个字段这些数字。而是每天早上,它替我做了那两三个小时的体力活。我可以把省下来的时间花在更有价值的事情上——分析标讯背后的市场趋势、判断哪些项目值得跟进、提前准备投标策略。

这大概就是工具的意义——它不是替代你思考,而是把你从重复劳动中解放出来,让你有时间去做真正需要人的判断力和经验的事情。

Part.04 用起来到底多简单

说了这么多原理和设计,可能还是有人会想:这个东西我能用吗?需要会写代码吗?

我专门做了一个可分享的Light版本,把所有个人路径和敏感配置都移除了。你可以在这里下载:bid-news-collection-light[1]

拿到压缩包之后,整个上手过程分三步。

第一步:解压。 没什么好说的,解压到一个你喜欢的目录就行。目录结构很干净,核心就是一份SKILL.md(采集说明)、一份config.json(配置文件)、几个Python脚本和模板文件。

第二步:配置。 运行一条命令,会启动一个交互式配置向导。向导会问你两个问题:标讯报告保存到哪个目录?要不要同步到企业微信智能文档(IMA),如果要的话填一个笔记本ID。回答完这两个问题,config.json自动生成,所有路径都写好了。整个过程不超过一分钟。

第三步:让AI跑。 配好之后,打开你的AI助手,把SKILL.md丢给它,说一句「按照SKILL.md的步骤执行标讯采集」。然后你就可以去泡咖啡了。AI会按照预设的8轮搜索策略,40个渠道逐一采集,去重、提取字段、分类归档、生成报告。大概十来分钟,一份完整的标讯报告就出现在你指定的目录里了。

不需要懂Python,不需要装环境,不需要配置搜索引擎API。只要你会跟AI说话就行。

Part.05 它跑起来长什么样

那跑出来的东西到底长什么样?我拿最近一次实际采集的结果来说。

Markdown报告一共8个章节。第一个章节是采集概况,一张统计表——总采集条数、本期重大更新几条、持续跟进几个、链接核实率多少、已知金额合计多少,一眼就能看到全局。这个设计受了项目管理中仪表盘思维的启发:先看全貌,再钻细节。

第二个章节是本期重大更新。这里不是简单的列表,每条标讯都有一张详细的字段表——招标方、机构类型、服务类型、采购方式、金额,一目了然。如果有候选人公示,还会附一张候选人排名表:第1名是谁、报价多少、得分多少。

比如5月底那期报告中,有一条深交所的标讯让我印象比较深——「深交所虚拟磁带库维保服务采购」,飞创信息科技以98.07万(含税)中标。12个标准字段全部提取到位,原文链接已核实可访问。这种信息的精准度和完整性,放在以前手动采集的时候,至少要花二十分钟去核对。

第三个章节往后,分别是结果公示汇总表、已截止项目、持续跟进项目、重点时间节点倒计时——最后两节是市场动态分析和采集说明。整个报告的逻辑是:先告诉发生了什么(重大更新),再告诉你正在发生什么(跟进中),最后告诉你接下来要关注什么(时间节点+市场趋势)。

Excel报告是另一回事了。两个Sheet,第一个是标讯明细,16列数据,每行用不同底色标记——黄底是新增、绿底是已出结果、橙底是已截止、蓝底是持续跟进。表头冻结在第一行,怎么滚屏幕表头都不会丢。第二个Sheet是统计分析,有机构类型分布和服务类型分布的柱状图,拿去给领导汇报直接能用。

配了IMA的话,报告会自动同步到企业微信智能文档的指定笔记本。团队其他人打开企业微信就能看到,不需要你额外转发。

Part.06 坦诚地说,它还不够完美

虽然体检评分99分,但我很清楚它还有很多局限。

搜索引擎的索引有延迟。一条标讯今天发布了,可能1到3天后才能被搜索引擎收录,也就是说当天的采集必然会有遗漏。这个问题的本质是依赖搜索引擎作为数据源带来的固有限制,短期内没什么好办法,只能通过延长采集周期(往前推5天)来尽量弥补。

部分平台的页面是JS渲染的。深交所的电子招投标系统、一些银行的官网,它们的页面用JavaScript动态加载内容,AI的WebFetch工具只能拿到一个空的HTML骨架。目前只能依赖搜索引擎的摘要信息来补充,标讯详情标记为"待核实"。

商业聚合平台有会员限制。采招网、知了标讯这些平台,部分核心内容需要登录甚至付费才能查看。没有凭证的情况下,只能拿到标题和摘要,详细金额和中标信息可能缺失。

金额格式五花八门。前面提到过,"98.07万元""约500万""¥1,063.00""以最终合同为准"……虽然金额解析函数已经覆盖了大部分常见格式,但总会有一些极端不标准的写法需要人工判断。

IMA同步依赖外部API密钥。密钥过期了同步就断了,需要手动去刷新。自动化流程被外部依赖卡住,这种事在IT行业太常见了。

这个Skill现在能帮我省下每天两三个小时的重复劳动,覆盖40个渠道的标讯采集,产出一份结构化的报告。不够完美,但够用。

剩下的,在迭代中慢慢完善就好。

Part.07 最后

为什么要做这个Light版本?因为我经历过那种每天手动翻标讯的日子,知道那有多痛苦。每天两三个小时,一年就是六七百个小时。这些时间如果花在分析标讯趋势、做投标策略、跟客户交流上,能创造更大的价值。

如果这个Skill能帮到其他做安全行业的朋友,哪怕只是帮他们每天省下一两个小时,就值得把它分享出去。

分享这件事,跟做这个Skill本身是一样的逻辑——做过的事情沉淀下来,让有用的东西流动起来。

All is well。


写于2026年6月2日

引用链接

[1] bid-news-collection-light: https://skillhub.cn/skills/bid-news-collection-light


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询