我要投稿

【Skill分享】：网络安全领域标讯采集助手Skill

发布日期：2026-06-09 18:09:44 浏览次数： 1516

作者：SecNewsAI攻防

微信搜一搜，关注“SecNewsAI攻防”

标讯就是知己知彼，百战不殆的关键来源。

通常企业有相关标讯系统进行漫长的信息搬运——中国政府采购网、采招网、深交所电子招投标系统、知了标讯、金融采购网……然后通过CRM等平台同步到一线团队，随着AI时代的到来，标讯的获取或许不需要从总部一级一级传递下来，每个前场，销售都可以尝试通过Skill+AI Agent的方式获取定制化的标讯。

我算过，如果手工采集标讯，时间少则两三个小时，多则半天。做的都是机械的事情，但没有捷径可走。而且金融行业的网络安全标讯来源实在太分散了，你少看一个网站，可能就漏掉一条几十万甚至上百万的项目信息。

Part.01 那些年，我翻过的标讯网站

做安全行业的朋友，大概多少都经历过类似的事情。

金融行业的网络安全标讯，来源极其分散。国家级平台有中国政府采购网、招标投标公共服务平台、全国公共资源交易平台、中央政府采购网、中国采购与招标网五个，这五个是最权威的，覆盖率高，公告格式也规范。但光靠它们远远不够。

金融直连平台更多。深交所有自己的电子招投标系统，上交所、中金所各有各的采购信息页面。央行集中采购中心负责央行及下属机构的采购公告，成方金融信息技术经常发布安全产品的采购项目。国家开发银行用的是"征集+采购"模式，金融采购网则聚合了大量银行、证券、保险机构的标讯。

再往外围看，三大运营商的采购平台——中国移动、中国电信、中国联通，还有能源央企——国家电网、南方电网、国家能源集团、华能、大唐、华电、中石化，这些看起来跟金融行业关系不大，但实际上它们的信息安全采购量不小，而且供应商群体跟金融机构高度重叠。如果你在做市场分析或者竞争情报，这些信息必不可少。

更不用说采招网、千里马、乙方宝、政采云这些商业聚合平台，加上深圳公共资源交易中心、蚂蚁投标等辅助渠道。

加在一起，一个比较完整的标讯采集，需要覆盖的信息源至少有几十个。一个人每天要翻完这些网站，还要确保不遗漏、不重复、不记错金额和日期，几乎是不可能完成的任务。

但过去很长一段时间，我就是这么过来的。因为这是工作需要，因为没有更好的办法。

Part.02 从10个渠道到40个渠道

转机出现在我开始认真研究AI技能的时候。

我想的是：既然AI已经能帮我做很多事情了，标讯采集这件事，能不能也交给它？

说干就干。最先做出来的版本叫 bid-news-collection，v1.0，只覆盖了10个采集渠道，三线关键词体系——安全服务线、安全产品线、运维平台线。每条线配一组关键词，用AND和OR的组合去搜索引擎里搜。

跑完第一轮，结果出来了。十几二十条标讯，不多，但确实能用。比手动翻快了不少，我心里清楚，10个渠道远远不够。

问题在哪？覆盖面太窄。央行系的项目在中国政府采购网上能看到一些，但深交所、上交所的采购公告要去各自的平台才能找到。能源央企的安全采购虽然不是金融机构发的，但那些项目背后的供应商信息，对于判断市场趋势有参考价值。10个渠道只是冰山一角。

于是开始了迭代。

v1.3，加了中国移动和国家电网两个渠道，10变成12。

v1.4，做了一个比较重要的改动——关键词体系重构。原来三线的颗粒度太粗，我重新梳理了一遍。安全服务线从几个关键词扩展到了12个——等保、等级保护、密评、密码评估、渗透测试、攻防演练、重保、护网、安全评估、安全检测、安全审计、风险评估。安全产品线扩展到15个——防火墙、IPS、IDS、WAF、漏洞扫描、态势感知、堡垒机、数据库审计、邮件安全、DLP、零信任、EDR、XDR、数据安全、数据防泄漏。运维平台线9个词。

同时引入了第四条线——"行业搜索线"。工控安全、电力监控安全、物联网安全、云安全、数据分类分级、主机安全、终端安全，7个垂直领域的关键词。

这四条线形成了一个交叉搜索网络：前三线按采购内容纵向切分——你要找什么类型的服务或产品；行业线按应用领域横向切分——你要覆盖哪些行业场景。纵线和横线交叉，理论上能把绝大部分金融行业网安标讯都捞到。

v1.5正式定型了四线43词体系，搜索策略从原来的几轮变成了8轮横纵交叉搜索——每条线配不同的机构限定词（银行/证券/保险/金融），再叠加时效过滤（2026），形成完整的查询组合。

到了v1.6，我做了一次比较大的渠道扩展。12个渠道一下子扩到了40个，按优先级分成四个层级：

P0是5个国家级官方平台，必须采集，这是最权威的数据源。P1是22个重点渠道——9个金融直连平台、3个运营商、10个能源央企，覆盖了金融行业和关联行业的主要采购信息源。P2是12个商业聚合平台，用来扩大覆盖面，从不同搜索引擎的角度补充数据。P3是4个辅助渠道，按需查询，补漏用。

从10到40，看起来只是一个数字的变化，但背后的工作量不小。每个新渠道都要研究它的页面结构、搜索方式、注意事项——深交所的页面是JS渲染的，搜索引擎抓不全；采招网和知了标讯部分内容需要会员才能查看；国家电网的ECP2.0平台公告格式有自己的一套规范。这些细节不处理好，采集出来的数据质量就会大打折扣。

整个迭代过程大概花了两天。从v1.0到v1.6，一天之内完成了六次版本更新。说实话，我自己都有点惊讶迭代的速度——与其说是因为效率高，不如说是因为痛点足够深。每天手动翻网站的痛苦给了我很强的动力去完善它。

Part.03 它到底干了什么

很多人可能好奇，这个Skill跑起来之后，产出的东西长什么样。

我不想按功能列表的方式来讲，那太像产品说明书了。我想从一个实际的场景说起。

每天早上，它会在设定的日期范围内自动执行采集——以当天为基准，往前推5天，共6天的标讯数据。40个渠道按优先级分批搜索，四线关键词交叉覆盖，8轮搜索组合跑下来，去重后大概能拿到30到40条有效标讯。

每条标讯会提取12个标准字段——项目名称、内容总结、服务类型、招标方、机构类型、时间、金额、采购方式、状态、原文链接、链接核实状态、备注。12个字段看起来不多，但每一条都需要从原始公告中准确提取。比如金额，有的公告写"98.07万元"，有的写"约500万"，有的写"￥1,063.00"，还有的写"以最终合同为准"——我专门写了一个金额解析函数来处理这些五花八门的格式。

提取完成后，所有标讯按四种分类规则归档：本期重大更新（新中标、新公示）、近期结果公示汇总、本期已截止（截止但结果未公布）、持续跟进项目（仍在招标中）。每种类别有对应的颜色标记和紧迫度分级——3天内截止的标⚠️，今天或明天截止的标⚠️⚠️。

输出两份报告。一份是Markdown格式的详细报告，8个章节，从采集概况到市场动态分析，适合阅读和分享。一份是Excel数据报告，两个Sheet——标讯明细16列数据，带四色编码和冻结窗格；统计分析含机构类型分布和服务类型分布的柱状图，适合进一步筛选和汇报。

如果你配了IMA（在线知识库），报告还会自动同步到指定的笔记本里。团队其他人打开企业微信就能看到最新标讯，不需要你额外转发。

坦白讲，这个Skill对我来说最大的价值，不是它能覆盖40个渠道或者提取12个字段这些数字。而是每天早上，它替我做了那两三个小时的体力活。我可以把省下来的时间花在更有价值的事情上——分析标讯背后的市场趋势、判断哪些项目值得跟进、提前准备投标策略。

这大概就是工具的意义——它不是替代你思考，而是把你从重复劳动中解放出来，让你有时间去做真正需要人的判断力和经验的事情。

Part.04 用起来到底多简单

说了这么多原理和设计，可能还是有人会想：这个东西我能用吗？需要会写代码吗？

我专门做了一个可分享的Light版本，把所有个人路径和敏感配置都移除了。你可以在这里下载：bid-news-collection-light^[1]

拿到压缩包之后，整个上手过程分三步。

第一步：解压。 没什么好说的，解压到一个你喜欢的目录就行。目录结构很干净，核心就是一份SKILL.md（采集说明）、一份config.json（配置文件）、几个Python脚本和模板文件。

第二步：配置。 运行一条命令，会启动一个交互式配置向导。向导会问你两个问题：标讯报告保存到哪个目录？要不要同步到企业微信智能文档（IMA），如果要的话填一个笔记本ID。回答完这两个问题，config.json自动生成，所有路径都写好了。整个过程不超过一分钟。

第三步：让AI跑。 配好之后，打开你的AI助手，把SKILL.md丢给它，说一句「按照SKILL.md的步骤执行标讯采集」。然后你就可以去泡咖啡了。AI会按照预设的8轮搜索策略，40个渠道逐一采集，去重、提取字段、分类归档、生成报告。大概十来分钟，一份完整的标讯报告就出现在你指定的目录里了。

不需要懂Python，不需要装环境，不需要配置搜索引擎API。只要你会跟AI说话就行。

Part.05 它跑起来长什么样

那跑出来的东西到底长什么样？我拿最近一次实际采集的结果来说。

Markdown报告一共8个章节。第一个章节是采集概况，一张统计表——总采集条数、本期重大更新几条、持续跟进几个、链接核实率多少、已知金额合计多少，一眼就能看到全局。这个设计受了项目管理中仪表盘思维的启发：先看全貌，再钻细节。

第二个章节是本期重大更新。这里不是简单的列表，每条标讯都有一张详细的字段表——招标方、机构类型、服务类型、采购方式、金额，一目了然。如果有候选人公示，还会附一张候选人排名表：第1名是谁、报价多少、得分多少。

比如5月底那期报告中，有一条深交所的标讯让我印象比较深——「深交所虚拟磁带库维保服务采购」，飞创信息科技以98.07万（含税）中标。12个标准字段全部提取到位，原文链接已核实可访问。这种信息的精准度和完整性，放在以前手动采集的时候，至少要花二十分钟去核对。

第三个章节往后，分别是结果公示汇总表、已截止项目、持续跟进项目、重点时间节点倒计时——最后两节是市场动态分析和采集说明。整个报告的逻辑是：先告诉发生了什么（重大更新），再告诉你正在发生什么（跟进中），最后告诉你接下来要关注什么（时间节点+市场趋势）。

Excel报告是另一回事了。两个Sheet，第一个是标讯明细，16列数据，每行用不同底色标记——黄底是新增、绿底是已出结果、橙底是已截止、蓝底是持续跟进。表头冻结在第一行，怎么滚屏幕表头都不会丢。第二个Sheet是统计分析，有机构类型分布和服务类型分布的柱状图，拿去给领导汇报直接能用。

配了IMA的话，报告会自动同步到企业微信智能文档的指定笔记本。团队其他人打开企业微信就能看到，不需要你额外转发。

Part.06 坦诚地说，它还不够完美

虽然体检评分99分，但我很清楚它还有很多局限。

搜索引擎的索引有延迟。一条标讯今天发布了，可能1到3天后才能被搜索引擎收录，也就是说当天的采集必然会有遗漏。这个问题的本质是依赖搜索引擎作为数据源带来的固有限制，短期内没什么好办法，只能通过延长采集周期（往前推5天）来尽量弥补。

部分平台的页面是JS渲染的。深交所的电子招投标系统、一些银行的官网，它们的页面用JavaScript动态加载内容，AI的WebFetch工具只能拿到一个空的HTML骨架。目前只能依赖搜索引擎的摘要信息来补充，标讯详情标记为"待核实"。

商业聚合平台有会员限制。采招网、知了标讯这些平台，部分核心内容需要登录甚至付费才能查看。没有凭证的情况下，只能拿到标题和摘要，详细金额和中标信息可能缺失。

金额格式五花八门。前面提到过，"98.07万元""约500万""￥1,063.00""以最终合同为准"……虽然金额解析函数已经覆盖了大部分常见格式，但总会有一些极端不标准的写法需要人工判断。

IMA同步依赖外部API密钥。密钥过期了同步就断了，需要手动去刷新。自动化流程被外部依赖卡住，这种事在IT行业太常见了。

这个Skill现在能帮我省下每天两三个小时的重复劳动，覆盖40个渠道的标讯采集，产出一份结构化的报告。不够完美，但够用。

剩下的，在迭代中慢慢完善就好。

Part.07 最后

为什么要做这个Light版本？因为我经历过那种每天手动翻标讯的日子，知道那有多痛苦。每天两三个小时，一年就是六七百个小时。这些时间如果花在分析标讯趋势、做投标策略、跟客户交流上，能创造更大的价值。

如果这个Skill能帮到其他做安全行业的朋友，哪怕只是帮他们每天省下一两个小时，就值得把它分享出去。

分享这件事，跟做这个Skill本身是一样的逻辑——做过的事情沉淀下来，让有用的东西流动起来。

All is well。

写于2026年6月2日

引用链接

[1] bid-news-collection-light: https://skillhub.cn/skills/bid-news-collection-light

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业