我要投稿

AI数据处理实战：如何从每个标题中提取品牌名称？

发布日期：2024-06-09 03:37:13 浏览次数： 3676

作者：白领服务工作室

微信搜一搜，关注“白领服务工作室”

有时，我们需要从一小段文本内容中提取名牌名称。如果是人工来挑选，在文本较多时，就会显得吃力费时。这时，使用AI大模型来帮助我们提取，是非常高效的。例如下面的例子：

以上是表格的截图，A列的10行，也就是10个单元格，从每个单元格的文本中提取品牌的名称。上面只是10个单元格，如果是几百个或几千个单元格，需要提取品牌名称，会是非常麻烦的事情。如何使用AI大模型来处理呢？

对于使用大模型来说，prompt是非常重要的，不同的prompt，大模型会给出不同的结果。所以，调试出最优的prompt，得到我们所需的结果，才是使用大模型最重要的环节。

1、使用通义大模型

我们调试几次后得到下面的prompt：

任务：提取表格中10个单元格中出现的所有品牌的名称

要求如下：

1、每个单元格提取的结果输出为一行，表格有10个单元格，输出结果也是10行，每行结果前加上1、2、3的序号；

2、如果某个单元格没有品牌名称，则输出无；

3、如果某个单元格有多个品牌名称，请全部提取，并输出为一行，同用中划线将多个品牌名称分隔开。

得到的结果如下所示：

我们看到，有一些小错误：

第3行：优衣库后面错误加上了一些文字

第8行：其实是没有品牌名称，错误提取了一些文字

第10行：多个品牌名称的问界，后面错误加上了汽车

2、使用文心一言大模型

文心大模型无法上传表格，这里直接在prompt里面加上文本，但是如果是大量文本，放在prompt里面，会突破token上限，此时最好直接调用API来完成。

我们调试几次后得到下面的prompt：

文本内容如下：

奥克斯电蚊拍充电式家用强力锂电池灭蚊灯二合一驱蚊神器打苍蝇拍

全棉时代洗脸巾擦脸巾平纹M码洁面巾纯棉柔巾100抽*1包洗面巾

优衣库男装女装凉感大师T AIRism宽松圆领T恤五分袖短袖465185

湿厕纸便携小包10片X1包擦洁厕湿纸巾女性经期湿巾旅行家用维达

防晒服拉夏贝尔女2024夏季新款高倍防晒长袖修身显瘦百搭时尚外套

飞科剃须刀男士电动刮胡刀官方旗舰店正品送男友父亲节礼物送爸爸

三只松鼠手撕面包1000gX1箱零食早餐首选休闲食品三只松鼠蛋糕点心吐司

意式极简床头柜2024新款轻奢高级感实木简约现代卧室床边保险柜子

虎牌保险柜箱智能床头柜一体家用防盗无线充电现代多功能2024新款

我喜欢心心相印的纸巾，你喜欢百果园的水果，他喜欢问界汽车

要求如下：

1、从以上10行文本中出现的所有品牌的名称；

2、每一行文本提取的结果输出为一行，每行结果前加上1、2、3的序号；

3、如果某一行文本中没有品牌名称，则输出无；

4、如果某一行文本中有多个品牌名称，请全部提取，并输出为一行，同用中划线将多个品牌名称分隔开。

得到的结果如下所示：

我们看到，只有1个小错误：

第10行：多个品牌名称的问界，后面错误加上了汽车

相比通义，文心的结果更好。

3、使用豆包大模型

使用的Prompt同文心一言，得到的结果如下：

我们看到，结果完全符合我们的需求，没有任何小错误。看来，豆包的理解能力更强大啊！

总结

通过上面的案例，我们可以得到下面的经验：

1、调试好prompt最重要。

2、不同的大模型，可能会得到的结果，所以，要尝试不同的大模型。

3、在数据量较多时，最好使用API调用。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-06-16

企业AI知识库能做什么？六个已验证场景

2026-06-16

Google 推出 Open Knowledge Format (OKF)：AI Agent 知识库的中立标准

2026-06-16

我让 AI 替我养了半年个人知识库,然后 Google 发布了 OKF——把我瞎摸出来的那套,写成了规范

2026-06-16

做知识管理，就记住这三句话

2026-06-15

用AI构建知识架构

2026-06-15

Google 把「让 LLM 维护知识库」写成了规范：我照这个思路跑了半年

2026-06-15

Google 发布 OKF：AI 知识库的开放格式来了

2026-06-12

如何快速地拥有一个帮你管理知识库的agent

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

教程｜用腾讯乐享AI知识库+WorkBuddy构建内容生产工作流

2026-03-31

AI大神卡帕西的知识管理方法刷屏，用Get笔记六步抄作业

2026-04-07

最近的AI信息焦虑，被阿里Agent团队治好了（附赠工具）

2026-03-23

Obsidian + Codex：把本地文档变成可被 AI 维护的知识库

2026-04-28

从检索到理解：Karpathy的LLM Wiki为什么比RAG高一个维度

2026-04-12

我试了 Karpathy「让知识自己长出来」的方法，踩了 4 个坑

2026-04-07

全网都在抄 Karpathy 的知识库，但大多数人只学到了皮毛

2026-04-13

大模型时代本体论Ontology驱动的AI知识引擎助力企业智能决策系统的未来进化-一篇献给企业董事会和CIO的深度思考(第一篇)

2026-04-01

AI研发自动化：Wiki知识库+技能包

2026-06-04

Karpathy又双叒叕发新概念了，这次我替你找到了那个产品

2026-04-07

大家都在问

RAG vs 微调 vs 本体：企业知识管理三条路，该走哪条？

2026-06-04

Harness Engineering 实践：LLM Wiki 什么时候、怎么引入?

2026-06-01

企业知识库里的元数据，到底应该怎么用？

2026-05-27

Claude 盯上小老板：Coding 之后，下一个吞 Token 兽？

2026-05-14

AI行业正从“卖Token”转向“卖组织认知能力”，咨询业浴火重生？

2026-05-10

Agent 从“能用”到“管好”，中间差了什么？

2026-05-08

AI Coding思考：从工具提效到范式变革，我们还缺什么？

2026-03-02

.md 编译了个人认知，什么来编译企业的认知？

2026-02-27

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw