支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


如何让你的网站内容更好被AI收录和推荐?(技术篇)

发布日期:2025-06-23 07:05:08 浏览次数: 1546
作者:次元乔伊

微信搜一搜,关注“次元乔伊”

推荐语

AI正在改变用户获取信息的方式,掌握AISEO技术让你的内容在AI时代脱颖而出。

核心内容:
1. 传统SEO与AISEO的关键区别解析
2. llms.txt文件的作用与创建指南
3. 实战案例:如何让AI更好地推荐你的商品

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

前段时间,有个做电商朋友跟我说,他的订单有20-30%是靠豆包过来的,我当时听了之后一脸蒙蔽,豆包为什么能给你带订单?随后他给我演示了豆包如何推荐他们的产品的,我看完之后恍然大悟。

原来是他的很多商品和内容都投喂给了AI,让各种AI模型都了解了他的产品和内容,这样AI在推荐产品的时候就会很好的推荐他家的东西。比如我随便问豆包,适合的电动牙刷,他就很快的推荐了出来(图文无关~)

“干掉你的不一定是同行” 这句话从未像今天这样振聋发聩。随着ChatGPT、Claude、DeepSeek、豆包等AI大模型发展,用户获取信息的方式正在经历一场颠覆性的变革。

以前你找个东西,会打开百度,谷歌或者小红书搜一下,但现在的情况是:ChatGPT已经在许多人眼中替代了谷歌,而豆包,DeepSeek在00后那里也正在悄然取代百度。

那作为内容或者商品提供方,如何让AI高效的收录和推荐你的内容呢?

传统SEO与AISEO的关键区别

首先我们要理解AISEO和传统SEO的区别和联系。 首先我们在谷歌搜索一个名字,例如 这是谷歌的搜索结果,而且是AI推荐的,右侧是AI推荐的来源:

从搜索引擎推荐的答案和大模型给出的答案,可以区分出两者的区别

  • 传统SEO: 核心在于通过robots.txt控制爬虫访问权限,sitemap.xml列出可索引页面,并优化页面的HTML和元数据,其主要服务对象是搜索引擎蜘蛛
  • AISEO: 强调提供结构化、简洁且机器易读的内容概览,旨在帮助AI快速定位并理解网站核心信息,最大限度地减少无关内容的干扰。网站需要更优质的内容。

llms.txt的诞生与深远意义

大模型收录和抓取的内容会有一套收录标准,就像前几天Anthorapic公布的多智能体在解决某个问题的处理思路:相互佐证。

一方面我们需要做好网站的质量,另一方面我们需要给大模型一份新手指南。告诉大模型我们这个网站或者内容主要是干什么的。这个新手指南就是llms.txt,他的作用是为大型语言模型提供结构化、精炼的内容导航。它的出现有效地解决了AI抓取网页时的效率与准确性问题,标志着内容策略正向“AI优先”的重大转变。

比如我做了一个计算睡眠的网站 sleepcalculator睡眠时间计算, 

我会让AI帮我写一份llms.txt,

# 引导AI爬虫到llms.txt
LLM-Content: https://sleepcalculator.today/llms.txt
LLM-Full-Content: https://sleepcalculator.today/llms-full.txt

大家可以访问这个地址查看具体写了什么

# Sleep Calculator

> Sleep Calculator helps you calculate the perfect bedtime or wake-up time based on 90-minute sleep cycles, so you can wake up refreshed and alert.

Sleep Calculator is a free online tool designed to help you optimize your sleep schedule. By entering your desired wake-up or bedtime, the calculator recommends the best times to go to bed or wake up, based on the science of 90-minute sleep cycles. This helps you avoid waking up in the middle of a sleep cycle, so you feel more refreshed and alert.

## How It Works
- The average person takes about 15 minutes to fall asleep.
- A good night's sleep consists of 5 to 6 complete sleep cycles, each lasting about 90 minutes.
- Waking up in the middle of a sleep cycle can leave you feeling groggy, while waking up between cycles helps you feel more refreshed.
- The calculator uses your input to recommend optimal times, so you can plan your sleep more effectively.

## Core Content
- [Sleep Calculator](https://sleepcalculator.today): Calculate your ideal bedtime or wake-up time.
- [How it works](https://sleepcalculator.today): Learn about sleep cycles and why timing matters.

## FAQ
- **What is a sleep cycle?**
  A sleep cycle is a period of about 90 minutes during which your brain and body go through different stages of sleep.
- **Why is it important to wake up between cycles?**
  Waking up between cycles helps you feel more refreshed and alert, as opposed to waking up during deep sleep.
- **How accurate is the calculator?**
  The calculator is based on average sleep science, but individual needs may vary.

## Contact
- [Contact](https://sleepcalculator.today): For questions, feedback, or support, please reach out to us.

## About
- [About](https://sleepcalculator.today): Learn more about our mission, team, and the science behind Sleep Calculator. 

所以通过这个文件,我让大模型理解了我的网站。当然我这个网站比较简单,理论上类似电商网站,独立站对应的llm会更加复杂。

核心文件对比:robots.txt、sitemap.xml与llms.txt

下表清晰展示了这三个关键文件的作用、目标对象及格式,帮助你更好地理解它们之间的差异和联系:

文件名
作用
目标对象
格式
robots.txt
控制爬虫访问权限
搜索引擎蜘蛛
纯文本
sitemap.xml
列出网站所有可索引页面
搜索引擎
XML
llms.txt
提供结构化网站内容概览
大型语言模型(AI)
Markdown

简而言之,robots.txt告诉爬虫“哪些页面可以访问”,sitemap.xml帮助爬虫“发现所有页面”,而llms.txt则专为AI模型设计,提供简洁清晰的内容导航和描述,旨在显著提升AI对网站内容的理解和引用能力。


如何创建和部署llms.txt文件

1. 文件位置与访问规范

llms.txt文件放置在网站的根目录,并确保它可以通过https://example.com/llms.txt公开访问。

你也可以选择性地创建llms-full.txt文件,其中包含网站所有核心内容的更详细Markdown版本,供那些需要深入理解的AI使用。

2. 文件结构与内容设计要点

llms.txt文件采用Markdown格式,结构应清晰明了,便于AI解析。假如你是电商独立站,那么可以按照下面的框架填入或者让AI来帮你写:

# **[您的电商网站名称]**

**[您的电商网站名称]** 是一个专注于 **[具体产品类别,例如:时尚服饰,手工艺术品,电子产品等]** 的在线商店。我们致力于为客户提供 **[核心价值,例如:高品质的产品,独特的设计,卓越的购物体验,实惠的价格等]**,让购物变得简单又愉快。

## 核心内容
  - **[产品分类/品类名称]** ([https://your-ecommerce-site.com/categories](https://www.google.com/search?q=https://your-ecommerce-site.com/categories)): 浏览我们精心挑选的 **[产品类别,例如:最新款女装、潮流男鞋、精美手工艺品、智能家居设备等]**。
  - **[购物服务/特色]** ([https://your-ecommerce-site.com/services](https://www.google.com/search?q=https://your-ecommerce-site.com/services)): 享受我们的 **[服务范围,例如:全球配送、快速发货、7天无理由退换货、在线客服支持等]**。
  - **[时尚/生活/购物指南]** ([https://your-ecommerce-site.com/blog](https://www.google.com/search?q=https://your-ecommerce-site.com/blog)): 发现最新的 **[博客主题,例如:时尚潮流、产品搭配技巧、生活灵感、购物攻略等]**。
## 常用资源
  - **[购物帮助/常见问题]** ([https://your-ecommerce-site.com/faq](https://www.google.com/search?q=https://your-ecommerce-site.com/faq)): 在这里找到关于订单、支付、物流、退换货等方面的常见问题解答,让您的购物过程更加顺畅。
  - **[联系客服]** ([https://your-ecommerce-site.com/contact](https://www.google.com/search?q=https://your-ecommerce-site.com/contact)): 如果您有任何疑问或需要帮助,请随时通过 **[联系方式,例如:在线聊天、邮件、电话等]** 联系我们的专业客服团队。

## Optional
  - **[关于我们/品牌故事]** ([https://your-ecommerce-site.com/about](https://www.google.com/search?q=https://your-ecommerce-site.com/about)): 了解我们的品牌理念、创立故事以及我们对产品质量和客户服务的承诺。
  - **[客户评价/晒单分享]** ([https://your-ecommerce-site.com/reviews](https://www.google.com/search?q=https://your-ecommerce-site.com/reviews)): 查看其他顾客的真实购物评价和产品晒单,帮助您做出更明智的购买决策。

设计要点:

  • 简洁明了: 使用简短的描述突出核心内容,避免冗长。
  • 结构分明: 使用一级标题(#)标明网站名称,二级标题(##)划分内容模块,逻辑清晰。
  • 链接清晰: 每条内容使用- [名称](链接): 简短描述的格式,方便AI快速定位目标信息。
  • Optional区块: 放置次要或辅助内容,AI可根据自身的上下文窗口大小灵活选择是否读取。

四、robots.txt中如何引导AI爬虫访问llms.txt

robots.txt文件中,你需要添加针对AI爬虫的特定规则,明确允许它们访问核心内容,并指明llms.txt文件的位置:

User-Agent: *
Allow: /
Disallow: /admin/
Disallow: /private/
Sitemap: https://example.com/sitemap.xml

# AI爬虫特定规则
User-agent: GPTBot
User-agent: Claude-Web
User-agent: Anthropic-AI
User-agent: PerplexityBot

# 指引AI爬虫访问llms.txt文件
LLM-Content: https://example.com/llms.txt
LLM-Full-Content: https://example.com/llms-full.txt
Allow: /blog/
Allow: /products/
Allow: /about/
Disallow: /user-content/

实操建议:

  • 明确列出主流AI爬虫的User-agent,确保它们能够获得必要的访问权限。
  • 使用LLM-ContentLLM-Full-Content字段指向对应的llms文件,方便AI快速发现和利用。
  • 阻止访问无关或敏感内容,以节省爬取资源并保护隐私。

llms.txt的实际应用与工具支持

市面上已有一些工具可以帮助你创建和管理llms.txt文件:

工具名称
描述
生成方式
链接
llmstxt by dotenv
开源命令行工具
基于sitemap.xml生成
https://github.com/dotenvx/llmstxt
llmstxt by Firecrawl
使用Firecrawl爬虫生成
抓取网站内容
https://llmstxt.firecrawl.dev/
Mintlify文档平台
自动生成文档平台llms.txt文件
自动生成
https://mintlify.com/
LLMs.txt Generator
WordPress插件
自动创建管理
https://wordpress.org/plugins/llms-txt-generator/

3. 维护与更新策略

  • 定期同步更新llms.txt文件,以反映网站结构和内容的变化。
  • 保持文件简洁,将最重要的内容放在靠前位置,次要内容则放入## Optional区块。
  • 确保llms-full.txt文件中移除了所有无关标记,保证其纯净的Markdown格式。

最后

llms.txt标准代表了面向AI的内容优化新范式。它为大型语言模型提供了结构化、易于解析的内容导航,极大地提升了AI抓取效率和内容理解的准确性。网站所有者通过部署llms.txt,不仅能够提升在AI平台上的可见性和引用率,还可能在AI驱动搜索中获得潜在的排名优势。结合传统SEO的robots.txtsitemap.xml,构建AI友好型网站。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询