工具
GEO 检测工具
从权威性、相关性、结构性、用户价值四个维度评估内容的 GEO 表现,并给出可执行的优化建议
TL;DR:GEO 检测工具用于评估一篇内容(网页或纯文本)在生成式 AI 引擎中被理解、信任、引用的可能性。围绕四个核心维度(权威性、相关性、结构性、用户价值)打分,给出每个扣分项的具体修复建议。
GEO 检测工具
检测 URL 或粘贴文章,立即获得 0–100 分评估 + 修复建议。
检测不是一锤子买卖。建议在新增内容、调整结构、补充资料来源之后都重新跑一次,把每次结果当作"下一轮迭代的输入"。
当前版本:文本检测已上线,URL 检测在 Stage 2 接入。LLM 语义评分(DeepSeek)在 Stage 3 接入。
两种检测模式
| 模式 | 适用场景 | 输入 |
|---|---|---|
| URL 检测 | 已上线的页面、文章、产品介绍 | 一个公开可访问的网址 |
| 文本检测 | 草稿、未发布内容、片段评审 | 直接粘贴 Markdown / 纯文本 |
两种模式输出格式一致,但 URL 检测会额外评估技术维度(结构化数据、标题层级、可达性、是否 SSR 等),文本检测则更关注语义和组织。
评分维度
权威性(Authority)
评估内容来源、作者背景、引用质量是否足以让 AI 引擎"敢于引用"。
- 作者身份、署名和资历是否清晰
- 每千字 3–5 条具名引用,且必须链向具体文章 URL,不是站点首页(业内研究表明,按这套规则补引用可提升 AI 可见度约 40%)
- 数据 / 结论是否带有发布日期、版本信息、可追溯来源
- 是否被外部权威站点链接或提及
相关性(Relevance)
衡量内容是否真正回答了目标查询,而非堆砌关键词。
- 主题与目标关键词的语义匹配度
- 用户意图(信息型 / 导航型 / 交易型 / 比较型)覆盖是否完整
- 是否覆盖了相关子问题与上下文
- 是否在文章开头放了一段"快速答案 / TL;DR"块,让 AI 能从 above-the-fold 直接抽出答案
- 是否避免了无关或冗余段落
结构性(Structure)
AI 引擎更容易解析结构清晰的内容。这一维度评估页面的"可机读性"。
- 标题层级是否合理(H1 唯一、H2/H3 嵌套自洽)
- 关键信息是否使用列表、表格、定义块等结构化形式
- JSON-LD 三层叠加:在适合的页面同时使用
Article+FAQPage+HowTo(或Product+Review),不要只放一个 - 服务端渲染(SSR):AI 爬虫普遍不执行 JS,关键内容必须在初始 HTML 里就出现。详见 llms.txt 与 AI 爬虫
- 段落长度、段间过渡是否合理
用户价值(User Value)
最难量化也最重要的一项:内容是否对真实用户"有用"。
- 是否提供可操作的步骤、模板、代码或示例
- 是否包含独立见解,而非对他人内容的转述
- 是否预判并回答了读者的后续问题(FAQ 区块特别加分)
- 阅读后用户是否能"少看一篇其他文章"
输出报告
每次检测产生的报告包含:
- 总分(0–100) —— 四维度加权汇总
- 维度评分 —— 每个维度独立打分,便于定位短板
- 扣分项明细 —— 命中的每条规则、扣分值、问题描述
- 修复建议 —— 针对每条扣分项的具体改写或补充建议
- 优先级排序 —— 高影响 × 易修复 的项目排在最前
检测频率建议
业内 2026 共识是高价值内容每 7–14 天就要刷新一次(即使是改时间戳 + 小幅补充),否则 AI 引擎的新鲜度信号会迅速衰减、引用优先级掉档。
| 内容状态 | 建议频率 |
|---|---|
| 新建内容上线前 | 至少 1 次,分数 < 70 不上线 |
| 高优先级 / 重点引流页 | 每 7–14 天一次 |
| 一般已上线内容 | 每月 1 次 |
| 长尾内容 | 每季度 1 次 |
| 大版本改版后 | 全站抽样重检 |
发布前检查清单
对照检查,少一项就回去补:
- 文章开头有独立的 TL;DR / 快速答案块(一段话内可独立摘出)
- 标题层级唯一且自洽(H1 唯一、H2/H3 嵌套合理)
- 每千字 3–5 条具名引用,链向具体文章 URL
- 至少一处原创数据 / 案例 / 流程图
- 作者署名 + 简短资历介绍
- JSON-LD:至少
Article,能叠加FAQPage/HowTo更好 - FAQ 区块(覆盖读者的下一个问题)
-
curl -A "GPTBot" <URL>验证 SSR 输出包含正文