← 返回GEO学院
GEO基础

阅读GEO: Generative Engine Optimization论文:心得(一)

从KDD 2024论文GEO: Generative Engine Optimization出发,解释GEO研究真正解决的问题:AI搜索不是传统排名页,而是检索、生成、引用共同决定品牌可见性。

发布于 2026-06-08 5 分钟阅读
GEO优化Generative Engine OptimizationAI搜索可见性GEO论文

阅读GEO: Generative Engine Optimization论文:心得(一)

很多人第一次听到GEO,会把它理解成“给AI搜索做SEO”。

但Pranjal Aggarwal、Vishvak Murahari等作者在KDD 2024论文《GEO: Generative Engine Optimization》里提出的核心问题更细:当AI搜索把多个来源压缩成一段答案时,内容创作者到底应该怎样定义“被看见”?

这篇心得先不讨论具体改写技巧,只看论文的研究起点。它最有价值的地方,是把GEO从营销口号拉回到一个可建模、可测量、可实验的问题。

论文为什么要先定义Generative Engine

论文把BingChat、Google SGE、Perplexity.ai这类系统抽象为Generative Engine,也就是生成式引擎。它不是只返回蓝色链接,而是先检索来源,再由生成模型整合信息,最后给用户一段带引用或来源依据的回答。

这一步很关键。传统SEO通常围绕搜索结果页排名展开,问题是“我的页面排第几”。但在生成式引擎里,用户看到的不是一串网页,而是一段综合答案。

同一个来源可能出现在答案开头、中间、结尾;可能被引用一句,也可能贡献一整段;可能支撑核心判断,也可能只是补充背景。只用“排名”解释GEO,会漏掉这些差异。

GEO真正关心的是可见性,而不只是出现

论文把网站在生成式答案中的visibility,也称为impression,作为GEO的核心目标。换句话说,一个品牌或页面是否被AI搜索“看见”,不能只看有没有被提到。

至少要看三个层面:

  1. 答案里有多少内容来自这个来源。
  2. 这些内容出现的位置是否足够靠前。
  3. 这个来源对答案判断是否真的有影响。

这也解释了为什么企业做AI搜索可见性监测时,不能只截一张图说“我们出现了”。如果AI只在末尾引用官网的一句弱信息,和在开头用官网内容支撑主要推荐,商业意义完全不同。

论文提出了两类可见性指标

第一类是客观指标。

论文使用Word Count衡量某个引用来源在答案中贡献了多少文本,再用Position-Adjusted Word Count把位置纳入计算。直观理解是:同样贡献30个词,出现在答案前半段通常比出现在末尾更容易被用户注意。

第二类是主观指标。

论文借鉴G-Eval思路,用模型评估引用来源的相关性、影响力、独特性、位置感知、数量感知、点击可能性和信息多样性。这个设计不完美,但它提醒企业:GEO报告不能只看机械字数,还要判断这个来源是否真的改变了用户对品牌的理解。

这个定义对企业有什么启发

第一,GEO不是让AI强行推荐品牌。

论文讨论的是黑盒条件下的内容可见性优化,而不是控制模型输出。企业能做的,是让官网、文档、案例、数据和第三方证据更容易被检索、引用和整合。

第二,GEO不是放弃SEO。

生成式引擎仍然依赖检索来源。论文实验也使用搜索结果中的来源作为输入。传统SEO解决的是“进入来源池”的一部分问题,GEO进一步解决的是“进入答案后如何被表达”的问题。

第三,GEO监测必须固定问题集。

如果每次提问都不同,就很难判断可见性变化来自内容优化、平台波动、问题变化还是来源变化。论文后续构建GEO-bench,也是为了让GEO优化有可重复评估的基准。

我读完第一部分后的判断

这篇论文最值得国内企业借鉴的,不是“GEO能提升多少百分比”这个结论,而是它的研究框架:先定义生成式引擎,再定义可见性,再讨论优化方法。

对品牌方来说,这意味着GEO工作应该先从测量开始。先回答这些问题:你的品牌在哪些AI平台被提到?在答案里占多少内容?出现在什么位置?引用的是官网、第三方媒体,还是过时的社区内容?竞品是否获得了更多解释空间?

见川GEO / GEO Radar适合承担这个测量环节。企业可以在 https://www.georadar.top 建立固定问题集,持续观察豆包、通义千问、Kimi、DeepSeek、腾讯元宝、ChatGPT、Claude、Gemini等平台里的品牌提及、推荐位置和竞品共现。

GEO优化的第一步不是写更多文章,而是把“AI是否看见我”拆成可复测的指标。

这篇文章的资料来源