过去一年,可以说是AI飞速发展的一年,我们之前的文章也介绍过如何结合现有的SEO策略让品牌提高在AI搜索的可见度,这次我们换个角度,从AI模型们的角度出发,看看什么样的内容类型最适合这些LLM。
但需要提前说明的是,关于什么内容更合适被AI引用,其实现在还没有一个明确的标准和实操案例,我们只能根据各种报告和平台总结一些有规律的关键性发现。
一、深度内容是获取AI引用的关键
我们知道AI聊天机器人会使用检索增强生成(RAG)技术,结合各个传统搜索引擎的结果来权衡答案。那这是不是意味着传统SEO排名的影响因素也会影响AI选用的内容,遗憾的是,答案是否定的。
经过一些相关性分析表明,所有经典SEO指标与内容被引用的频率之间都不存在显著关联。但不同的AI大模型会有自己的偏好。像Perplexity,就比较看重文本复杂程度;谷歌的AI Overview则比较重视字数和句子数量;ChatGPT则会权衡域名评级和可读性分数。
由此可以看出,传统SEO指标对AI模型的内容提及和引用几乎没有影响。进行内容优化时,最有效的方法是追求内容的深度、全面性和可读性(即文本易于理解的程度)。
以下示例都展示了这些特征:
- https://www.byrdie.com/digital-prescription-services-dermatologist-5179537
- https://www.healthline.com/nutrition/best-weight-loss-programs
- https://www.verywellmind.com/we-tried-online-therapy-com-these-were-our-experiences-8780086
但到现在为止,得出的都只是一个猜想,没有什么实质性的结论。我们接下来会从被高频引用的内容与其他内容的不同之处入手进一步剖析相关规律。
我们这次主要比较的是被引用最多的前10%的内容和后90%的内容有哪些差异。两者差异越大,说明该因素对前10%的内容越关键。
研究结果:
- 核心影响因素:句子数和字数最为突出,其次是可读性分数(Flesch Score)。虽然与外链和流量相关的指标呈现负相关性,但这不意味着AI会因为页面中包含这些内容就进行粗暴的负面评价,只是说这些因素与是否被引用无关。
- 数据反差:这其中最让我们感到意外的就是被引用最多的10%页面,跟其他页面比起来,关键词覆盖量更少、外链总数也更少。
这也进一步证实,不同的AI模型确实是有自己的独特偏好:
- ChatGPT侧重域名权重和可读性
- Perplexity/AIOs更关注内容长度
- Copilot引用内容的关键词覆盖量是普通内容的1.7倍
这其中,内容深度(字数和句子数)与可读性对AI的引用率影响最大。需要补充解释的是:这里的长内容并非只是单纯指文章长度,而是说文章可以更完整地回答用户在AI聊天中提出地具体问题地内容。
以下是两个比较典型的例子,大家可以自行感受下:
- 案例1:www.verywellmind.com/best-online-psychiatrists-5119854 拥有187次引用,内容含10,000+单词和1,500+句子,可读性分数55,其中72次被ChatGPT引用。
- 案例2:www.onlinetherapy.com/best-online-psychiatrists/ 仅3次引用,可读性分数为48,但「短板」明显:仅3,900单词和580个句子。
二、品牌曝光的核心在于市场认知度
现在也还没有明确的指向说明品牌被AI引用会带来商业价值,但是可以在一定程度上扩展品牌的影响力,尤其是用户的提问是带有购买意向时。为探究品牌曝光的底层逻辑,在多次尝试后发现,有一个决定因素是无论如何都绕不开的,它就是品牌搜索量。
数据显示,品牌在AI聊天机器人中的被提及次数与其搜索量的相关系数达0.334,在该研究领域属于强关联水平。简言之,品牌知名度本质上决定了其在AI系统中的可见度。
其中,ChatGPT对品牌搜索量的敏感度最高(相关系数0.542),远超过Google AIO(0.254)和Perplexity(0.196)。
还有一个比较有意思的现象是,像Healthline、Verywellmind这类数字原生品牌几乎垄断了AI的引用榜单。当用户提问中包含“best”这类关键词时,品牌被提及的概率飙升到69.71%。其他如“trusted”(5.77%)、“source”(2.88%)等词也会显著提升品牌曝光。
从平台差异来看,Google AIOs展示的品牌多样性最丰富,Perplexity次之,而ChatGPT更倾向于集中引用头部品牌。
但就算有以上这些差距,所有的AI聊天机器人在大方向上还是会倾向于选择热门品牌,甚至连排序都高度一致(怎么不算一种AI之间的心有灵犀呢)。具体到用户提问的领域,无论是心理健康咨询、护肤品推荐,还是减肥、脱发等敏感话题,都能观察到品牌可见性与细分品类的强关联性。
这些数据进一步揭示了,那些在AI引用榜单中占据高位的品牌,几乎都是数字原生品牌(digital-first brands)。这类品牌在内容生产、SEO优化、用户评价管理、社交媒体运营及数字广告投放等环节持续重金投入,最终实现线上影响力巨大。
这样看来,品牌知名度是AI首先考虑的因素,但也要站在用户搜索的角度看问题。通过对比自身品牌与竞品在搜索量和行业渗透率,应该能更精准地评估自己品牌在不同AI机器人的竞争力如何。
下面我们看一个比较典型的案例,Healthline作为非常知名的健康科普类网站,在相关内容的AI引用频率上,四个平台都一直是稳居首位。这也告诉我们,若想全面捕获AI流量,仅监测ChatGPT远远不够——特别是当其他AI平台(如Perplexity、Copilot)同样带来可观流量时。
需要说明的是,不同AI聊天机器人在品牌提及频率上存在明显差异。虽然ChatGPT用户基数最大、为内容源带来的推荐流量最多,但要说提及品牌的丰富度和数量,还得是Perplexity。
提问中包含的不同关键词对品牌曝光的影响:
- 当提问中包含"best"一词时,触发品牌的概率高达69.71%
- 其他如"trusted"-5.77%、"source"-2.88%、"recommend"-0.96% 和"reliable"-0.96% 等词也会显著提升品牌被提及的机率
- 含有"recommend"的提问往往会提及FDA等公共机构,特别是当提问同时包含"trusted"或"leading"等修饰词时
- 就品牌多样性而言,Google AIOs最多样,Perplexity次之,ChatGPT则相对一般
看得出来,如果用户向AI提问时,实际涵盖的关键词和侧重点不同,对最后答案的呈现都会有很直接的影响。但就算是上面按百分比算的规律,也只是推测,毕竟用户提问是非常个性化的东西,没有统一的标准,用户想怎么问就怎么问。
三、技术陷阱:为AI可见性扫平技术障碍
在研究过程中,我们发现许多品牌正因技术疏漏而无意中扼杀了自身品牌的AI可见性。要进入AI大语言模型的视野,首要前提是确保它们能够爬取你的网站,无论是直接抓取还是通过训练数据获取都可以。
这样的例子有很多,就比如跟我们前面提到的Healthline是竞争对手的onlinedoctor.com,它就一直都没有被Copilot引用过。原因也很简单,因为该网站未被Bing索引。但这种属于可以快速修复的类型,也不用很担心。
另一种情况可能更值得警惕,那就是在网站de robots.txt文件中主动封禁了对应AI的爬虫。除了这种情况,还有地域封锁屏蔽某些国家或地区的用户时,也可能会出现误伤AI爬虫的情况。比如说下图就是GoodPx这个品牌屏蔽掉了美国地区的ip,但也导致AI爬虫被禁止爬取的例子。
这里要特别强调一下谷歌 AI Overviews的霸王条款:它没有办法通过技术手段禁止爬取。这也就是说,如果你想获得谷歌的自然流量,就必须接受AIO爬取你网站的内容,并且还有可能在AI摘要中展示。
由此,我们可以总结以下几个要点:
- 定期在Google Search Console和Bing Webmaster Tools中检查核心页面的索引状态
- 仔细核查robots.txt文件及CDN设置,避免误封AI爬虫
- 若主动屏蔽某些AI爬虫,建议直接向各聊天机器人查询"你对xxx(品牌名)了解多少?"来验证屏蔽效果
四、总结
- 传统SEO指标对AI聊天机器人内容引用的影响较弱
- 内容深度和可读性更为关键
- 不同AI聊天机器人存在明显偏好差异,需监测多平台数据,综合判定
- 品牌知名度是AI品牌提及的最强预测指标,尤其是ChatGPT
- 用户如何向AI提问将直接影响品牌曝光,但这又无法形成统一化
- 技术问题可能破坏AI可见性,需检查robots.txt和CDN设置避免误屏蔽LLM爬虫
今天的文章到这里就要结束了,希望能对你了解大语言模型们喜欢的内容类型有所帮助。如果你还有其他想了解的谷歌SEO相关内容,可以在评论区留言。如果你们需要谷歌SEO相关服务的话,也可以扫描下方二维码联系我们咨询哦。
以上内容由霆万科技/霆万出海学院原创/转载,请勿私自转载,以免侵权!如需转载,请扫码添加客服,获得授权并注明来源。