最近在研究搜索流量的过程中,发现了一种实用的方法:通过 Google Search Console(GSC)+ 正则表达式,识别 AI 工具(如 GPT、Perplexity、Gemini)在抓取并生成答案时所使用的搜索请求。
看这个数据有什么用?
1、检查当前网站是否有内容进入到AIO里
2、检查 AIO 对网站的网站,如是否能带来点击
操作方法
在 GSC 中使用自定义正则表达式(Regex)过滤查询词:
(perplexity|gpt|gemini|ai\ssearch|generated\sby)|^[\w\W\s\S]{80,}$


这个正则表达式的作用是匹配所有长度 ≥ 80 个字符的搜索词或匹配包含 AI 关键词的查询。
因为那些查询字符串特别长的搜索请求,很可能是由 AI 工具生成或模拟用户问题(prompt)的搜索。比如:
- “What are the health benefits of drinking green tea every morning for weight loss”
- “Top 10 wooden puzzle brands in the US with high user satisfaction and eco-friendly materials”
这些查询往往不像普通用户的短语(如“green tea benefits”)那样简洁,而是更贴近自然语言的完整问题格式,是 AI 搜索的典型特征之一。
原创文章,作者:白天,如若转载请注明出处:谷歌 GSC 后台跟踪 AI 搜索数据