新博客百度 Google Bing 收录配置步骤详解

新博客百度 Google Bing 收录配置步骤详解
時光很多 Hexo 博客博主会发现一个问题:辛辛苦苦写了不少文章,但在百度、Google 等搜索引擎里搜自己的博客名,却什么都搜不到。本文从根因分析到实操配置,带你一步步让搜索引擎主动找到并收录你的文章。
为什么你的博客不被搜索引擎收录
新博客不被收录,通常不是文章质量的问题,而是搜索引擎根本不知道你的站点存在。具体来说,缺少以下关键环节:
| 环节 | 作用 | 缺失后果 |
|---|---|---|
| Sitemap | 告诉搜索引擎”我有哪些页面” | 爬虫无法发现页面 |
| Robots.txt | 告诉爬虫”允许抓哪些内容” | 无爬虫指引 |
| 站长平台验证 | 向搜索引擎”注册”你的站点 | 无法提交和监控 |
| URL 主动推送 | 新文章发布后通知搜索引擎 | 等待自然爬取,周期极长 |
好消息是,这些问题在 Hexo 中配置起来并不复杂。下面一步步来。
第一步:安装 Sitemap 生成器
Sitemap(站点地图)是搜索引擎发现页面的核心途径。没有它,爬虫只能靠链接一层层爬,效率极低。
安装插件
1 | npm install hexo-generator-sitemap --save |
如果你同时需要百度的 sitemap 格式,再安装:
1 | npm install hexo-generator-baidu-sitemap --save |
修改站点配置
打开 _config.yml,找到 sitemap 相关配置(可能被注释掉了),取消注释并修改:
1 | # 站点地图(Google/Bing/Yandex 使用) |
验证
重新生成站点后,检查 public/ 目录下是否出现了 sitemap.xml 和 baidusitemap.xml:
1 | hexo clean && hexo g |
如果两个文件都存在,说明 sitemap 生成成功。你也可以本地预览后访问 http://localhost:4000/sitemap.xml 查看内容。
第二步:创建 robots.txt
robots.txt 放在网站根目录,告诉搜索引擎爬虫可以抓取哪些内容,以及去哪里找 sitemap。
在 Hexo 的 source/ 目录下新建 robots.txt 文件:
1 | User-agent: * |
把 你的域名 替换成你的实际域名。例如我的博客:
1 | User-agent: * |
重新生成后,public/ 目录下会出现 robots.txt,搜索引擎爬虫访问你的站点时会首先读取它。
第三步:注册搜索引擎站长平台
这是最关键的一步——即使你配置好了 sitemap 和 robots.txt,也需要在搜索引擎的站长平台”报到”,告诉它们你的站点存在。
百度搜索资源平台(推荐优先)
- 访问 百度搜索资源平台,用百度账号登录
- 点击「添加站点」,输入你的域名(如
https://blog.shiguang666.eu.org) - 选择验证方式(推荐「HTML 标签验证」)
- 复制验证码,后面要用
Google Search Console
- 访问 Google Search Console
- 点击「添加属性」,选择「URL 前缀」,输入你的域名
- 通过 HTML 文件或 DNS 记录验证所有权
- 获取验证码
Bing Webmaster Tools
- 访问 Bing Webmaster Tools
- 选择用 Google 账号登录(可同步 Google Search Console,无需再验证)
- 添加站点后,进入 设置 → API 访问,复制 API 密钥
注意: Bing 的界面可能改版,如果找不到「API 访问」,直接在浏览器访问
https://www.bing.com/webmasters/apikeys。
第四步:配置站点验证
拿到验证码后,在 _config.anzhiyu.yml(安知鱼主题配置)中找到 site_verification 部分,取消注释并填入:
1 | site_verification: |
如果你用的是其他主题,检查主题配置中是否有类似的 site_verification 或 meta 配置项。
重新生成后,页面 <head> 中会自动插入验证 meta 标签,搜索引擎就能确认你对站点的所有权。
注意: 站长验证本身不影响搜索引擎收录,但验证后你可以使用站长平台的高级功能(提交 sitemap、查看索引状态、诊断抓取问题等)。
第五步:配置 URL 主动推送(hexo-seo-submit)
传统的 hexo deploy 方式推送 URL 有局限性,推荐使用 hexo-seo-submit 插件,支持 Google、Bing、百度的主动推送,且支持 GitHub Actions CI 自动推送。
安装插件
1 | npm install hexo-seo-submit --save |
修改站点配置
在 _config.yml 中添加以下配置:
1 | hexo-seo-submit: |
获取各平台凭证
Bing API Key
- 登录 Bing Webmaster Tools
- 访问
https://www.bing.com/webmasters/apikeys - 复制 API 密钥
Google Service Account
Google 的推送需要创建一个 Service Account(服务账号),步骤较多:
1. 创建 Google Cloud 项目并启用 Indexing API
- 打开 Google Cloud Console
- 选择或创建一个项目
- 左侧菜单 → API 和服务 → 库,搜索 Indexing API,点击启用
2. 创建服务账号
- 左侧菜单 → API 和服务 → 凭据 → 创建凭据 → 服务账号
- 名称填
hexo-seo(可自定义)→ 创建并继续 → 完成
3. 下载 JSON 密钥
- 点击刚创建的服务账号 → 密钥 → 添加密钥 → 创建新密钥 → 选 JSON → 创建
- 会自动下载一个 JSON 文件
4. 将服务账号添加为 Google Search Console 拥有者
- 打开 Google Search Console
- 设置 → 用户和权限 → 添加用户
- 输入 JSON 文件中的
client_email(如[email protected]) - 权限选 拥有者
重要: 这一步不做的话 Google Indexing API 调用会失败。
5. 保存密钥文件
将下载的 JSON 文件重命名为 google.json,放到 Hexo 博客根目录(与 _config.yml 同级)。
配置 GitHub Actions(CI 自动推送)
如果你使用 GitHub Actions 部署博客(而非本地 hexo deploy),需要在 GitHub 仓库中配置 Secrets。
添加 GitHub Secrets
打开你的 GitHub 仓库 → Settings → Secrets and variables → Actions → New repository secret,添加以下 Secrets:
| Name | Value |
|---|---|
bing_apikey |
你的 Bing API Key |
google_private_key |
JSON 文件中 private_key 的值(含 -----BEGIN... 到 -----END... 整段) |
google_client_email |
JSON 文件中 client_email 的值 |
注意:
google_private_key复制时需保持格式正确,建议连带引号复制再去除引号。
修改 GitHub Actions 工作流
在你的 .github/workflows/deploy.yml 中,在 hexo deploy 步骤之后添加 SEO 推送步骤:
1 | - name: Deploy Shiguang's Blog |
排除 google.json 避免泄露
google.json 包含私钥,必须加入 .gitignore:
1 | google.json |
本地 deploy 方式(可选)
如果你是在本地执行 hexo deploy,则不需要配置 GitHub Secrets,但需要在 deploy 中添加:
1 | deploy: |
第六步:优化 URL 结构
搜索引擎更喜欢简洁、无后缀的 URL。在 _config.yml 中:
1 | pretty_urls: |
改完后,URL 会从:
1 | https://blog.shiguang666.eu.org/2025/06/18/abc/index.html |
变成:
1 | https://blog.shiguang666.eu.org/2025/06/18/abc/ |
注意: 如果你的博客已经上线一段时间,改 URL 会导致已有链接失效。建议在百度/Google 站长平台提交改版规则,通知搜索引擎 URL 变更。
第七步:提交 Sitemap 并验证
所有配置完成后,部署上线,然后去站长平台手动提交 sitemap。
百度
- 登录 百度搜索资源平台
- 进入你的站点 →「数据引用」→「sitemap」
- 提交
https://你的域名/baidusitemap.xml
- 登录 Google Search Console
- 选择你的站点 →「Sitemaps」
- 输入
sitemap.xml并提交
Bing
- 登录 Bing Webmaster Tools
- 进入你的站点 →「Sitemaps」
- 提交 sitemap 地址
提交后,搜索引擎会在几小时到几天内开始爬取你的站点。
验收检查清单
配置完成后,逐一检查以下项目:
| 检查项 | 验证方式 |
|---|---|
| sitemap.xml 已生成 | 访问 https://你的域名/sitemap.xml |
| robots.txt 存在 | 访问 https://你的域名/robots.txt |
| 站点验证 meta 标签 | 查看页面源码 <head> 中是否有验证标签 |
| 百度已提交 sitemap | 百度站长平台 → 数据引用 → sitemap |
| Google 已提交 sitemap | Google Search Console → Sitemaps |
| Bing 已提交 sitemap | Bing Webmaster Tools → Sitemaps |
| GitHub Secrets 已配置 | GitHub 仓库 → Settings → Secrets |
| google.json 已加入 .gitignore | 确认不会被提交到仓库 |
验证收录情况
等待 1-2 周后,可以在搜索引擎中用以下方式检查收录情况:
1 | site:你的域名 |
例如:
1 | site:blog.shiguang666.eu.org |
如果能看到你的文章列表,说明收录成功。
你也可以在站长平台的后台查看具体的索引量和爬取数据。
常见问题
Q:提交了 sitemap 但还是没收录?
检查以下几点:
robots.txt是否允许了搜索引擎爬取- 站点验证 meta 标签是否正确插入(查看页面源码)
- 域名是否可以正常访问(没有被墙或 DNS 问题)
- 百度收录较慢,通常需要 1-2 周,Google 相对快一些
Q:GitHub Actions 中 Google 推送失败?
常见原因:
google_private_key格式错误,检查换行符是否正确- 服务账号未添加为 Google Search Console 拥有者
- Indexing API 未在 Google Cloud 项目中启用
- 网络问题,可尝试在配置中添加
proxy字段
Q:文章 frontmatter 需要加什么?
建议为每篇文章添加 description 字段,搜索引擎会优先使用它作为搜索结果摘要:
1 |
|
Q:GitHub Pages 部署的博客收录效果好吗?
GitHub Pages 本身对 SEO 是友好的,但因为是免费托管,搜索引擎对 GitHub Pages 的爬取频率可能不如独立服务器。如果收录较慢,可以考虑绑定自定义域名,提升搜索引擎的信任度。
总结
让新博客被搜索引擎收录,核心就四件事:
- 配置 sitemap —— 告诉搜索引擎你有哪些页面
- 注册站长平台 —— 告诉搜索引擎你是站点的主人
- 配置站点验证 —— 在页面中插入验证 meta 标签
- 主动推送 URL —— 新文章发布后通知搜索引擎(hexo-seo-submit)
这四步做完,搜索引擎就会开始爬取和收录你的文章。剩下的就是持续输出优质内容,让收录量自然增长。















