新博客百度 Google Bing 收录配置步骤详解

很多 Hexo 博客博主会发现一个问题:辛辛苦苦写了不少文章,但在百度、Google 等搜索引擎里搜自己的博客名,却什么都搜不到。本文从根因分析到实操配置,带你一步步让搜索引擎主动找到并收录你的文章。

为什么你的博客不被搜索引擎收录

新博客不被收录,通常不是文章质量的问题,而是搜索引擎根本不知道你的站点存在。具体来说,缺少以下关键环节:

环节 作用 缺失后果
Sitemap 告诉搜索引擎”我有哪些页面” 爬虫无法发现页面
Robots.txt 告诉爬虫”允许抓哪些内容” 无爬虫指引
站长平台验证 向搜索引擎”注册”你的站点 无法提交和监控
URL 主动推送 新文章发布后通知搜索引擎 等待自然爬取,周期极长

好消息是,这些问题在 Hexo 中配置起来并不复杂。下面一步步来。

第一步:安装 Sitemap 生成器

Sitemap(站点地图)是搜索引擎发现页面的核心途径。没有它,爬虫只能靠链接一层层爬,效率极低。

安装插件

1
npm install hexo-generator-sitemap --save

如果你同时需要百度的 sitemap 格式,再安装:

1
npm install hexo-generator-baidu-sitemap --save

修改站点配置

打开 _config.yml,找到 sitemap 相关配置(可能被注释掉了),取消注释并修改:

1
2
3
4
5
6
7
# 站点地图(Google/Bing/Yandex 使用)
sitemap:
path: sitemap.xml

# 百度站点地图
baidusitemap:
path: baidusitemap.xml

验证

重新生成站点后,检查 public/ 目录下是否出现了 sitemap.xmlbaidusitemap.xml

1
2
3
hexo clean && hexo g
ls public/sitemap.xml
ls public/baidusitemap.xml

如果两个文件都存在,说明 sitemap 生成成功。你也可以本地预览后访问 http://localhost:4000/sitemap.xml 查看内容。

第二步:创建 robots.txt

robots.txt 放在网站根目录,告诉搜索引擎爬虫可以抓取哪些内容,以及去哪里找 sitemap。

在 Hexo 的 source/ 目录下新建 robots.txt 文件:

1
2
3
4
5
User-agent: *
Allow: /

Sitemap: https://你的域名/sitemap.xml
Sitemap: https://你的域名/baidusitemap.xml

你的域名 替换成你的实际域名。例如我的博客:

1
2
3
4
5
User-agent: *
Allow: /

Sitemap: https://blog.shiguang666.eu.org/sitemap.xml
Sitemap: https://blog.shiguang666.eu.org/baidusitemap.xml

重新生成后,public/ 目录下会出现 robots.txt,搜索引擎爬虫访问你的站点时会首先读取它。

第三步:注册搜索引擎站长平台

这是最关键的一步——即使你配置好了 sitemap 和 robots.txt,也需要在搜索引擎的站长平台”报到”,告诉它们你的站点存在。

百度搜索资源平台(推荐优先)

  1. 访问 百度搜索资源平台,用百度账号登录
  2. 点击「添加站点」,输入你的域名(如 https://blog.shiguang666.eu.org
  3. 选择验证方式(推荐「HTML 标签验证」)
  4. 复制验证码,后面要用

Google Search Console

  1. 访问 Google Search Console
  2. 点击「添加属性」,选择「URL 前缀」,输入你的域名
  3. 通过 HTML 文件或 DNS 记录验证所有权
  4. 获取验证码

Bing Webmaster Tools

  1. 访问 Bing Webmaster Tools
  2. 选择用 Google 账号登录(可同步 Google Search Console,无需再验证)
  3. 添加站点后,进入 设置 → API 访问,复制 API 密钥

注意: Bing 的界面可能改版,如果找不到「API 访问」,直接在浏览器访问 https://www.bing.com/webmasters/apikeys

第四步:配置站点验证

拿到验证码后,在 _config.anzhiyu.yml(安知鱼主题配置)中找到 site_verification 部分,取消注释并填入:

1
2
3
4
5
6
7
site_verification:
- name: google-site-verification
content: 你的Google验证码
- name: baidu-site-verification
content: 你的百度验证码
- name: msvalidate.01
content: 你的Bing验证码

如果你用的是其他主题,检查主题配置中是否有类似的 site_verificationmeta 配置项。

重新生成后,页面 <head> 中会自动插入验证 meta 标签,搜索引擎就能确认你对站点的所有权。

注意: 站长验证本身不影响搜索引擎收录,但验证后你可以使用站长平台的高级功能(提交 sitemap、查看索引状态、诊断抓取问题等)。

第五步:配置 URL 主动推送(hexo-seo-submit)

传统的 hexo deploy 方式推送 URL 有局限性,推荐使用 hexo-seo-submit 插件,支持 Google、Bing、百度的主动推送,且支持 GitHub Actions CI 自动推送。

安装插件

1
npm install hexo-seo-submit --save

修改站点配置

_config.yml 中添加以下配置:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
hexo-seo-submit:
sortBy: created
count: 10
CI:
enable: true
cron: "0 4 * * *"
platform: github
branch: main
bing:
enable: true
google:
enable: true
proxy: http://127.0.0.1:7890 # 如果不需要代理则删除此行
baidu:
enable: false # 需要百度推送则改为 true

获取各平台凭证

Bing API Key

  1. 登录 Bing Webmaster Tools
  2. 访问 https://www.bing.com/webmasters/apikeys
  3. 复制 API 密钥

Google Service Account

Google 的推送需要创建一个 Service Account(服务账号),步骤较多:

1. 创建 Google Cloud 项目并启用 Indexing API

  • 打开 Google Cloud Console
  • 选择或创建一个项目
  • 左侧菜单 → API 和服务,搜索 Indexing API,点击启用

2. 创建服务账号

  • 左侧菜单 → API 和服务凭据创建凭据服务账号
  • 名称填 hexo-seo(可自定义)→ 创建并继续完成

3. 下载 JSON 密钥

  • 点击刚创建的服务账号 → 密钥添加密钥创建新密钥 → 选 JSON创建
  • 会自动下载一个 JSON 文件

4. 将服务账号添加为 Google Search Console 拥有者

重要: 这一步不做的话 Google Indexing API 调用会失败。

5. 保存密钥文件

将下载的 JSON 文件重命名为 google.json,放到 Hexo 博客根目录(与 _config.yml 同级)。

配置 GitHub Actions(CI 自动推送)

如果你使用 GitHub Actions 部署博客(而非本地 hexo deploy),需要在 GitHub 仓库中配置 Secrets。

添加 GitHub Secrets

打开你的 GitHub 仓库 → SettingsSecrets and variablesActionsNew repository secret,添加以下 Secrets:

Name Value
bing_apikey 你的 Bing API Key
google_private_key JSON 文件中 private_key 的值(含 -----BEGIN...-----END... 整段)
google_client_email JSON 文件中 client_email 的值

注意: google_private_key 复制时需保持格式正确,建议连带引号复制再去除引号。

修改 GitHub Actions 工作流

在你的 .github/workflows/deploy.yml 中,在 hexo deploy 步骤之后添加 SEO 推送步骤:

1
2
3
4
5
6
7
8
9
10
11
12
- name: Deploy Shiguang's Blog
run: |
git config --global user.name "shiguang-coding"
git config --global user.email "[email protected]"
hexo deploy

- name: Submit URLs to Search Engines
if: success()
run: |
npx hexo-seo-submit bing -k ${{ secrets.bing_apikey }} -f public/bing.json
echo '{"private_key":"'"${{ secrets.google_private_key }}"'","client_email":"'"${{ secrets.google_client_email }}"'"}' > /tmp/google.json
npx hexo-seo-submit google -f public/google.txt -a /tmp/google.json

排除 google.json 避免泄露

google.json 包含私钥,必须加入 .gitignore

1
google.json

本地 deploy 方式(可选)

如果你是在本地执行 hexo deploy,则不需要配置 GitHub Secrets,但需要在 deploy 中添加:

1
2
3
4
deploy:
- type: git
repo: https://github.com/username/repo.git,main
- type: hexo-seo-submit

第六步:优化 URL 结构

搜索引擎更喜欢简洁、无后缀的 URL。在 _config.yml 中:

1
2
3
pretty_urls:
trailing_index: false
trailing_html: false

改完后,URL 会从:

1
https://blog.shiguang666.eu.org/2025/06/18/abc/index.html

变成:

1
https://blog.shiguang666.eu.org/2025/06/18/abc/

注意: 如果你的博客已经上线一段时间,改 URL 会导致已有链接失效。建议在百度/Google 站长平台提交改版规则,通知搜索引擎 URL 变更。

第七步:提交 Sitemap 并验证

所有配置完成后,部署上线,然后去站长平台手动提交 sitemap。

百度

  1. 登录 百度搜索资源平台
  2. 进入你的站点 →「数据引用」→「sitemap」
  3. 提交 https://你的域名/baidusitemap.xml

Google

  1. 登录 Google Search Console
  2. 选择你的站点 →「Sitemaps」
  3. 输入 sitemap.xml 并提交

Bing

  1. 登录 Bing Webmaster Tools
  2. 进入你的站点 →「Sitemaps」
  3. 提交 sitemap 地址

提交后,搜索引擎会在几小时到几天内开始爬取你的站点。

验收检查清单

配置完成后,逐一检查以下项目:

检查项 验证方式
sitemap.xml 已生成 访问 https://你的域名/sitemap.xml
robots.txt 存在 访问 https://你的域名/robots.txt
站点验证 meta 标签 查看页面源码 <head> 中是否有验证标签
百度已提交 sitemap 百度站长平台 → 数据引用 → sitemap
Google 已提交 sitemap Google Search Console → Sitemaps
Bing 已提交 sitemap Bing Webmaster Tools → Sitemaps
GitHub Secrets 已配置 GitHub 仓库 → Settings → Secrets
google.json 已加入 .gitignore 确认不会被提交到仓库

验证收录情况

等待 1-2 周后,可以在搜索引擎中用以下方式检查收录情况:

1
site:你的域名

例如:

1
site:blog.shiguang666.eu.org

如果能看到你的文章列表,说明收录成功。

你也可以在站长平台的后台查看具体的索引量和爬取数据。

常见问题

Q:提交了 sitemap 但还是没收录?

检查以下几点:

  • robots.txt 是否允许了搜索引擎爬取
  • 站点验证 meta 标签是否正确插入(查看页面源码)
  • 域名是否可以正常访问(没有被墙或 DNS 问题)
  • 百度收录较慢,通常需要 1-2 周,Google 相对快一些

Q:GitHub Actions 中 Google 推送失败?

常见原因:

  • google_private_key 格式错误,检查换行符是否正确
  • 服务账号未添加为 Google Search Console 拥有者
  • Indexing API 未在 Google Cloud 项目中启用
  • 网络问题,可尝试在配置中添加 proxy 字段

Q:文章 frontmatter 需要加什么?

建议为每篇文章添加 description 字段,搜索引擎会优先使用它作为搜索结果摘要:

1
2
3
4
5
---
title: 文章标题
description: 这篇文章介绍了……(100-150字的摘要)
keywords: [关键词1, 关键词2]
---

Q:GitHub Pages 部署的博客收录效果好吗?

GitHub Pages 本身对 SEO 是友好的,但因为是免费托管,搜索引擎对 GitHub Pages 的爬取频率可能不如独立服务器。如果收录较慢,可以考虑绑定自定义域名,提升搜索引擎的信任度。

总结

让新博客被搜索引擎收录,核心就四件事:

  1. 配置 sitemap —— 告诉搜索引擎你有哪些页面
  2. 注册站长平台 —— 告诉搜索引擎你是站点的主人
  3. 配置站点验证 —— 在页面中插入验证 meta 标签
  4. 主动推送 URL —— 新文章发布后通知搜索引擎(hexo-seo-submit)

这四步做完,搜索引擎就会开始爬取和收录你的文章。剩下的就是持续输出优质内容,让收录量自然增长。