您的 XML 站点地图文件应采用 UTF-8 编码。
以下是包含一个 URL 的站点地图的示例:
XML 标签定义
<urlset> 是当前的标准协议。
<url> 是每个 URL 条目的父标签。此标签下的所有内容都是此标签的子标签。
<loc> 是页面的 URL,它在开头包含协议 (http),并以正斜杠 (/) 结尾(如果您的 Web 服务器需要)。
必须少于 2,048 个字符。
<lastmod> 是页面最后修改的日期。必须采用 W3C 日期 牙医数据库 时间格式,并使用 YYYY-MM-DD。
<changefreq> 是页面更改的频率。您可以输入的有效值为:always、hourly、daily、weekly、monthly、yearly、never。
这些值不是命令,因此页面的抓取频率可能低于您所输入的频率。
对于每次访问时都会发生变化的文件,应使用“始终”。对于存档的 URL,应使用“从不”。
<priority> 是该 URL 与您网站上的其他 URL 相比的优先级。
有效值范围为 0.0 到 1.0,但默认值为 0.5。它让爬虫知道您认为哪些页面更重要,等等。
指定优先级不会改变该页面在搜索引擎结果页面 (SERP) 中的排名。您可以使用此标签来确保最重要的页面出现在搜索索引中。
现在您知道了什么是站点地图以及站点地图如何工作,接下来我们讨论何时应该使用站点地图。
何时使用网站地图
站点地图通过改善抓取过程特别有用:
具有许多页面的大型网站,或具有很少链接的新网站。
网站经常更新,您希望搜索引擎立即了解新内容。
您有一些搜索引擎爬虫不容易找到的页面,例如需要用户登录或填写表格的页面。
该网站包含大量视频和图片。站点地图的文件大小限制为 50MB。
您的网站显示在 Google 新闻中。
但是,如果您的网站符合以下条件,则可能不需要站点地图:
很小。但是,当您的网站开始发展时,您将需要一个站点地图。
内部链接广泛,这意味着 Google 可以通过主页上的链接找到所有重要页面。