--begin by itlife365
分享Google 对站点地图 Sitemap 的一些限制因素
Google对XML格式的Sitemap在数量上、编码等方面是有一些限制,如下:
1、Sitemap中的网址必须是绝对网址,包括参数等,如http://fashionput.com/detail/3563/The-Leather-Satchel-Company-Saddle-Bag;
2、s=sitemap的格式错误
千万不能使用类似于“/index.php?s=sitemap”这样的相对网址。
3、数量上的限制
每个Sitemap文件最多可以包含50,000 个网址且sitemap大小不得超过10MB
假如网址超过 50,000 个则应创建多个Sitemap文件,然后可以采用Sitemap的索引文件把这些文件包含起来。
3.1 Sitemap索引文件最多可以列出 1,000个 Sitemap;
4、Sitemap中的网址应该使用相同的域名,且是本站的域名,不得出现两个或以上的域名,也不能出现外站的域名:
如fashionput.com的Sitemap中的网址只能是:http://www.fashionput.com.com/index.php,或:http://fashionput.com.com/index.php(两者选择其一,不能混用)
不能是其他网站的地址http://www.itlife365.com/
5、最重要的一条 Sitmap文件必须使用 UTF-8格式的编码。
6、不要在 Sitemap 中包含直接图片网址。 Google 不会将图片直接编入索引中,Sitemap 中包含的直接图片网址不会编入索引。
如果需要包含图片,可以使用标签image
比如:
<image:image>
<image:loc>
http://fashionput.com/./Uploads/asos/4722838/image1xl.jpg
</image:loc>
<image:caption>Enlarge Estella Bartlett Lucky Necklace</image:caption>
<image:title>Enlarge Estella Bartlett Lucky Necklace</image:title>
</image:image>
格式参考:http://fashionput.com/sitemap.xml
其实这样看来,Google从理论上只支持一个网站有5千万个网页,这听上去其实很大了,一般网站有5000个网址都算很庞大了,
别说五千万,不过对于我们下来的实验项目,目标是上亿的,比如QQ的问问系统,现在都有上亿的个问答,显然要是通过Sitemap,估计完成不了这个任务了。
how-google-sitemap-xml-limit
最重要的一点,如果不知道文件是否过大,可以使用谷歌浏览器 访问,如果可以访问,就说明没有问题
--end by itlife365