Welcome to IT 生活 互动学习空间,IT 记录 、分享、学习、提高
Apr 15
--begin by itlife365
分享Google 对站点地图 Sitemap 的一些限制因素
Google对XML格式的Sitemap在数量上、编码等方面是有一些限制,如下:
1、Sitemap中的网址必须是绝对网址,包括参数等,如http://fashionput.com/detail/3563/The-Leather-Satchel-Company-Saddle-Bag;
2、s=sitemap的格式错误
 千万不能使用类似于“/index.php?s=sitemap”这样的相对网址。

3、数量上的限制
 每个Sitemap文件最多可以包含50,000 个网址且sitemap大小不得超过10MB
 假如网址超过 50,000 个则应创建多个Sitemap文件,然后可以采用Sitemap的索引文件把这些文件包含起来。

3.1 Sitemap索引文件最多可以列出 1,000个 Sitemap;

4、Sitemap中的网址应该使用相同的域名,且是本站的域名,不得出现两个或以上的域名,也不能出现外站的域名:
如fashionput.com的Sitemap中的网址只能是:http://www.fashionput.com.com/index.php,或:http://fashionput.com.com/index.php(两者选择其一,不能混用)
不能是其他网站的地址http://www.itlife365.com/

5、最重要的一条 Sitmap文件必须使用 UTF-8格式的编码。

6、不要在 Sitemap 中包含直接图片网址。 Google 不会将图片直接编入索引中,Sitemap 中包含的直接图片网址不会编入索引。
如果需要包含图片,可以使用标签image
比如:
<image:image>
<image:loc>
http://fashionput.com/./Uploads/asos/4722838/image1xl.jpg
</image:loc>
<image:caption>Enlarge Estella Bartlett Lucky Necklace</image:caption>
<image:title>Enlarge Estella Bartlett Lucky Necklace</image:title>
</image:image>

格式参考:http://fashionput.com/sitemap.xml
其实这样看来,Google从理论上只支持一个网站有5千万个网页,这听上去其实很大了,一般网站有5000个网址都算很庞大了,
别说五千万,不过对于我们下来的实验项目,目标是上亿的,比如QQ的问问系统,现在都有上亿的个问答,显然要是通过Sitemap,估计完成不了这个任务了。
how-google-sitemap-xml-limit
最重要的一点,如果不知道文件是否过大,可以使用谷歌浏览器 访问,如果可以访问,就说明没有问题
--end by itlife365
Tags: , ,
Nov 12
最近把简单街的网站整理一下,因为有多个系统合成的,每个子系统都有自己的sitemap.xml
想把所有的sitemap.xml文件都整合一个文件。于是收集学习了sitemap.xml 的用法。
sitemaps.org制定了网站地图的标准格式,方便各大搜索引擎使用,更加方便网站使用。有了标准,就意味着可以为多个搜索引擎制作一组网站地图即可,而不需要分开。提交了网站地图给搜索引擎,蜘蛛会比较高效地抓取页面,但是并非一定会全部收录。
Google 可支持多种格式的网络站点地图,但建议您根据站点地图协议创建站点地图,这是因为相同的文件也可能会提交给其他搜索引擎,例如 Bing 和 Yahoo!,这些搜索引擎都是 sitemaps.org 的成员。
sitemap分为2种形式:
1、sitemap.html : 这种主要是针对用户而言,让用户能够快速的寻找到自己所需的东西,也是方便搜索引擎来有效的爬取网页内容,提高网站质量。
2、sitemap.xml  : 这种格式主要是谷歌自己推出的一种网站地图写法,你可以通过相关规范写出网站地图 然后通过“谷歌管理员工具”提交,这样谷歌的蜘蛛就能有目的的高效的快速的来访问网站,但是 提交的内容 谷歌蜘蛛没有保证一定都会收录!这个误区 请大家要区分开来。

sitemaps文件的限制:
     必须是utf-8的编码格式
     每个sitemap.xml文件包含的URL建议不超过5万个URL
     单个sitemap.xml文件不能超过10M大小

目前Google Yahoo和Ask.com支持的最新sitemaps标准是0.9版本。sitemaps文件必须为utf-8的编码格式,每个sitemaps文件只能有一个<urlset>的顶级标签。
   每个<url>标签是对一个URL的描述:
    <loc>是URL的绝对地址,必须用http或https开头
    <lastmod>是该URL的最后一次修改时间,使用YYYY-MM-DDThh:mmTZD 格式,如果不会输出时间格式,可以不写该项,属于可选;
    <changefreq>表示该URL的更新频率,可以设置为daily weekly always,<changefreq>表示该URL的更新频率,可以设置为daily(每天) weekly(每星期) always(始终) monthly(月) never(从不,对于存档的使用该项) hourly(小时) 注意:不含括号内的内容,属于可选;
    <priority>是该URL在整个站点的权重,是1.0~0.1之间的数值,属于可选。

引自Google帮助的实例:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
        xmlns:image="http://www.sitemaps.org/schemas/sitemap-image/1.1"
        xmlns:video="http://www.sitemaps.org/schemas/sitemap-video/1.1">
  <url>
    <loc>http://www.example.com/foo.html</loc>
    <image:image>
       <image:loc>http://example.com/image.jpg</image:loc>
    </image:image>
    <video:video>    
      <video:content_loc>http://www.example.com/video123.flv</video:content_loc>
      <video:player_loc allow_embed="yes" autoplay="ap=1">http://www.example.com/videoplayer.swf?video=123</video:player_loc>
      <video:thumbnail_loc>http://www.example.com/thumbs/123.jpg</video:thumbnail_loc>
      <video:title>简单街导航</video:title>  
      <video:description>简单街导航</video:description>
    </video:video>
  </url>
</urlset>

Google的实例往往都是很高级的,有所有考虑到的可能,下面则是精简后普通的示例:

<?xml version='1.0' encoding='UTF-8'?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.jiandanjie.com/</loc>
<lastmod>2013-12-22T10:00:01+08:00</lastmod>
<changefreq>daily</changefreq>
<priority>1.0</priority>
</url>
</urlset>

另外,sitemap.xml同sitemaps.xml的效果是一样的,所以不必区分。
除了XML格式的网站地图格式,谷歌(Google)还支持以下两种格式:
1、RSS、mRSS 和 Atom 1.0;
2、文本格式。
以上两种都必须是UTF-8格式。具体的请查看谷歌帮助。

在线的sitemaps生成工具:
     XML-sitemap.com 大型网站生成容易超时
     Webmaster 工具

常用的sitemap提交地址:

向Google提交网站地图Sitemap: 通过网址http://www.google.com/webmasters管理提交;
向Yahoo!提交网站地图Sitemap: 通过网址http://siteexplorer.search.yahoo.com管理提交;
向MSN提交网站地图Sitemap: 用URL直接提交:http://api.moreover.com/ping?u=http://your.domainname/sitemap.xml。这是向MSN直接提交网站地图的后门URL。
向ASK提交网站地图Sitemap: 直接提交。http://submissions.ask.com/ping?sitemap=http://your.domainname/sitemap.xml。
向百度Baidu提交网站地图Sitemap: 没办法,现在百度不支持Sitemap。但可通过http://www.baidu.com/search/url_submit.html来提交你的网址。百度会自行搜索,更新速度很快。
向搜搜soso提交网站地图Sitemap,搜搜不支持Sitemap。但可通过http://www.soso.com/help/usb/urlsubmit.shtml来提交你的网址。
向搜狗sogou提交网站地图Sitemap,搜狗不支持Sitemap。但可通过http://www.sogou.com/feedback/urlfeedback.php来提交你的网址。
向有道youdao提交网站地图Sitemap,有道不支持Sitemap。但可通过http://tellbot.youdao.com/report来提交你的网址。
Tags:
分页: 1/1 第一页 1 最后页 [ 显示模式: 摘要 | 列表 ]