sitemap.xml学习

最近把简单街的网站整理一下,因为有多个系统合成的,每个子系统都有自己的sitemap.xml
想把所有的sitemap.xml文件都整合一个文件。于是收集学习了sitemap.xml 的用法。
sitemaps.org制定了网站地图的标准格式,方便各大搜索引擎使用,更加方便网站使用。有了标准,就意味着可以为多个搜索引擎制作一组网站地图即可,而不需要分开。提交了网站地图给搜索引擎,蜘蛛会比较高效地抓取页面,但是并非一定会全部收录。
Google 可支持多种格式的网络站点地图,但建议您根据站点地图协议创建站点地图,这是因为相同的文件也可能会提交给其他搜索引擎,例如 Bing 和 Yahoo!,这些搜索引擎都是 sitemaps.org 的成员。
sitemap分为2种形式:
1、sitemap.html : 这种主要是针对用户而言,让用户能够快速的寻找到自己所需的东西,也是方便搜索引擎来有效的爬取网页内容,提高网站质量。
2、sitemap.xml  : 这种格式主要是谷歌自己推出的一种网站地图写法,你可以通过相关规范写出网站地图 然后通过“谷歌管理员工具”提交,这样谷歌的蜘蛛就能有目的的高效的快速的来访问网站,但是 提交的内容 谷歌蜘蛛没有保证一定都会收录!这个误区 请大家要区分开来。

sitemaps文件的限制:
     必须是utf-8的编码格式
     每个sitemap.xml文件包含的URL建议不超过5万个URL
     单个sitemap.xml文件不能超过10M大小

目前Google Yahoo和Ask.com支持的最新sitemaps标准是0.9版本。sitemaps文件必须为utf-8的编码格式,每个sitemaps文件只能有一个<urlset>的顶级标签。
   每个<url>标签是对一个URL的描述:
    <loc>是URL的绝对地址,必须用http或https开头
    <lastmod>是该URL的最后一次修改时间,使用YYYY-MM-DDThh:mmTZD 格式,如果不会输出时间格式,可以不写该项,属于可选;
    <changefreq>表示该URL的更新频率,可以设置为daily weekly always,<changefreq>表示该URL的更新频率,可以设置为daily(每天) weekly(每星期) always(始终) monthly(月) never(从不,对于存档的使用该项) hourly(小时) 注意:不含括号内的内容,属于可选;
    <priority>是该URL在整个站点的权重,是1.0~0.1之间的数值,属于可选。

引自Google帮助的实例:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
        xmlns:image="http://www.sitemaps.org/schemas/sitemap-image/1.1"
        xmlns:video="http://www.sitemaps.org/schemas/sitemap-video/1.1">
  <url>
    <loc>http://www.example.com/foo.html</loc>
    <image:image>
       <image:loc>http://example.com/image.jpg</image:loc>
    </image:image>
    <video:video>    
      <video:content_loc>http://www.example.com/video123.flv</video:content_loc>
      <video:player_loc allow_embed="yes" autoplay="ap=1">http://www.example.com/videoplayer.swf?video=123</video:player_loc>
      <video:thumbnail_loc>http://www.example.com/thumbs/123.jpg</video:thumbnail_loc>
      <video:title>简单街导航</video:title>  
      <video:description>简单街导航</video:description>
    </video:video>
  </url>
</urlset>

Google的实例往往都是很高级的,有所有考虑到的可能,下面则是精简后普通的示例:

<?xml version='1.0' encoding='UTF-8'?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.jiandanjie.com/</loc>
<lastmod>2013-12-22T10:00:01+08:00</lastmod>
<changefreq>daily</changefreq>
<priority>1.0</priority>
</url>
</urlset>

另外,sitemap.xml同sitemaps.xml的效果是一样的,所以不必区分。
除了XML格式的网站地图格式,谷歌(Google)还支持以下两种格式:
1、RSS、mRSS 和 Atom 1.0;
2、文本格式。
以上两种都必须是UTF-8格式。具体的请查看谷歌帮助。

在线的sitemaps生成工具:
     XML-sitemap.com 大型网站生成容易超时
     Webmaster 工具

常用的sitemap提交地址:

向Google提交网站地图Sitemap: 通过网址http://www.google.com/webmasters管理提交;
向Yahoo!提交网站地图Sitemap: 通过网址http://siteexplorer.search.yahoo.com管理提交;
向MSN提交网站地图Sitemap: 用URL直接提交:http://api.moreover.com/ping?u=http://your.domainname/sitemap.xml。这是向MSN直接提交网站地图的后门URL。
向ASK提交网站地图Sitemap: 直接提交。http://submissions.ask.com/ping?sitemap=http://your.domainname/sitemap.xml。
向百度Baidu提交网站地图Sitemap: 没办法,现在百度不支持Sitemap。但可通过http://www.baidu.com/search/url_submit.html来提交你的网址。百度会自行搜索,更新速度很快。
向搜搜soso提交网站地图Sitemap,搜搜不支持Sitemap。但可通过http://www.soso.com/help/usb/urlsubmit.shtml来提交你的网址。
向搜狗sogou提交网站地图Sitemap,搜狗不支持Sitemap。但可通过http://www.sogou.com/feedback/urlfeedback.php来提交你的网址。
向有道youdao提交网站地图Sitemap,有道不支持Sitemap。但可通过http://tellbot.youdao.com/report来提交你的网址。

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

«    2024年11月    »
123
45678910
11121314151617
18192021222324
252627282930
搜索
标签列表
网站分类
最新留言
    文章归档
    友情链接

    Powered By Z-BlogPHP 1.7.3

    Copyright Your WebSite.Some Rights Reserved.闽ICP备11018667号-2