最近把简单街的网站整理一下,因为有多个系统合成的,每个子系统都有自己的sitemap.xml 。
想把所有的sitemap.xml文件都整合一个文件。于是收集学习了sitemap.xml 的用法。
sitemaps.org制定了网站地图的标准格式,方便各大搜索引擎使用,更加方便网站使用。有了标准,就意味着可以为多个搜索引擎制作一组网站地图即可,而不需要分开。提交了网站地图给搜索引擎,蜘蛛会比较高效地抓取页面,但是并非一定会全部收录。
Google 可支持多种格式的网络站点地图,但建议您根据站点地图协议创建站点地图,这是因为相同的文件也可能会提交给其他搜索引擎,例如 Bing 和 Yahoo!,这些搜索引擎都是 sitemaps.org 的成员。
sitemap分为2种形式:
1、sitemap.html : 这种主要是针对用户而言,让用户能够快速的寻找到自己所需的东西,也是方便搜索引擎来有效的爬取网页内容,提高网站质量。
2、sitemap.xml : 这种格式主要是谷歌自己推出的一种网站地图写法,你可以通过相关规范写出网站地图 然后通过“谷歌管理员工具”提交,这样谷歌的蜘蛛就能有目的的高效的快速的来访问网站,但是 提交的内容 谷歌蜘蛛没有保证一定都会收录!这个误区 请大家要区分开来。
sitemaps文件的限制:
必须是utf-8的编码格式
每个sitemap.xml文件包含的URL建议不超过5万个URL
单个sitemap.xml文件不能超过10M大小
目前Google Yahoo和Ask.com支持的最新sitemaps标准是0.9版本。sitemaps文件必须为utf-8的编码格式,每个sitemaps文件只能有一个<urlset>的顶级标签。
每个<url>标签是对一个URL的描述:
<loc>是URL的绝对地址,必须用http或https开头
<lastmod>是该URL的最后一次修改时间,使用YYYY-MM-DDThh:mmTZD 格式,如果不会输出时间格式,可以不写该项,属于可选;
<changefreq>表示该URL的更新频率,可以设置为daily weekly always,<changefreq>表示该URL的更新频率,可以设置为daily(每天) weekly(每星期) always(始终) monthly(月) never(从不,对于存档的使用该项) hourly(小时) 注意:不含括号内的内容,属于可选;
<priority>是该URL在整个站点的权重,是1.0~0.1之间的数值,属于可选。
引自Google帮助的实例:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:image="http://www.sitemaps.org/schemas/sitemap-image/1.1"
xmlns:video="http://www.sitemaps.org/schemas/sitemap-video/1.1">
<url>
<loc>http://www.example.com/foo.html</loc>
<image:image>
<image:loc>http://example.com/image.jpg</image:loc>
</image:image>
<video:video>
<video:content_loc>http://www.example.com/video123.flv</video:content_loc>
<video:player_loc allow_embed="yes" autoplay="ap=1">http://www.example.com/videoplayer.swf?video=123</video:player_loc>
<video:thumbnail_loc>http://www.example.com/thumbs/123.jpg</video:thumbnail_loc>
<video:title>简单街导航</video:title>
<video:description>简单街导航</video:description>
</video:video>
</url>
</urlset>
Google的实例往往都是很高级的,有所有考虑到的可能,下面则是精简后普通的示例:
<?xml version='1.0' encoding='UTF-8'?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.jiandanjie.com/</loc>
<lastmod>2013-12-22T10:00:01+08:00</lastmod>
<changefreq>daily</changefreq>
<priority>1.0</priority>
</url>
</urlset>
另外,sitemap.xml同sitemaps.xml的效果是一样的,所以不必区分。
除了XML格式的网站地图格式,谷歌(Google)还支持以下两种格式:
1、RSS、mRSS 和 Atom 1.0;
2、文本格式。
以上两种都必须是UTF-8格式。具体的请查看谷歌帮助。
在线的sitemaps生成工具:
XML-sitemap.com 大型网站生成容易超时
Webmaster 工具
常用的sitemap提交地址:
向Google提交网站地图Sitemap: 通过网址http://www.google.com/webmasters管理提交;
向Yahoo!提交网站地图Sitemap: 通过网址http://siteexplorer.search.yahoo.com管理提交;
向MSN提交网站地图Sitemap: 用URL直接提交:http://api.moreover.com/ping?u=http://your.domainname/sitemap.xml。这是向MSN直接提交网站地图的后门URL。
向ASK提交网站地图Sitemap: 直接提交。http://submissions.ask.com/ping?sitemap=http://your.domainname/sitemap.xml。
向百度Baidu提交网站地图Sitemap: 没办法,现在百度不支持Sitemap。但可通过http://www.baidu.com/search/url_submit.html来提交你的网址。百度会自行搜索,更新速度很快。
向搜搜soso提交网站地图Sitemap,搜搜不支持Sitemap。但可通过http://www.soso.com/help/usb/urlsubmit.shtml来提交你的网址。
向搜狗sogou提交网站地图Sitemap,搜狗不支持Sitemap。但可通过http://www.sogou.com/feedback/urlfeedback.php来提交你的网址。
向有道youdao提交网站地图Sitemap,有道不支持Sitemap。但可通过http://tellbot.youdao.com/report来提交你的网址。
想把所有的sitemap.xml文件都整合一个文件。于是收集学习了sitemap.xml 的用法。
sitemaps.org制定了网站地图的标准格式,方便各大搜索引擎使用,更加方便网站使用。有了标准,就意味着可以为多个搜索引擎制作一组网站地图即可,而不需要分开。提交了网站地图给搜索引擎,蜘蛛会比较高效地抓取页面,但是并非一定会全部收录。
Google 可支持多种格式的网络站点地图,但建议您根据站点地图协议创建站点地图,这是因为相同的文件也可能会提交给其他搜索引擎,例如 Bing 和 Yahoo!,这些搜索引擎都是 sitemaps.org 的成员。
sitemap分为2种形式:
1、sitemap.html : 这种主要是针对用户而言,让用户能够快速的寻找到自己所需的东西,也是方便搜索引擎来有效的爬取网页内容,提高网站质量。
2、sitemap.xml : 这种格式主要是谷歌自己推出的一种网站地图写法,你可以通过相关规范写出网站地图 然后通过“谷歌管理员工具”提交,这样谷歌的蜘蛛就能有目的的高效的快速的来访问网站,但是 提交的内容 谷歌蜘蛛没有保证一定都会收录!这个误区 请大家要区分开来。
sitemaps文件的限制:
必须是utf-8的编码格式
每个sitemap.xml文件包含的URL建议不超过5万个URL
单个sitemap.xml文件不能超过10M大小
目前Google Yahoo和Ask.com支持的最新sitemaps标准是0.9版本。sitemaps文件必须为utf-8的编码格式,每个sitemaps文件只能有一个<urlset>的顶级标签。
每个<url>标签是对一个URL的描述:
<loc>是URL的绝对地址,必须用http或https开头
<lastmod>是该URL的最后一次修改时间,使用YYYY-MM-DDThh:mmTZD 格式,如果不会输出时间格式,可以不写该项,属于可选;
<changefreq>表示该URL的更新频率,可以设置为daily weekly always,<changefreq>表示该URL的更新频率,可以设置为daily(每天) weekly(每星期) always(始终) monthly(月) never(从不,对于存档的使用该项) hourly(小时) 注意:不含括号内的内容,属于可选;
<priority>是该URL在整个站点的权重,是1.0~0.1之间的数值,属于可选。
引自Google帮助的实例:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:image="http://www.sitemaps.org/schemas/sitemap-image/1.1"
xmlns:video="http://www.sitemaps.org/schemas/sitemap-video/1.1">
<url>
<loc>http://www.example.com/foo.html</loc>
<image:image>
<image:loc>http://example.com/image.jpg</image:loc>
</image:image>
<video:video>
<video:content_loc>http://www.example.com/video123.flv</video:content_loc>
<video:player_loc allow_embed="yes" autoplay="ap=1">http://www.example.com/videoplayer.swf?video=123</video:player_loc>
<video:thumbnail_loc>http://www.example.com/thumbs/123.jpg</video:thumbnail_loc>
<video:title>简单街导航</video:title>
<video:description>简单街导航</video:description>
</video:video>
</url>
</urlset>
Google的实例往往都是很高级的,有所有考虑到的可能,下面则是精简后普通的示例:
<?xml version='1.0' encoding='UTF-8'?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.jiandanjie.com/</loc>
<lastmod>2013-12-22T10:00:01+08:00</lastmod>
<changefreq>daily</changefreq>
<priority>1.0</priority>
</url>
</urlset>
另外,sitemap.xml同sitemaps.xml的效果是一样的,所以不必区分。
除了XML格式的网站地图格式,谷歌(Google)还支持以下两种格式:
1、RSS、mRSS 和 Atom 1.0;
2、文本格式。
以上两种都必须是UTF-8格式。具体的请查看谷歌帮助。
在线的sitemaps生成工具:
XML-sitemap.com 大型网站生成容易超时
Webmaster 工具
常用的sitemap提交地址:
向Google提交网站地图Sitemap: 通过网址http://www.google.com/webmasters管理提交;
向Yahoo!提交网站地图Sitemap: 通过网址http://siteexplorer.search.yahoo.com管理提交;
向MSN提交网站地图Sitemap: 用URL直接提交:http://api.moreover.com/ping?u=http://your.domainname/sitemap.xml。这是向MSN直接提交网站地图的后门URL。
向ASK提交网站地图Sitemap: 直接提交。http://submissions.ask.com/ping?sitemap=http://your.domainname/sitemap.xml。
向百度Baidu提交网站地图Sitemap: 没办法,现在百度不支持Sitemap。但可通过http://www.baidu.com/search/url_submit.html来提交你的网址。百度会自行搜索,更新速度很快。
向搜搜soso提交网站地图Sitemap,搜搜不支持Sitemap。但可通过http://www.soso.com/help/usb/urlsubmit.shtml来提交你的网址。
向搜狗sogou提交网站地图Sitemap,搜狗不支持Sitemap。但可通过http://www.sogou.com/feedback/urlfeedback.php来提交你的网址。
向有道youdao提交网站地图Sitemap,有道不支持Sitemap。但可通过http://tellbot.youdao.com/report来提交你的网址。