网站建设咨询  网站推广咨询  网站优化咨询  网站售后咨询   电话:0316-5269510 客服:13722605112  13315631884

公司邮箱:sjfc2008@126.comsjfc2008@126.com  技术邮箱:sjfc2009@163.comsjfc2009@163.com  网站售后邮箱:e-wkj.cn@tom.come-wkj.cn@tom.com   24小时服务热线:13722605112
导航头部 网站首页 网站制作 网站推广 建站方案 推广方案 业务介绍 网站案例 技术服务 关于我们 联系我们 导航尾部
主要为用户提供网站建设和网站推广服务
经验分享

避免百度重复收录网站的URL知识

来 源:畅想网络  作 者:小 编  发布时间:2015-07-02

目前有很多站长遇到了这样的问题,索引量工具显示索引量数值很高但流量总也上不去,也没有发现网站中有低质内容,这是怎么回事?想要解决这个问题也不难,廊坊网站建设的工作人员在下面给大家作出了详细的解释,如何避免重复收录。

一、URL参数

URL参数是一个最复杂,最容易被忽视,最容易被妥协的问题。他是网站运营中必不可少的元素,如果简单的去除,其他部门就无法工作了。 静态化是的话题,URL参数经常被用于以下几方面:

1、同一个实体的不同状态展示,比如同一个酒店,在不同时间点会有不同的房间库存:http://www.travel.com/hotel/123/?checkindate=2015-06-09&checkoutdate=2015-06-10

2、为了统计不同渠道的流量:http://www.a.com/?tracking=website_a

3、为了统计不同渠道,具体模块的点击量:http://www.a.com/?tracking=website_a&click_spot=zone_abc

4、调试:http://www.a.com/product/item123/?debug=true

出现这种问题的坏处有几点:

1.浪费搜索引擎对你网站的各项配额,从而影响其他正常的页面。

2.丢失很多本应拿到的链接加分,站外渠道的链接往往是最优质的。同一个URL的分值可能分散成几十份。

3.SEO的流量被统计到别的渠道(因为tracking字段写的是别的渠道,而且被收录被点击)。

4.往往形成一种局面,产品用一套URL,SEO用另一套URL, 甚至不同渠道用不同的URL,后期开发和维护的成本极高。

为了解决这个问题,首先要弄清URL的定义。以我的理解,每一个URL是一个静态的、独立不重复的、有意义的实体,一般也有检索意义(就是有人会搜)。比如一个人、一辆车、一条道路、一个零件。而不能混入各种"状态",比如这个人生病的时候,难道就不是他自己了么? 一件商品在促销的状态难道是另一件商品了么?

理论上canonical标签就可以解决这个问题了, 但是从实际测试结果看,百度对这个标签的支持优先级非常低, 几乎可以忽略不计。那么我的解决方案是这样的:

1.建立好网站的思维导图和元信息。

2.所有和SEO元信息相关的参数都放到路径中去。

3.所有和SEO元信息不相干的参数都放到#后边,因为#后边不影响web服务器返回的内容。简单的说就是用"#"替代"?"。

4.每个页面中都利用js获取#后边的参数对,通过二次请求发回给统计服务器

5.如果#后边的参数影响页面内容,比如酒店的入住日期。那么这部分内容用ajax加载就行,他是不稳定的,不属于页面内容的一部分。(当然还有变通的办法,暂不赘述。)

6.原始的#锚点定义肯定会冲突,定义一个#后边的变量,并用js控制屏幕滚动,来保证原始锚点的作用。

其实很多网站早就使用这种方式了,但是还有很多网站由于开发效率无法及时实现。所以对于一般的小网站,一定要考虑开发成本,不要轻易冒进。只要能避免问题的发生,变通的方法是很多的。

二、路径中使用非必要元素

很多网站仿照亚马逊的做法,把商品名体现在URL中,然后再通过id来决定页面展示的内容。

这样虽然可以提高一些相关性,但是很危险。在长期甚至短期的时间内,大量商品的名称是非常可能有变化的,那么URL也就跟着变化。成本也是非常高的,因为加大了技术实现难度,不管从站内还是站外,每次增加链接都是一个很麻烦的事情。

通过日志分析发现基本所有的百度蜘蛛发起的请求都被301跳转了一次。细致调查后发现,从SEO拼接规则到后台的汉字和翻译数据被一直修改。也就是说,这个URL相关的元素有:

1.中文 (非必要元素)

2.由中文翻译的英文 (非必要元素)

3.id (必要元素)

跟"相关性"比,URL的唯一性和稳定性更重要。所以针对这个问题,URL的最佳策略应该是:http://www.a.com/hotel/12345678/

如果这个id是隶属于一个分类下的,比如城市,那么就可以是:http://www.a.com/hotel/beijing/123/

从技术角度说, id一般是数据库的primary key,可以是数字也可以是字符串,那么这个时候URL是一维的; id也可以是联合的唯一索引,那么URL就是二维的,就像上面的(bejing,123)缺一不可。电商类网站列表页经常用到三维以上。

三、目录的规范

很多网站同时存在这样的URL,无形中把收录量扩大了一倍:

http://www.a.com/product/123

http://www.a.com/product/123/

上边第一个路径的意思是在product目录下有一个123文件。第二个路径的意思是在product目录下有一个123目录,这个目录下可能有很多文件,但是他代表众多文件中的index.html或index.php或default.aspx等优先级最高的那个文件。为了避免歧义,我定义文件都是用".html"结尾的。

为了减少重复收录,那么按我的习惯是:

http://www.a.com/product/123 => http://www.a.com/product/123/

http://www.a.com/product/123 => http://www.a.com/product/123.html

上一篇:通过开放适配工具提交适配关系 下一篇:廊坊网站建设中图片优化的技巧

廊坊市新世纪步行街畅想网络技术服务中心历经多年的发展,现拥有一个过硬的技术团队,凭借丰富的建站经验赢得了众多用户信任,真正站在客户角度去考虑问题。我们始终坚持新产品的研发,每一款不同的产品有他独特的功能,完全可以帮助大家快速树立起自己的品牌形象。

在以后的工作中廊坊网站制作公司的技术人员将继续依靠技术优势、优质的产品去服务用户,同时也会继续开发方便、可靠的产品。坚持不懈,认真思考,独具创新是我们必须坚持的,只有这样才能有更好的发展。(详细介绍

优惠活动
网站底部

廊坊市新世纪步行街畅想网络技术服务中心 TEL:0316-5269510 技术支持:13722605112 E-MAIL:sjfc2008@126.com 冀ICP备11000020号 网站地图  

互联网信任计划       网站安全认证       可信网站