文章目录

服务端标准

文件命名标准

  • 文件命名统一小写
    • 文件名称统一用小写英文字母,数字,下划线“_”和英文连字符“-”的组合。
  • 尽量按单词的英文翻译位名称,拼音次之,比如苹果的命名,优先选择apple,其次选择pingguo。
  • 命名尽可能地简短

HTTP状态码及重定向使用规范

  • 301状态码
    • 内容相同但是URL不同的要重定向到常用的URL上去,并返回301状态码。
      • 举个例子,jiedai.cn应当301重定向于www.jiedai.cn
    • 有用户习惯直接访问的URL,应当重定向于常用的URL,并返回301状态码
      • 例如:jiedai.cn/jiedai/12345应当重定向到sh.jiedai.cn/jiedai/12345
    • 出现URL修改或者删除时,应当重定向到新页面,并返回301状态码
  • 302状态码
    • 临时性转移网址并且短期恢复的应当将URL重定向于新的URL,并且返回302状态码
  • 404状态码
    • 页面如果被删除,必须返回404状态码,并且重定向至标准的404页面

robots.txt标准

  • 文件存储于网站的根目录下
  • 文件命名应为robots.txt,全部小写
  • 文件书写格式应为:
    • User-agent: *
    • Disallow: /aaa/
    • Allow: /bbb/
    • 其中user-agent的内容是搜索引擎爬虫,*泛指所有的蜘蛛,包括baiduspider,googlebot等
    • allow中的页面表示蜘蛛可以去爬取,可以收录
    • disallow中的页面表示不予抓取,不希望被收录
    • 具体的robots.txt的写法和用处可以参考百度的官方说明:
    • 关于robots.txt文件的写法
  • robots.txt文件的内容需要经过SEO组的审核,如有需求,需要与SEO组进行确认后在进行更改

搜索引擎爬虫

  • 根据经验以及部分行业人士的判断,百度的爬虫集中在北京网通的线路上,要确保的是网站所在的服务器对北京网通的响应速度正常
  • 爬虫会耽搁IP大量连续的请求多个页面,要保证防火墙和防采集系统的设置未对爬虫设置屏蔽规则。

网站结构标准

URL标准

  • URL静态化
    • 即URL中不包含?或者=等特殊符号,虽然搜索引擎可以正常收录动态URL但是比竞争对手多做一些就可以多一分竞争优势。
  • URL结构
    • 结构要清晰,表示的是各种同类项要归在各类目录下
  • URL简短与可阅读
    • URL的命名要尽可能的短和易记
  • URL目录层级
  • URL唯一化
    • 确保每个页面都有唯一的URL对应,避免出现不同的URL指向同一页面的情况
      • 如:开发最易忽略但也很重要的是这样的页面:
      • http://www.jiedai.cn/jiedaihttp://www.jiedai.cn/jiedai/
      • 上面的例子要统一成一个形式,如果需要有追踪数据等的需求,SEO也可参与讨论并输出意见。
  • URL字母小写
  • 英文之间的连接符应当使用“_”和“-”,避免在URL中使用特殊字符
    • 例如:@,^,:空格等
  • 避免对老URL进行修改,如修改做好301重定向
  • 避免对已生成的URL进行删除操作,特别是距离首页点击距离比较近的链接,如果产生删除页面则必须返回404状态码,避免出现内容死链和协议死链的情况
  • 易被忽视的那些细节点,下面的细节点的解决方案就是301重定向,注意即可
    • www.jiedai.cnjiedai.cn
    • www.jiedai.cnwww.jiedai.cn/index.html
    • sh.jiedai.cn/jiedaish.jiedai.cn/jiedai/

网站导航系统

  • 整站页面须有清晰的导航系统,包括主导航,栏目导航页,页面底部导航,以及面包屑导航等等
  • 需保证每一条导航链接的可抓取性,避免采用flash,iframe,flash或ajax等特殊方式,可使用lynx在线查看
  • 导航的内容需要是可点击的文字内容,而不是图片,flash等特殊加载方法
  • 如有特殊产品需要flash等,需要和SEO部门协商

扁平化

  • 网站的设计必须遵循扁平化,降低用户从首页点击进入内容页的点击次数
  • 每个层级需要注意的是设置好对于下一层级内容的指引,页面中的链接要控制在一定范围内,一般不超过100个,尽量避免过多的翻页

低质量内容

避免发生网站结构逻辑错误而产生的大量雷同,无内容页面。

  • 避免无限空间
    • 举个例子就是,日历中的日期,如果日期能够无限增长且能访问的话,这样就会造成无限空间的,应避免之
  • 避免死循环页面
    • 如一些动态链接中的参数位置可以任意颠倒,但是页面内容却是一样的,因此类型动态页面的原因导致蜘蛛被困在此处返回不了数据,在设计过程中如遇到此类问题则需要和SEO部门沟通

内链部署

  • 相关性
    • 每个页面均需要链向站内的其他页面,且连接的页面必须有相关性
  • 避免孤岛页面
    • 站内的每个页面均需要有内部链接指向,避免大量无内部页面链接指向的页面存在
      • 孤岛页面定义:从首页出发,可以到达网站中的每一个页面,如果有页面从首页中无法通过点击进入,则称之为孤岛页面。
      • 常见的孤岛页面:下架的产品页,过期的活动页

追踪代码

现有的站内追踪代码,一个URL不要超过3个参数,并且告知SEO人员代码部署的位置

对SEO不友好的技术

  • 避免使用iframe
  • 谨慎使用Ajax异步加载技术,对于重要页面和重要链接,避免使用。
  • 避免使用sessionID,DHTML,cookies,JavaScript,flash等技术展现内容
    • 使用sessionID,DHTML,cookies,JavaScript,flash等技术展现内容搜索引擎的抓取度并不十分友好,用Lynx浏览器可以检测到网页中的对SEO不友好的技术

网页标准

TDK标准

  • title要能够描述网页的主题
    • 即,title能够完整地描述网页中的模块内容,相关,推荐等,注意要绝对主题相关
  • title中必须要包含目标关键词
    • 关键词出现的频次控制在2-3次
  • title不能与其余网站相同
    • 在百度的搜索结果页中查找,保证其相似率要低于30%
  • title的字数要控制在32个,而移动端的title要控制在15个
  • 页面中的keywords不要超过10个,词与词之间用英文状态下的逗号
  • description中要有目标关键词,3-4次为最佳,在文章页可以让蜘蛛自由抓取
  • description也不要超过72个汉字

代码标准

链接标准

  • 链接的位置最好处在文字的下方
  • 链接的锚文字要有精确的叙述意义
  • 指向目标网页的url要是统一格式的,注意url末尾是否有/符号
  • 避免非常规的方式部署链接,如js,flash或者option下拉菜单
  • nofollow标签要统一由SEO人员负责添加
  • 避免出站链接,如有必要,还希望于SEO人员沟通

网页体积标准

  • 页面体积控制在一定的大小内,建议在180K以内,可以从以下三处入手:
    • 减少HTML体积
    • 减少网页其他元素体积
    • 开启服务器压缩,Gzip等
    • 推荐一个工具www.webpagetest.org,可以检查网页各个元素响应瀑布图
  • 共享CSS样式和脚本样式,相同的样式用户只需下载一次,压缩CSS文件中的空白
  • 压缩js代码移除重复,无用的js代码,使代码简洁化
  • 合并js,css文件减少http请求
  • 压缩html代码中的tab、空白元素使页面加载更快

内容标准

关键词分析

  • 撰写文章或者进行专题策划前要进行关键词分析
    • 分析出与文章相关的关键词,如借贷,个人征信,信用等级等于小额贷款类的文章相关。
    • 用户搜索量高的话题优先考虑,搜索量小的话题降低优先级。
  • 文章的关键词可以通过对整体的需求分析来选择,优先选择搜索量高但是借贷网中缺少的关键词。
    • 如上海贷款公司是热词,但是网站中却很多内容,可以不用关注,而上海购房商业贷款,可能网站没有相关内容,优先选择。
  • 关键词分析完成后要记录关键词的百度排名,以作日后参考。

文章撰写与伪原创

  • 文章标题中包含关键词,并且尽量左置靠前。
    • 上海购房商业贷款资质大全 借贷网带你全知全晓
  • 文章中第一段内出现关键词,并且尽量靠前,控制在200字以内须至少出现一次关键词。
    • 如:2016年上海购房商业贷款机构都有哪些?借贷网带您一一拜访...
  • 关键词在文章中出现的次数要控制在一定的百分比中,要求是2%-4%。
  • 文章内容的字数在400字以上,尽量配图,并且图片的比例协调,文本的排版整齐。
  • 文章要给不同的段落设置小标题,用<h2>标签封装
  • 文章内至少要有两个链接指向对应的页面,锚文本要精确的描述对应页面的内容,避免使用详情参见,具体咨询,更多请看等等模糊定义的词句。
  • 从别处复制来的文章要修改标题,确保新标题与原标题的相似度降低到30%以下,通俗点说是10个字要有7个字不同。
  • 复制来的文章一定要经过二次编辑,此次编辑需要做的是剔除掉大量的高频词,换上我方的相关词。
  • 文章发布时要设置好标签,确保文章关联到了其他文章。

其他注意事项

  • 专题上线前要与SEO部门商议,确保内容的可搜索性和页面的可抓取性良好。
  • 专题下线后,能不删除的页面尽量不删除,必须删除的页面则将URL重定向至首页。
  • 运营活动上线后要建立流量统计报表,数据定期发送,总结,汇报。
HTTPX 基础教程-新乡seo|网站优化,网站建设_微信公众号:zeropython—昊天博客