两年前建网站的时候,一切都是从百度检索开始的,遇到问题就问度娘。后来发现,这样的方法不是很好。度娘可以帮助解决铁定问题,但是非常系统的知识最好还是从书本上获取。于是,这次SEO学习咱就改变思路,先啃下一两本参考书来,带着问题请教度娘,既可以学到系统知识,也不至于在网络知识海洋里迷失方向。本次参考图书:《SEO搜索引擎优化:技巧、策略与实战案例》,不是摆摊的,感兴趣的看完咱的一系列文章后评判有没有必要看。
咱学习SEO 的目的先是帮全中国第一的农业无人机博客——瓜田李下话桑麻农业无人机做点提升。其实这个网站VPS月底就到期了,续不续费自己还没有最终决定。要是不续费了,这个网站的最后一点价值就是帮咱了解seo相关知识与技巧了,以后以案例的方式存在于这个浩瀚的网络世界。突然,有点悲壮,有点对不起这个人生第一个自已手把手建立的网站。不说了,泪要奔!
(一)SEO基本概念
1 关键词 说实话,不管是网站上的文章还是自媒体平台上的文章,给文章加关键词的时候是很随意的,没想到这么重要;
2 收录 之前也听过说有收录这个事情,但没有系统了解过。按照定义,咱有个疑问,“瓜田李下话桑麻”检索的时候在第二页可以看到咱的网站,但这算是被搜索引擎放入检索库里吗?书中提到了一个检测方法,把网址贴到百度检索框里,有网页说明被收录,没网页也说明没有。
咱的网站上共有10篇文章,按照先后顺序,将每篇文章的网页放入检索框检索,都显示没有任何结果;把网站主页的网址放入检索框也没有任何结果;只有把备案的域名放入检索框的时候才出现网站。由此可以判断:网站确实没有被百度收录。这是咱接下来通过学习后要实现的目标之一。
价值是可以具体化、可视化的。SEO的价值表现在提升获客渠道的质量、降低网络营销成本等等。这些太虚,对咱来说就是希望自己的小网站可以增加点人气,给自己保留一点点脸面吧。
关键词越等于网页的定位,通过关键词的设计,实现网页定位并讲过定位信息报给搜索引擎,进而借助搜索引擎把客户领到页面。也就是说,网页相当于商店,关键词相当于路标,搜索引擎相当于引路人,当客户问到路标的时候,引路人就把客户带到商店里了。有点像国内旅行社的购物团啊。
(一)关键词基础
关键词可以分为核心关键词和长尾关键词。Keywords can be divided into two parts, the first one is core keywords, and the other one is Long-tail keywords.从两者的关系看,长尾关键词是核心关键词的扩展,目的是带来更多的流量。就像蜘蛛网一样,最中间的那一环就是核心的,但只靠核心的网不住多少蚊子;于是从中间那一环又分出好几层,每一层都是长尾关键词,目的是网住更多的蚊子。同理,长尾关键词是核心关键词的多维度扩展,目的是捕获更多的流量。
以前咱真没有往这方面想,借着这次机会把网站的关键词优化一下。“瓜田李下话桑麻农业无人机”网站的核心关键词包括两个吧:“农业”“无人机”。“农业”又包括传统农业、现代农业;也可以分为粗放型农业、精准农业等等,需要继续补充,咱毕竟不是农业研究领域的;“无人机”可以分为民用无人机、军用无人机;民用无人机可以分为消费型无人机、工业无人机;工业无人机又可以分为农业无人机、电力巡线无人机、灾难救援无人机等;农业无人机又可以分为植保无人机、农业数据采集无人机、播撒无人机等等;农业无人机还可以分农业无人机作业、农业无人机品牌、农业无人机媒体、农业无人机金融等等。再比如大疆植保无人机、极飞植保无人机、农业机器人等。在考虑是不是对“无人机”这个词也系统了解一下,是不是不单纯指飞行器,也有无人操作的机器人的意思,真要那样的话,网站涉及的范围就扩大了,不至于思路受限,没有可写的主题了。
说实话,要不是这次认真了解长尾关键词具有多维度性,咱即不知道啥叫长尾,也不能借助长尾的定义进行发散性思维。看来,基础知识还是有帮助的。既然了解了,可以看一下自己文章加的关键词。从截图来看,关键词集中在“无人机打药”“植保无人机”“大疆”“极飞”等几个方面,数量表较少,而且不符合长尾关键词的定义,确实需要改进一下。
(二) 关键词密度
关键词密度指关键词在网页中所占比重的一种计算方法,关键词密度=SEO出现次数/分词数量。以上图中文章标题“再谈农业无人机与农业数据,以及目前农业无人机媒体内容概况”为例,SEO“农业无人机”出现2次,这个标题可以分为 再谈 农业无人机 与 农业数据,以及 目前 农业无人机 媒体 内容概况 共计9个词(咱是这么理解的,不知道具体的搜索引擎是不是也是这么划分的),那么seo密度=2/9=22%。看来,SEO的次数越多似乎越好,再就是标题不能太长,否则SEO密度也不是很高。
于是,搜索引擎的分词方法还是很重要的,要是能知道一些信息肯定不错。还有就是每一家搜索引擎的分词方法似乎是不一样的,看来SEO还得懂不同家的搜索引擎,这个有点难度吧。不知道自己不能能到达那一步。
(三)关键词锚文本
关键词的核心应用是锚文本,具体说是带链接的关键词,有站内锚文本和站外锚文本之分。具体到咱的网站来说,锚文本应该是“农业”“无人机”了。但是怎么给关键词挂上链接,怎么建站内锚文本和站外锚文本,这本书没有写,不知道怎么做。做法是啥呢?
(四) 关键词排名
关键词排名实际是关键词所在页面的排序,是SEO 努力优化后成绩的直接体现。排名在前,点击流量就越可能多。这次咱好像明白了,为啥前面“瓜田李下话桑麻”搜索的时候在第二页出现了咱的网站。不是因为网站被收录,而是“瓜田李下话桑麻”的关键词排名很靠前,看来“瓜田李下话桑麻”也可以作为网站关键词了吧。
网页排名靠的算法,当然国内有竞价排名这种骚操作。书中提供了Google网页排名算法公式:Google得分=(关键词得分*0.3)+(域名权重*0.25)+(外链得分*0.25)+(用户数据权重*0.1)+(内容质量得分*0.1)+(人工提分)-(人工/自动降分);从公式看的话,只要get到每个变量的要求,做好了不就能提高了排名了吗?
但是这个公式太复杂,SEO界有一个简化的公式,但是不会输入公式符号,Clock=C1 +L2+K3+O4,翻译过来就是(C1)内容要丰富,(L2)链接要合理,(K3)关键词(标题、描述、页面的关键词密度(2%-8%)与布局要合理),还有其他(O4)。
这个咱就做个SEO操作参考和指南,知道下一步的行动。目前来说,内容一年不更新了,外联几乎没有,关键词没有重视过,难怪网站没流量。
PS:书里确实提到百度网页排名算法,太高深,咱看不太明白,而且不知道如何下手,先知道自己的问题出现在那里,后面再找具体的弥补方法吧。
(五)关键词设置
关键词设置参考关键词密度和关键词位置两大要素。其中,页面关键词密度再0.5%-3%为宜,这个数据怎么来的?有没有什么计算公式活软件,总不能单个数数吧?其次是关键词的几个位置,
(1)标题里关键词的位置尽量靠前,占的比里尽可能大。“再谈农业无人机与农业数据,以及目前农业无人机媒体内容概况”这个标题优化的话,可以是“农业无人机抢占农业数据”“农业无人机媒体发展展望”;
(2)关键词方面,使用核心关键词和长尾关键词,
(3)描述中,出现一两次关键词和长尾关键词,这让咱想起了头条发视频的时候有个视频介绍、关键词和标题这个地方,是不是也是可以填写关键词和长尾关键词。
(4)页面导航,尽量出现关键词;(5)在不同等级的标题里融合进关键词,网页正文第一次出现的关键词加粗。照这么说,这篇心得体会博客在这方面做得还可以哈。
(六)关键词管理
关键词管理包括关键词+url管理,和关键词+排名的管理。这个容易理解,但是没有说出具体的方法,比如关键词+url的管理,“关键词1对应的目标URL”是什么意思?怎么算是目标url?
网页被收录指的是能在搜索结果页看到相关的网页。前面已经测试过,“瓜田李下话桑麻农业无人机”网站的十篇文章没有一篇可以被检索到,十篇文章网页都没有别收录,网站主页业没有被收录。但是搜索域名可以搜到,这是为什么呢?服务器有一个地址,网站有一个域名,前者搜不到,后者能搜到,为啥呢?
网页收录跟搜索引擎的爬虫引擎有关系。爬虫程序抓取:
链接存储系统、链接选取系统、DNS解析服务系统、抓取调度系统、网页分析系统、链接提取系统、链接分析系统、网页存储系统
(一)SEO主动协助爬虫程序干活
为了让搜索引擎的爬虫爬取数据,SEO要主动协作工作。如,采用Nofollow策略,主动给爬虫程序引路,引导最具价值页面。如,弄一个SItemap,在里面定义页面的权重,更新频率,相当于把内部情报给了爬虫程序,让他重点照顾,别走弯路。但是啥是Nofollow策略?SItemap?怎么操作呢?
怎么解决网页信息拒绝爬虫爬取的情况发生?
用搜索引擎平台提供的开发平台等数据上传通道。(百度的开发平台是啥?百度站长?)
提交sitemap方式。(不明白怎么操作)
对非保密页面进行http处理。
用robots协议引导爬虫程序干活。(Disallow等还是不明白,希望书后面有操作案例)
(二)不利于爬虫干活的几个因素
1 网站更新不及时
说得就是咱,两年时间就写了十篇文章。更新频率低到离谱。要做到每天保持一定的更新数量确实有些难度,希望以后有机会做到吧。
2 网站内容质量
内容为王,这点确实没有问题,10篇全部原创,而且价值很高。虽然业动过心思找爬虫程序,比如八爪鱼(躺枪了),但是自己太笨了,学不会,就放弃了。
3 网站访问质量
说实话,这个网站的虚拟主机配置其实很低,咱自己浏览的时候出现502也很正常,网路确实慢点,这些都让爬虫程序不开心了。难怪百度搜索不待见咱。
以后咱们有机会的话,尽量做到:内容原创,杜绝抄袭;网页内容设计上,坚持写千字文,减少各种广告,问题是咱现在是一个广告业没有啊;内容丰富,信息量大且形似多样,图文并茂;保证网页能够访问到,这个咱的网站没问题,JS,AJAX是啥业不清楚;以后的链接也要重视,目录层次上坚持浅层次,扁平化(不知道怎么操作,书里面业没有提到);内链设计上,把资源往受欢迎的内容(页面、文章)倾斜。 总结了这么多,还是不会操作啊,基础理论不提供实践指导啊。
(三)页面收录流程与收录分析
1 页面收录步骤
首先为网站设置Sitemap文件;第二,通过搜索引擎的站长账号上传Sitemap到网站根目录;第三,在网站内部设置良好的内链。网站内链是啥?怎么设置?有没有具体的操作步骤?
2 页面收录分析
页面收录分析有两种,按url的层级进行分析,和按照频道进行分析。两种分析都涉及到 url类型、页面总数、收录页面、收录占比、问题描述这几项。
关于网站的流量,前面有截图,网站九月份流量在个位数左右徘徊。从截图看,访问量应该是包含了IP和PV的统计,前者说的是有多少了ip浏览,后者说的是这些Ip加起来总共浏览的多少页面。咱今天为了写这个,一个IP就浏览了十多个页面(PV),咱也算是一个独立访客(unique visit)。
另外一个重要的参数是网页排名,Page rank。谷歌、百度、搜狗、360以及今日头条都有了排名。一个关键数字,4,这是玩个有排名的及格线。大公司网页排名在7上下。待会儿找找差距。
谷歌有一个pr的算法公式,太抽象,理解不了。
(一)提升pr的方法
提升PR值得方法最重要得是联姻,找优质网站链接。这包括:
高PR网站
内容质量高网站
加搜索引擎分类目录
加免费开源目录
让网站出现在高pr网站上蹭人气
上传pdf文档
域名和标题出现关键词
导出链接到外部高pr网站