点击 308回答 16
2022-03-15 19:36
怎样给不懂搜索引擎的人讲搜索引擎原理?![]() ![]() 整理了下搜索引擎原理知识,许多涉及到具体算法的地方很深奥,不知道该怎样向不了解搜索引擎的人去传播知识。我编了几个通俗的案例去讲,不知各位能否看懂,若是看不明白,有没有更好的简介方式。1. 关键词与关键词有联系的几个原理,像HITS,齐普夫定律,向量空间模型,TF/IDF等。每个关键词的权重是通过数学公式与语义库、网页库等结合算出来的。堆砌关键词的权重不是1+1=2,而是2>权重>1的一个动态数值,采取向量的夹角余弦公式cosθ=(a·b)/(|a|×|b|),再加上搜索引擎对堆砌关键词的anti-spam算法,和现在主流的SEO观点相悖。2. 搜索引擎爬虫搜索引擎蜘蛛的爬行方式与中国古代商朝的王位继承制度相似,下面是维基百科的介绍。商代政权由子姓王族所掌握,王族分为两组,一组谥称以甲乙为主,一组谥称以丁为主,两组互相通婚,轮流继位执政。王位多传于另一组的下辈,有时也传于同组内的同辈。王位以此互传的方式,从而在两组之间祖孙隔代继承。3. 更新网站斯坦福大学的2名研究者在2000年得出结论是网页存在半衰期,接近泊松分布,所以1个网站长期不更新,搜索引擎爬虫也会依据泊松分布,逐渐减少抓取次数。4. 关键词密度分词实现源自20世纪的詹姆斯·乔伊斯一本天书《尤利西斯》,在这本书的最后1章,没有1个标点符号,于是有位哈佛大学语言学家齐普夫专攻此书,把书里所有单词全部统计出来,计算词频,发现了《尤利西斯》包含n个词,将这些词按其出现的频次递减地排序,那么序号r和其出现频次f之积fr,将近似地为一个常数,即fr=b,(式中r=1,2,3.…),又以其他名著验证,结论非常近似。后来搜索引擎引进了这一定律,给每个词库中的每个关键词按照总词频给以一定权重,低频词的权重较高,高频词的权重较低,所谓的关键词密度亦是据此,长尾词在文章中往往有较高的权重,重复出现关键词,可以提高关键词在页面中的权重。5. 图片网页中的图片抓取不是一般抓取网页的蜘蛛来抓的,而是由专门的抓取图片的爬虫负责。靠其他网页上的超链接,alt属性,网页标题,以及图片说明来确定这张图片是什么画面。6. 外链广泛度互联网模型是链接拓扑结构,即缎带形状。不论传统的互联网亦或社交网络,都是如此。搜索引擎通常从拓扑结构的左侧开始向右单向爬行抓取。 最左边的是历史悠久的导航网站,之后是大型门户网站,中间最密集的是中小型门户网站,专业网站,右端是SEO常接触的企业网站,自媒体,草根站长。seoer经常说外链为皇,就是因为seo接手的网站往往处在互联网拓扑结构的右端末尾,从导航站开始,大量的外链可以提高搜索引擎爬虫抓取目标页的次数。 追加问题 在路上 搜索引擎(Search Engine) 举报 2013-12-17 发布6,508 次浏览 最新问题 如何才能获取快速收录权限(2 小时前) 游戏网站收录了7000多 关键词也80多个 流量却少的可怜(2 小时前) 我的网站已经建站很久了,百度一直没有收录(2 小时前) 我的站收录2万多条,关键词排名全没了。。。(2 小时前) site有结果页没有是不是被K了(3 小时前) 新域名,新站,今天第3个月,百度出现秒收录了,如何保持住,如何起飞!(3 小时前) 你们真正意义上互联网第一桶金是怎么赚取的?(3 小时前) 收录也不给权重 怎么办了(4 小时前) 想买一个有百度快速收录权限的域名(5 小时前) 用wp搭了一个网站,经常会出现打不开的情况,重启服务器后就能正常打开,这是什么原因?(5 小时前) .question-ccx {display: flex;width: 100%;margin: 0 auto;padding: 0;}.question-ccx .sw-area {width: 50%;padding: 12px 26px 10px 26px;box-shadow: none;float: left;}.question-ccx .sw-area ul li {padding: 3px 0;white-space: nowrap;text-overflow: ellipsis;overflow: hidden;display: flex;}.question-ccx .sw-area ul li a{white-space: nowrap;text-overflow: ellipsis;overflow: hidden;}.question-ccx .sw-area span {color: #999;}.question-ccx .side-reward span {color: #ec5a12;}.question-ccx .sw-area .mod-head {padding-bottom: 5px;}.question-ccx .side-reward {border-left: 1px solid #e0e8ee;float: right;}.question-ccx .sw-area ul li:nth-child(5) {display: none;}.ccx-question { border: 1px solid #e4eaee; overflow: hidden; padding: 20px 0; display: flex; width: 100%;}.ccx-new-question { width: 50%; padding: 0 20px;}.ccx-new-question li { height: 36px; line-height: 36px; border-bottom: 1px dashed #e2e2e2; white-space: nowrap; text-overflow: ellipsis; overflow: hidden;}.ccx-new-question li:last-child { border-bottom: none;} 分享到微信 收藏 关闭 没有找到相关结果 已邀请: --> .ccx-img {padding: 0; margin: 0 auto; width: 100%;position: relative;} .ccx-img_l {float: left; width: 49%;} .ccx-img_r {float: right;width: 49%;} .ccx-img img {width: 100%;border-radius: 8px;} 交换友情链接,就用搜外友链,方便! 25 人参与回答 邓立博·I am 门老师,欢迎关注我的微信公共账号:menlaoshi001黄田洲、宇哥、陶然等 3 人赞同该回答楼主啊,你写的这些本身就专业性太高啊,术语一箩筐!膜拜我给举个例子说明下。网站关键词就如某个人的标签,比如夫唯老师,说起SEO我们就能想起他。同理,对于搜索引擎和我们的网站来说,我们就是要给我们的网站贴上我们希望他应该出现的标签——我们的网站关键词。搜索引擎蜘蛛,是百度或者google的一个程序。他负责监控网站的标签是否合适和标签的持久度。如果一个网站时常更新网站,搜索引擎蜘蛛就会认为其标签(关键词)继续适应该网站。就如某人的技能,如夫唯老师,他在SEO业内活跃的越久,他理解的SEO知识越多,他的SEO能力越高,于是我们愈加认为夫唯老师在SEO方面的专业、权威性。反之,如果一个人在某一行业昙花一现,而这个行业是在不断发展的,我们是不能保证他是否胜任之前的标签的。这就是更新网站的目的——逐渐补充而变的专业权威,提升权重。关键词密度方面,亦如一个人的言行中,对于某件事情的关注度。所谓三句话不离本行,如果夫唯老师,每天会说出很多SEO业内相关的词汇,毕竟他做这一行嘛——亦是表示权威的一种。图片略过。外链,搜索引擎官方说过,就是某人对另一个人的评价。比如,夫唯老师是做SEO的,现实中我们每个这么说的人,就是夫唯老师的一个外链。还有一句话叫做三人成虎。一个人说夫唯是做SEO的,别人不一定相信,说的人多了,真速度就高了。如果业内的人士都这么说,那么夫唯就是SEO的领袖啦...
|
支持 0
反对 0
举报
2022-03-15 20:46
楼主啊,你写的这些本身就专业性太高啊,术语一箩筐!膜拜
我给举个例子说明下。 网站关键词就如某个人的标签,比如夫唯老师,说起SEO我们就能想起他。同理,对于搜索引擎和我们的网站来说,我们就是要给我们的网站贴上我们希望他应该出现的标签——我们的网站关键词。 搜索引擎蜘蛛,是百度或者google的一个程序。他负责监控网站的标签是否合适和标签的持久度。如果一个网站时常更新网站,搜索引擎蜘蛛就会认为其标签(关键词)继续适应该网站。 就如某人的技能,如夫唯老师,他在SEO业内活跃的越久,他理解的SEO知识越多,他的SEO能力越高,于是我们愈加认为夫唯老师在SEO方面的专业、权威性。反之,如果一个人在某一行业昙花一现,而这个行业是在不断发展的,我们是不能保证他是否胜任之前的标签的。这就是更新网站的目的——逐渐补充而变的专业权威,提升权重。 关键词密度方面,亦如一个人的言行中,对于某件事情的关注度。所谓三句话不离本行,如果夫唯老师,每天会说出很多SEO业内相关的词汇,毕竟他做这一行嘛——亦是表示权威的一种。 图片略过。 外链,搜索引擎官方说过,就是某人对另一个人的评价。比如,夫唯老师是做SEO的,现实中我们每个这么说的人,就是夫唯老师的一个外链。还有一句话叫做三人成虎。一个人说夫唯是做SEO的,别人不一定相信,说的人多了,真速度就高了。如果业内的人士都这么说,那么夫唯就是SEO的领袖啦... |