推广 热搜: 食品  快递      www  民事主体  网络营销  代理  东莞市  橡塑 
点击 298回答 7 2022-03-17 02:32

大家一起来讨论下语义分析这块吧! 推荐热议

已解决 悬赏分:10 - 解决时间 2022-03-17 12:50
之前为了给分享会做推广,我没事就在群里扯点东西出来。比如其中一句话:“重复度越高的内容越适合来做语料库,相反越是原创的内容,蜘蛛越陌生,也就越没权重。”因为群里几百号人里伸手党太多了,所以当时也没想过要把核心的分享出来。于是就随口说了一句,没能表达出本意,存在很大的误导性。很多人没看懂,因为不认同,甚至有人觉得瞎扯了。好几个私聊,我也懒得去解释。上次看到有人发到搜外来了 http://ask.SEOwhy.com/question/17832 没几个人回复,也没见谁看懂的出来聊聊。昨天有个人发了个帖子,说内容和我的差不多。http://lusongsong.com/reed/1252.html我看了下,里面提到的“词系关联”是相通的。语义分析这块搜索做的很强大,但有些地方过分强大了,毕竟技术这块是个大问题。所以我就去百度截了个图,大家可以看下。 虽然我那句话误导性很强,但信息量其实还是很大的,不止是这么一点点。大家一起来讨论下语义分析这块吧!--------------------------------------------------------------------------------------------------------顺便提下,因为之前在搜外过于装逼,所以前几天我重新注册了个新马甲。 追加问题 语义分析 举报 2014-12-18 发布5,088 次浏览 最新问题 文章命名规则哪种比较好?(5 分钟前) 哪位同学帮忙指点下,搜外内容管家这个工具什么原理?(11 分钟前) 完犊子了 怎么投诉,快照也没有变化(15 分钟前) 流量走丢的第四天,天天打卡,看能签到多少天!!(20 分钟前) 公司要做新站,大气一些的,怎么才能算大气呢?(25 分钟前)   提交sitemap的话,百度只会抓取sitemap里面的页面吗?其他新更新的页面会不会抓取。(41 分钟前) 有交换友链的吗?(46 分钟前) 一般新域名多久才会收录啊!(50 分钟前) 这次315对于搜索来讲,会改变一些东西吗?(51 分钟前) 现在发外链有什么网站推荐? 外链还有作用吗?(52 分钟前) .question-ccx {display: flex;width: 100%;margin: 0 auto;padding: 0;}.question-ccx .sw-area {width: 50%;padding: 12px 26px 10px 26px;box-shadow: none;float: left;}.question-ccx .sw-area ul li {padding: 3px 0;white-space: nowrap;text-overflow: ellipsis;overflow: hidden;display: flex;}.question-ccx .sw-area ul li a{white-space: nowrap;text-overflow: ellipsis;overflow: hidden;}.question-ccx .sw-area span {color: #999;}.question-ccx .side-reward span {color: #ec5a12;}.question-ccx .sw-area .mod-head {padding-bottom: 5px;}.question-ccx .side-reward {border-left: 1px solid #e0e8ee;float: right;}.question-ccx .sw-area ul li:nth-child(5) {display: none;}.ccx-question { border: 1px solid #e4eaee; overflow: hidden; padding: 20px 0; display: flex; width: 100%;}.ccx-new-question { width: 50%; padding: 0 20px;}.ccx-new-question li { height: 36px; line-height: 36px; border-bottom: 1px dashed #e2e2e2; white-space: nowrap; text-overflow: ellipsis; overflow: hidden;}.ccx-new-question li:last-child { border-bottom: none;} 分享到微信 收藏 关闭 没有找到相关结果 已邀请: --> .ccx-img {padding: 0; margin: 0 auto; width: 100%;position: relative;} .ccx-img_l {float: left; width: 49%;} .ccx-img_r {float: right;width: 49%;} .ccx-img img {width: 100%;border-radius: 8px;} 交换友情链接,就用搜外友链,方便! 7 人参与回答 唐勇·6年网络推广经验,搜外老版主。周通等 1 人赞同该回答分词技术更重要的是识别垃圾组合文章,不然结果出现大量用户读不懂的垃圾组合文章,搜索就可以去死了;用户搜索过程产生相关搜索展示。逻辑越复杂的东西越没有实际意义,只适合培训师装B。
反对 0举报 0 收藏 0 打赏 0
最佳答案
支持 0 反对 0 举报 2022-03-17 03:55
之前为了给...
支持 0 反对 0 举报 2022-03-17 04:31
分词技术更重要的是识别垃圾组合文章,不然结果出现大量用户读不懂的垃圾组合文章,搜索就可以去死了;用户搜索过程产生相关搜索展示。
逻辑越复杂的东西越没有实际意义,只适合培训师装B。
支持 0 反对 0 举报 2022-03-17 05:34
对语义分析这块我没什么了解。
我只知道 加相关词、近义词、分词等来避免关键词密度过高和用委婉的方式告诉搜索引擎我这篇文章的主题。因为我认为百度把数据库中已经存在的一些词语 句子 通过一些算法锁定了与什么相关。你在文章中加入这样的句子 搜索引擎就把你和其对应起来。比如 性高潮 可能和做爱以及保健品相关。我了解的就只有这么一丁点了。

但是对于咨道 我以前了解过 以前也看过他的一些文章 看似很牛逼 观点很独到 可是回过头想一想
TMD ...........
刚刚看了他那篇文章 我现在越来越发现 很多培训机构神马的 特别喜欢把一个很简单的方法或者理论说的特别复杂 搞的很高大上 再自己给其附上一个专有方法名词。
说起咨道 我好像又有很多话要吐
咨道网站权重为 但是感觉他的很多技术文章都值得一看。
很多写技术文章体现的很牛逼的SEO培训机构,自己网站却排名垃圾的要死。
很多写天天发营销文章的达人,却没见他自己却没通过营销什么实质产品赚到什么钱。 好像跑题了。。。(我也要去注册个小号 重新上路了,,,,,,,)
支持 0 反对 0 举报 2022-03-17 06:43
不要太迷恋相关性,不知道你是搜索引擎书看多了还是怎么,实际告诉我们,现在研究这个没太大用处。
支持 0 反对 0 举报 2022-03-17 08:13
分词的意义在于相关性,我比较赞同三木说的,不相干甚至是你自己造出来的词怎么会有很高的权重?
举个简单的例子,搜索词:克劳 ,这是我随便打的,看下图









头部展现是任务介绍,底部的为相关搜索,都为人名
很明显,关于‘克劳'这个词的人物名称较多,且权重较高





所以这张图相干类的是人物,而不是底部的工业大学或是品牌之类的。
百度调用依然是抓取词库的做法来匹配的

至于题主截图的这一段根本不能参考的,字数过多,本事匹配词的时候就会比短语少很多搜索结果,且但看快照也肯定是不符合的,(再说了,你们不是一直都说快照没用吗?不要看快照吗?)





图片展示的搜索结果为1060页面,虽然我更认同相关页面应该为“小说”之类的内容,但是底部出现的搜索小说类实际是比较少的,且权重较低,排名靠后。 7 年前 赞同 0 评论 1 收藏 举报
李玉峰 李玉峰 · 有技术却不挣钱的悲催中年人

看主题吧?如果主题没有人关注,那么无论你是抄袭,还是写出花来,对seo帮助都不大。

支持 0 反对 0 举报 2022-03-17 08:37
我觉得百度对语义分析是建立在用户搜索的基础上。
当用户搜索“计算机”的时候,往往也会搜索“电脑”“PC”,等这样搜索行为的人多到一定数量的时候,百度就会把这几个词联系起来。等其他用户搜索其中某一个词的时候,搜索页面上就会出现其相关词。
但在文章中刻意出现相关词,我觉得不是一种利于用户体验的优化。
支持 0 反对 0 举报 2022-03-17 10:10
重复度越高的内容越适合来做语料库,相反越是原创的内容,蜘蛛越陌生,也就越没权重

这句话,需要看针对的是词语还是文章。

如果是文章的话,我不赞成,可能我的思想觉悟没有那么高,无法理解高深的问题,我无法去想象一个文章被复制了几百遍,你再发上去不但能收录,还能有排名,因为都是相同的文章,而第一页排名就10位,那应该放哪10个文章呢?

如果是词语,那我很赞成,比如你原创的内容,夹带了很多自创词语,搜索引擎根本理解不了,那么排名不好是很正常的了。

同样,也可以从另外一个方面去理解你的这句话,重复度越高的内容是指的某些词语重复度,而非整个文章的重复度,比如一个文章的标题是 什么是蜘蛛程序,那么不管是任何一篇关于蜘蛛程序的文章,相互之间都会有很多重复的词语,比如百度、抓取、收录、网页等。
网站首页  |  营业执照  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报