点击 207回答 13
2022-03-17 01:33
你们是如何看待百度保护原创的? 推荐热议![]() ![]() 今天所有SEO相关的平台似乎都被百度保护原创的内容给覆盖了,看来,这次百度真的要亮剑了,打击作弊外链,保护原创,这早已是很多白帽SEO的呼声了,但避免不了还有很多反对的声音。那么,小伙伴们,你们是如何看待百度保护原创的?回复讨论点:1、对于原创文章在搜索结果页是否应该加上 原创 标识2、什么样的文章才算是原创?比如引用了其他文字的一句或一段话是否还是原创?3、如何避免假原创或机器生成的文章?4、根据一个网站的原创率是否应该进行整体权重加分或减分?5、对于网站来讲,原创文章和转载的高质量文章孰重孰轻?6、如果你是百度工程师,如何去识别原创?更多讨论详见http://bbs.zhanzhang.baidu.com/thread-20443-1-1.html
|
支持 0
反对 0
举报
2022-03-17 03:23
看到这个消息 感觉百度 胆太肥了 应该只是 说说罢了吧 说给站长门看的吧 想体现下自己的责任感罢了吧
1、 单靠技术来识别一篇文章是不是原创 太不现实了 任何技术团队都无法做的到 一个标示 展现的是 一个判决 我相信 他不敢这样做 这样做的后果就是带来很多 冤案 张冠李戴 百度没有任何权利和能力来判决版权纠纷案 比如 一篇 非常重要的学术性文章 从未在互联网出现过 结果被人弄到了 某网站上 结果百度 给这个网站的这篇文章标示了原创 这样就不是在保护原创了是在扼杀原创 那么就会有人控告百度...... 但是要想估算 整个网站的原创比例 还是有可能的 2、理论上相似比低于30%的 就是原创 。记得大学毕业的时候 学校规定 重复率低于30% 就是原创,各大杂志社投稿 ,相似比要求 也是在10%到30% 也就是说自写率 在70%到90%。具体可以参考 知网检测系统神马的。。。非常牛逼 基本的算法是 比如 把一篇文章分成N句 没一句13个字 13个字中有7个字相同 那么这句话就是抄袭 然后循环来计算出全文的相似比。就算你拿到一句话简单的伪原创 都是没任何意义的。但是这个回到第1、 所以不一定算原创了 只能说 相似比低于30%的是稀缺资源愿 到是 可以给这样的文章 标记为 ** “稀缺文章”** 3、机器生产的好 那么就没必要杀。 生产的差 将全体现在用户体验上和 语义分析上了 提高语义分析能力 加上在用户体验上的判断 4 5 6 我始终觉得不应该 把原创文章 更多的权重排名 应该是谁出的力多 更推广了这篇文章 就更有排名好的优势 一个原创的内容没有好的展示给更多的用户,那这个原创文章的价值何在? 占着茅坑不拉屎。 一个大型的门户网站 用户群体多 每天需要大量的各种文章来给用户阅读 他不转载怎么搞?自己怎么可能能写那么多原创。。你不准他转载 ,最后苦的是用户 因为用户找不到什么文章来看了。 再说 搜索结果排名 如果你仅仅是原创 就排名好 那么你的网站布局很差 用户体验很差 用户进来看完这篇文章 直接关闭网页 去别人网站 你还排名好 这样 不是亮瞎眼睛么 消耗用户的更多时间成本么 你一篇文章是转载的 用户进来 看了一篇 又一篇 满足了用户N多需求。。。这样的网站才应该排名好。。 用户需要的不是 在百度上 东搜一下 西搜一下 浪费N多时间来 看原创文章 而是需要在一个平台上看到 管你是不是原创的N多优秀文章! 最后总结就是:只能从整体上来判断一个站是不是采集站 而不能从单一的一篇文章来看是不是原创 因为 要想判断原创 再等20年 所以如果我是百度工程师 如果硬要保护原创 我目前只会做一件事情:采集站 转载方必须 附上转载来源地址 这样就顺便给他做下推广 在原有的算法上也是对这个网站增加了权重 也是对原创贡献的一种保护 不附 就直接弄死 新浪也不例外 到时候我们就可以看到 很多大站 上有我们小站的 外链了 哈哈哈哈 |
支持 0
反对 0
举报
2022-03-17 04:02
两个字“支持”,三个字“很支持”,四个字“非常支持”。我维护的企业站隔三差五的会写些自己对产品的见解,或者是整理些某个行业可以选择的货架类型,可是每次一发布就会被别人转载去,其实转载去也没有什么,重要的是别人的被收录了,可我的网站文章迟迟不被收录,更可气的是这个站还是新站。还有就是我写的公司案例新闻就这么被别的同行转去,如果不标注的话,客户会以为那是别人的案例的,可是如果标注原创,这样不但让原作者得到保护,而且会让更多的人想方设法去创造内容。对于缺乏原创内容的互联网时代,跨出这一步是很难得的。因为不是每个人的素质都很高,要求你这样做他就这样做,所以采取点惩罚措施还是很有必要的。纯属个人观点,不喜勿喷!
|