你有一个WooCommerce在线商店,已经花了大把时间在搜索引擎优化定位上,但是最终效果并不理想!除了其他原因,还有很常见的一个因素就是过多的重复内容,这是SEO中最常见的问题之一,同时它也是最常被忽视的问题之一。
谷歌身为全球最大的搜索引擎,它的目标是提供最高质量的内容,向进行搜索的用户展示相关且有趣的信息。搜索引擎会按降序排列结果,把最优秀的原创内容排在首位来“奖励”它。相反,当内容缺乏吸引力、重复或者抄袭,谷歌会对其进行惩罚。
从转化率的角度来看,谁不想能够出现在搜索引擎搜索页的第一?根据Moz的一项研究,67.6%的点击都是在谷歌排名前五位的位置上。这就是为什么许多公司不惜一切代价都要出现在这些位置上,不过许多公司会采取黑帽的方式或者不道德的做法来实现。
什么是重复内容?
重复内容,也有人叫重复页面,指的是搜索引擎收录牵引的内容文本在一个以上的网络地址(URL)里部分或完全重复,这不仅仅是在一个域名下的页面内容,也包括不同网站上的内容,简单说就是照搬他人的内容,也算重复内容。
外部的重复内容(抄袭)是第三方人为的,这个我们做不了什么。内部重复通常是由于我们网站结构的错误导致的,因为不了解搜索引擎优化而造成的,属于站内优化 SEO ON PAGE 的错误。这些错误会使多条网站链接指向同一页面或者因为我们在2个或多个页面使用了大部分相同的文本。
当超过30%的内容文字完全相同地发布在其他URL上时,内容可能被视为重复。当页面包含的文本中至少有70%的内容与其他页面的结构并不完全相同时,可以认为它是原创的。
重复内容的不同种类
1. 内部内容重复
这是属于我们网站内部的 One Page 优化问题,比如你有一个WooCommerce网店,产品描述你直接复制厂家的到你的网站上或者做变体产品的时候,产品的不同变体(颜色,尺寸,图案),这些都算是重复的内容。
2. 外部内容重复
这个指的就是赤裸裸的照搬抄袭,经常发生在从亚马逊,阿里巴巴等网站导入产品时。
为什么会多出重复的页面?
重复页面通常都是下意识出现的,从链接,产品,网站结构这些上面都可能出现这个问题。
1. www 子域名
我们的网站可以使用带有“www”前缀或不带前缀访问,这会出现相同内容但URL不同的页面。这里我们只能保留一个,另外一个301重定向(这个通常服务商都是默认自己设置的)
2. 建议搜索引擎不索引本站点
建站时没有开启 “建议搜索引擎不索引本站点”
3. 页面链接
这两条链接的区别在于尾部没有斜杠(/),这是两条不同的链接,需要保留一条,另外一个重定向。
- https://jhchen.top/seo/duplicate-content/
- https://jhchen.top/seo/duplicate-content
过多重复内容的影响
笔记一开始就说过了,搜索引擎倾向于向用户提供最相关、最有价值的信息。当搜索引擎发现多个网页包含相同或非常相似的内容时,它们会认为这些页面是垃圾信息,从而降低它们在搜索结果中的排名。
如果内容是从其他网站复制的,那么情况就更严重了。谷歌不会给这样的内容排名,甚至可能不会出现在搜索页上。不过在网站上有一些内容重复是正常的,一些短语,引文,几句话等等,只要不是大面积重复不会有问题。
1. 低质量内容
低质量内容会影响页面质量,无论是对用户还是对搜索引擎。搜索引擎可能在选择展示的内容时不是你希望的页面,这可能会向用户展示质量较低的重复页面。
2. 有机可见度下降
高质量和高排名是挂钩的。如果失去了质量,也会失去页面的排名。同时在搜索结果页面的下降会让你的在线可见性和来自搜索引擎的流量减少。
3. 误判内容归属
当搜索引擎在不同的域名上检测到两个相似的内容时,它会根据索引日期或站点的权重来决定哪个是元内容。所以搜索引擎可能会选错哪一个是原始版本,尤其是如果你的网站影响力不大权重不高。搜索引擎们也没有其他方法来判定这个了。
4. 页面索引问题
网站页面的索引可能会受到影响,因为搜索引擎在一段时间内(爬取预算)会对所有页面进行爬取,由于存在大量低质量或重复的页面导致浪费了有限的爬取时间,搜索引擎的机器人无法快速的访问网站主要内容。
检测网站是否有重复页面
我们可以在自己的网站搜索重复内容或者找文字是不是抄别人的。
1. 检查网站重复页面
- 我们可以直接在专业的搜索引擎优化工具上查询,像 Ahrefs 或 SemRush
- 搜索引擎站长平台:检测网站上的重复 meta 标题和 meta 描述,你可以使用 Google Search Console ,在左侧导航栏中点击“搜索外观” > “HTML”。
- Screaming Frog:可以帮助我们检测网站的各种问题,从重复内容到死链接。它有免费版本,但是只能跟踪最多 500 个页面。使用该工具的过程如下:创建项目,将数据导出到 Excel.
- Site: 谷歌的内部工具,只需要在浏览器地址栏输入 ‘site: 域名 + 关键词’ ,Google 就会显示你网站上已经索引的所有内容。你可以看到是否存在重复内容。
2. 检查抄袭文本
- Copyscape:这是工具非常简单易用。直接访问该网站,把想要检查内容的 URL 或其片段复制到搜索框中,它就会告诉你和已经发布的任何文本相比具有多少重复率。缺点是要每条链接单独进行检查,不能查看整个网站的内容。目前不支持中文,韩文和日文。
-
Plagium:工作原理和Copyscape很像,只是需要直接在搜索框上输入要查看是否存在重复内容的文本。免费最多只能检查 5000 个字符。
-
Google 高级搜索:这个仅适用于非常具体的情况,想要检查某个特定而且不太长的文本是否出现在其他网站上。你只需将其用引号(‘关键词’)括起来并在Google中搜索,它就会显示与你输入的文本完全相同的结果。
预防网站重复内容
搜索引擎不喜欢重复内容,因为它会降低用户体验。所以你通过上面的方式找到错误后你可以做以下操作:
- 最简单的方法就是直接换内容,把重复的文本删掉重新写。
- 给重复的内容打上 “rel=canonical” 指向主要内容。这个SEO插件都有自带。它告诉搜索引擎哪个是页面的原始版本,可以避免搜索引擎将这些内容视为重复。
- 重复内容设置301重定向到主要内容。这主要用在canonical无法使用时或有两个索引到相同位置的链接。这个方法可以自动将访问者从一个页面重定向到另一个你要的页面。
- 可以使用“nofollow”标签来告诉搜索引擎不要追踪特定链接。
-
使用Robots文本屏蔽页面是避免页面重复的另一种方法。如果无法重定向或删除有重复内容的页面,这种情况应该不会发生,可以通过Robots.txt文件,我们告诉搜索引擎应该忽略或阻止哪些页面或文件。
1条评论
Skye
您好,请问下网站链接出现【-2】例如:https://xxx/xx/product/xxx-2-2-2/也是文章提到的情况吗?似乎有一点不同。我们是产品更新价格后马上会新增一个-2,困扰许久找不到解决方法,求教
JH. CHEN
具体什么原因得进后台查看。现在我只能告诉你,那些带数字的链接你把数字删除访问都有一个301重定向到后缀带数字的。