Những dạng trùng lặp của một bài viết chuẩn SEO cần tránh

Content SEO là một trong những nội dung được khá nhiều người quan tâm hiện nay; tuy nhiên ngành nghề, công việc nào cũng có những khó khăn và vấn đề cần xử lý. Một trong những vấn đề thường xuất hiện khá nhiều trong quá trình làm việc chính là hiện tượng trùng lặp. Việc trùng lặp là một điều khá lo ngại trong sáng tạo nội dung content; gây thiệt hại đáng kể cho bài viết của bạn, thường sẽ bị loại khỏi bảng xếp hạng của Google. Thậm chí trang web của bạn có thể bị phạt nếu vấn đề trùng lặp nội dung quá quan trọng.

Nội dung SEO quan trọng thế nào?

Giới SEO thường nói với nhau rằng “Nội dung luôn là Vua” tức là nội dung là yếu tố hàng đầu trong SEO. Vậy điều gì sẽ xảy ra với kết quả SEO khi nội dung không độc nhất và trùng lặp với những nội dung khác; có thể do copy hoặc bị người khác copy? Nội dung trùng lặp ảnh hưởng đến cả công cụ tìm kiếm và chủ sở hữu trang web.

Nội dung SEO quan trọng thế nào?
Trùng lặp gây thiệt hại đáng kể cho bài viết của bạn

Nội dung trùng lặp có thể sẽ không được hiển thị ở thứ hạng cao hoặc có thể không được hiển thị trên kết quả tìm kiếm. Vì Google không chắc chắn cách thức xếp hạng giữa các nội dung trùng lặp giống nhau; mặc khác các thuật toán xếp hạng của Google cũng không cho phép xếp hạng các nội dung giống nhau; vì vậy đa phần những nội dung trùng lặp thường bị loại khỏi bảng xếp hạng. Điều này dẫn đến thiệt hại đáng kể cho SEO của bạn Nếu Google thông báo rằng bạn có nội dung trùng lặp, tại thời điểm nào đó, trang web của bạn có thể sẽ bị phạt. Google đang trở nên khắt khe hơn về bản sao tương tự vì nó đã trở thành một vấn đề nổi bật.

Dạng trùng www và non wwww

Dạng này khá phổ biến và nhiều người cũng đã biết tới. Nếu trang của bạn mắc lỗi này; thì có bao nhiêu index trang sẽ có bấy nhiêu lỗi do lỗi tác động tới toàn trang. Để xử lý vấn đề này, bạn có thể sử dụng tới điều hướng 301 hoặc sử dụng WMT để quy định tên miền ưu thích.

Trùng lặp trang chủ

Dễ gặp với các trang có link đích mặc định là website.com/home, website.com/index.php, website.com/index.aspx… Trong khi nó vẫn nhận mặc định là website.com. Trường hợp này xử lý tương tự với trường hợp 1 hoặc có thể sử dụng canonical để về link chính.

Index trang in

Với những trang cho phép in bài viết mà không để ý xử lý thì Google sẽ rất dễ index cả trang in. Điều dễ hình dung ở đây là trang in có nội dung chẳng khác gì với bài viết chi tiết. Với lỗi này bạn có thể dùng thẻ canonical quy định link chính; dùng thẻ robots hoặc file robots.txt để chặn index lại.

Trùng do các điều kiện lọc

Trùng do các điều kiện lọc
Nhưng nếu sản phẩm của bạn không đa dạng đủ để chia danh mục hoặc bạn chẳng thể tối ưu được thì sao?

Dạng này thường xảy ra với các trang bán hàng nhiều hơn. Khi trong danh mục thường có các điều kiện lọc; kiểu như: giá thấp tới cao, giá cao tới thấp, freeship, lọc theo thuộc tính sản phẩm…. Chưa kể lọc kết hợp các điều kiện nhưng thứ tự các điều kiện đảo nhau. Nếu bộ code của bạn sinh ra các link khác nhau với các điều kiện lọc khác nhau? Xảy ra lỗi trùng lặp đó. Vậy xử lý sao? Xử lý ở trường hợp này có khá đa dạng. Ví dụ lọc theo thuộc tính thì hoàn toàn có thể tạo các danh mục con; để có những landing page chuẩn seo hơn. Tất nhiên với điều kiện sản phẩm của bạn đủ đa dạng và bạn cần tối ưu lại chúng sau khi chia nhỏ danh mục.

Nhưng nếu sản phẩm của bạn không đa dạng đủ để chia danh mục hoặc bạn chẳng thể tối ưu được thì sao? Chưa hết đường nhưng bạn có thể chặn index chúng lại qua WMT với việc chặn tham số lọc (khi bạn là SEOer không quá dành về code). Nếu bạn chủ động về kỹ thuật thì có thể làm thẻ canonical về link chính hoặc chặn index với thẻ robot.

Trùng nội dung do phân trang

Dạng này tuy rất nhiều người biết đến tuy nhiên chẳng ít người mắc phải. Việc phân trang tin tức và sản phẩm nếu không được xử lý thì các bạn sẽ thấy báo lỗi trong WMT; luôn thông qua mục cải tiến HTML phần trùng lặp title và description. Với dạng này google khuyến khích chúng ta nên sử dụng các thẻ rel=”next” và rel=”prev”.

Trùng lặp không hoàn toàn

Trùng lặp không hoàn toàn
Tránh việc trùng lặp do việc đánh tag bất hợp lý nội dung

Thường xảy ra với các trang áp dụng cơ chế tag tự do hoặc có 1 cấu trúc danh mục không rõ ràng. Đây là dạng thường gặp với các trang wordpress không có cơ chế quản lý tag và danh mục rõ ràng. Bạn đã có 1 danh mục là “sản phẩm loại A” mà bạn lại có tag là “Sản phẩm loại A”; hoặc cụ thể hơn Danh mục “đồ dùng cho bé” và Tag “đồ dùng cho em bé”; vậy thì sẽ có chuyện gì.

Hiểu nôm na là sản phẩm loại A của bạn đang tồn tại 2 trang cùng nói về nó. Nó không hẳn là nội dung duplicate 100% nhưng nó là dạng nội dung tương tự; vậy cũng sẽ ảnh hưởng trực tiếp tới chất lượng website của bạn. Bạn cần định hình cấu trúc cây thư mục cho website của bạn và cần có cơ chế quản lý từ khóa chặt chẽ; tránh việc trùng lặp do việc đánh tag bất hợp lý nội dung.

 

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

error: Xin đừng copy em :)