Trùng lặp nổi dung là gì?

Điều này có thể gây ra những vấn đề đặc biệt mà trước đây đã từng gặp phải, là trang web mới hơn ( nó hiếm khi được Google bot ghé thăm và index ) bị một trang uy tín hay một trang được Google bot thường xuyên ghé thăm copy bài. Nghiễm nhiên kẻ copy lại được lên thứ hạng cao, trong khi nội dung gốc lại tụt dần và biến mất. Để khắc phục điều mới nêu trên thì, sau khi viết bài xong hãy truy cập Search console của mình và submit URL của bài viết mới của mọi người ngay lập tức.

Trùng lặp nội dung nội bộ là gì?

Nội dung trùng lặp nội bộ là nội dung giống hệt hoặc tương tự nằm trong một website có 1 domain chung. Những nội dung trùng lặp này được tạo ra bởi quá trình xây dựng website chưa có khảo sát tính toán cụ thể. Dưới đây là các trường hợp thường gặp phải lỗi nội dung trùng lặp nội bộ :

Trang Tag
Trang Filter
Kết quả trang search nội bộ
Trang Category
Trang sản phẩm đơn lẻ bị add vào nhiều Category khác nhau
Phân trang ( xem thêm hướng dẫn từ Google về nội dung được phân trang )

Trùng lặp nổi dung là gì?

Nội dung trùng lặp ( duplicate content ) đơn giản chúng ta được hiểu là một nội dung mới giống như một bản sao với nội dung Gốc. Những điển hình của nội dung trùng lặp :

Nội dung chính xác hoàn toàn , hoặc phần lớn các nội dung tương tự
Nội dung trên một số lĩnh vực, tên miền phụ hoặc URL đồng thời có thể truy cập (www / non-www / http / https / index.html /? Utm ... =)
Từ khoá, tiêu đề, mô tả, nội dung trong bài giống hệt nhau

Các loại Google không cho là trùng lặp

Dịch thủ công
Nội dung trong Apps
Nội dung địa phương ...vùng miền

Trùng lặp nội dung bên ngoài là gì?

Nội dung trùng lặp bên ngoài nói một cách dễ hiểu tương tự với nội dung trùng lặp nội bộ, đều là các nội dung giống hệt hoặc tương tự được sinh ra, nhưng điều khác ở đây là chúng không cùng nằm trong một domain. Loại nội dung trùng lặp này thì thường sẽ là một lỗi khá nặng đối với bộ lọc của Google, sau đây em sẽ gợi ý vài trường hợp điển hình có thể gặp :

Các mô tả Sản Phẩm của những trang thương mại điện tử
Nội dung tạo bằng cách sử dụng kỹ thuật tạo từ đồng nghĩa hoặc mã hóa ( spin content )
Ăn trộm nội dung của đối thủ thủ công
Nội dung cóp nhặt
Lấy nội dung qua RSS feeds
Sử dụng lại các thông cáo báo chí
Sử dụng content của các affiliate sites

Làm sao để google phát hiện được nội dung trùng lặp?

Kĩ thuật lọc và xác định nội dung của Google nằm ở 3 điểm khi Google lập chỉ mục nội dung :

Khi lên Lịch ( Scheduler )
Trong thời gian lập chỉ mục ( indexing )
Trong các kết quả tìm kiếm

Google đánh giá nội dung trung lặp như thế nào?

Google đang nỗ lực để lập chỉ mục và hiển thị các trang với thông tin riêng biệt, họ muốn đưa tới người dùng một kết quả tìm kiếm liên quan đến truy vấn của người dùng nhất. Tuy nhiên thì vẫn có một vài lí do khác mà Google chưa nói đến : Google phải tiết kiệm thời gian Có vẻ không khó hiểu với mọi người, nhưng em cũng xin nói qua một chút, Google có hàng chục triệu website mới cần index mỗi ngày, với một khoảng thời gian giới hạn hệ thống cần phải thu thập hết dữ liệu về. Quá nhiều nội dung trả về mỗi ngày nên nếu nội dung trùng lặp không được loại bỏ Google sẽ không còn đủ thời gian để crawl và nó sẽ kết thúc sớm.

Tất nhiên điều này dẫn tới các URL quan trọng không được lập chỉ mục. Google phải tiết kiệm khả năng lưu trữ Lý do này đương nhiên thuyết phục, bởi bộ nhớ Google mặc dù là khổng lồ, nhưng tốc độ tăng trưởng sinh ra các website thực sự quá nhanh, Google cần phải lo lắng cho hệ thống lưu trữ của mình.

Google phạt nội dung trùng lặp như thế nào?.

Đối với trùng lặp nội dung nội bộ được nêu ở trên gần như Google không áp dụng hình phạt với chúng, tuy nhiên với trùng lặp nội dung bên ngoài Google rất gay gắt với chúng. Và có các hình phạt như

Thứ hạng giảm xuống
Loại bỏ index
Loại bỏ website khỏi công cụ tìm kiếm

Google phát hiện tác giả của bài viết gốc như thế nào?

Đây là một vấn đề mà gần đây cũng khá nhiều anh em có inbox facebook cá nhân và hỏi: " làm thế nào Google phát hiện được tác giả bài viết gốc hay làm sao Google biết đó là một bản sao ". Xin trả lời như sau, Google xác định tác gỉa bài viết gốc khi mà chỉ khi website chứa bài viết được lập chỉ mục ( index ) đầu tiên.

Cách sử lý với nội dung trùng lặp!

Dựa trên gợi ý của Google dưới đây, mọi người có thể dễ dàng giải quyết vấn đề về nội dung trùng lặp theo một số bước và đảm bảo rằng khách truy cập sẽ xem được nội dung mà mọi người muốn họ xem.

Đồng nhất: Mọi người nên giữ liên kết nội bộ đồng nhất. Ví dụ: không liên kết tới example.com/page/ và example.com/page và example.com/page/index.htm.
Tránh xuất bản nội dung trang trống : người dùng không muốn nhìn thấy các trang "trống".
Hiểu được hệ thống quản lý nội dung của mọi người : đảm bảo rằng mọi người biết rõ cách thức hiển thị nội dung trên trang web của mọi người.Ví dụ: rất dễ trùng lặp nếu mọi người để url theo các category hoặc tag khác nhau, nếu không tối ưu url ( example.com/abc/noi-dung-trung-lap và example.com/cde/noi-dung-trung-lap )
Sử dụng các tên miền cấp cao: Để giúp Google cung cấp phiên bản tài liệu phù hợp nhất, hãy sử dụng các tên miền cấp cao bất cứ khi nào có thể để quản lý nội dung theo từng quốc gia. Ví dụ: example.vn chứa nội dung tập trung vào nước Đức hơn là example.com/vi hoặc vn.example.com.
Thận trọng khi cung cấp nội dung ra ngoài: Nếu mọi người cung cấp nội dung của mình cho nhiều trang web khác, Google sẽ luôn hiển thị phiên bản mà Google cho là phù hợp nhất đối với người sử dụng trong mỗi tìm kiếm định sẵn.
Tuy nhiên, sẽ rất hữu ích khi đảm bảo rằng mỗi trang web được mọi người cung cấp nội dung đều có chứa một liên kết quay trở lại bài viết gốc của mình. Mọi người cũng có thể yêu cầu những người sử dụng tài liệu do mọi người cung cấp sử dụng thẻ meta noindex để ngăn công cụ tìm kiếm lập chỉ mục phiên bản nội dung của họ.
Sử dụng 301: Nếu mọi người đã cấu trúc lại trang web của mình, hãy sử dụng chuyển hướng 301 ("RedirectPermanent") trong tệp .htaccess của mọi người để chuyển hướng nhanh người dùng, Googlebot và các trình thu thập dữ liệu khác
Sử dụng meta noindex : nếu phát hiện nội dung trùng lặp mọi người cũng có thể nhanh chóng triển khai trong meta thẻ noindex để chặn bot index bài viết này, tránh ảnh hướng xấu toàn site.
Sử dụng canonical : Nếu mọi người vẫn muốn giữ nội dung đó là cho website của mọi người mà không muốn sử dụng noindex thì mọi người có thể thêm rel="canonical" vào trong thẻ meta.
Sử dụng Search Console : để cho Google biết cách mọi người muốn trang web của mọi người được lập chỉ mục. Mọi người có thể cho Google biết miền ưa thích của mình
(ví dụ: www.example.com hay example.com).
Giảm thiểu sự lặp lại của nội dung cần thiết : Ví dụ: thay vì đặt văn bản dài dòng về nội dung bản quyền ở cuối mỗi trang, hãy chèn một bản tổng hợp vắn tắt và sau đó liên kết tới một trang chi tiết hơn. Hoặc sử dụng hình ảnh chứa nội dung đó.
Giảm thiểu nội dung tương tự nhau: Nếu mọi người có nhiều trang tương tự nhau, hãy cân nhắc việc mở rộng mỗi trang hoặc hợp nhất các trang thành một.

Henry Hoàng

Chuyên gia SEO Henry Hoàng. Có nhiều năm kinh nghiệm trong lĩnh vực seo, cải thiện % CTR cho website, nhằm tăng tỉ lệ chuyển đổi. Phân tích đánh giá độ cạnh tranh từ khóa, từ đó đưa ra định hướng SEO phù hợp. Xem thêm

FollowAction (12965) - LikeAction (13165) - WriteAction (900)

Chủ đề Seo content
Tiếp thị nội dung

BÀI VIẾT LIÊN QUAN

Biên tập nội dung web chuẩn SEO top Google Bing ra đơn 100%

Với 1 bài viết, bạn nên nói về một chủ đề duy nhất. Khi viết về chủ đề ấy, bạn diễn tả nó càng cụ thể, càng dễ hiểu thì càng tốt. Tuy nhiên,...

Chia sẻ ý tưởng biên tập nội dung web ra đơn top Google Bing

Thật hoang mang khi tôi vừa nói ở trên rằng không được trùng lặp nội dung. Không được lấy của đối thủ. Nhưng khoan đã, bạn có thể chờ đợi...

Ba lời khuyên về SEO giúp nội dung Pr cua bạn xếp thứ hạng cao Google

Việc triên khai thuật toán Panda 4.2 của Google đã được bắt đầu vào cuối tuần qua và đang tiếp tục thực hiện cam kết của Google trao cho những nội...

Cách xây dựng nội dung web hấp dẫn chuẩn Google Bing ra đơn

SEO content hiểu đơn giản là phương pháp SEO dưạ trên nội dung chất lượng là chính. Các yếu tố quan trọng nhất giúp làm SEO thành công là: Nội dung, Onpage, Backlink, Traffic.

Cách viết bài chuẩn seo trên website hiệu quả cao ra đơn hàng

Sau đây là các yếu tố quan trọng bạn cần phải lưu ý khi lập website bán hàng. Hãy áp dụng thử các chia sẻ này, bạn sẽ ngạc nhiên trước cơ hội hiển...

Tối ưu hóa nội dung cho web bán hàng viết bài giới thiệu sản phẩm

Tối ưu hóa là rất quan trọng để tối đa hóa giá trị của nội dung. Đối tượng khách hàng phù hợp phải có khả năng tìm ra nội dung. Và nội dung phải thúc...

Seo website bằng content marketing top Google Bing Youtube Facebook

Mỗi một người làm content SEO sẽ có những bí quyết riêng với ngành nghề của mình. Thế nhưng tất cả đều dựa trên nền tảng có sẵn và từng người sẽ...

Content SEO web lên top Bing Google hướng dẫn tổng quát A-Z

Loại hình SEO Content Marketing này cũng dễ được Google cho hiển thị ở dạng Featured Snippet (những đoạn văn bản ngắn xuất hiện ở đầu kết quả tìm kiếm...

Cách viết bài cho người mới bán hàng online trên Facebook Zalo tiktok

Khi lướt bảng tin trên facebook chúng ta sẽ dễ bị thu hút bởi những Content Facebook hay, hấp dẫn và thường tìm hiểu thông tin kỹ lưỡng hơn. Tuy nhiên cũng có...

Xem thêm