81- 83 Nguyễn Hữu Cầu
P. Tân Định, Q.1, TP.HCM
0961 75 79 89
0969 87 39 79
T2 - T608:00 - 17:00
Hỗ trợ 24/7

Thuật toán Panda là gì? Nguyên nhân website nhận án phạt từ Google Panda

Nếu bạn thường xuyên nhầm lẫn các thuật toán của Google. Hoặc bạn chưa biết thuật toán Panda là gì? Nó giữ vai trò ra sao trong quá trình SEO? Làm sao để khắc phục sau khi bị “phạt”? Vậy thì hãy cùng nhau tìm hiểu trong bài viết sau đây.

Thuật toán Panda là gì?

Thuật toán Google Panda chính thức ra mắt ngày 23/02/2011.

Thuật toán Panda
Thuật toán Panda

Mục đích của việc cập nhật thuật toán Google Panda nhằm xếp hạng cho các trang web chất lượng cao. Đồng thời, làm giảm sự xuất hiện của các website chất lượng thấp trong bảng kết quả tìm kiếm tự nhiên của Google. Google Panda còn được biết với tên gọi khác là “Farmer”.

Ảnh hưởng của thuật toán Panda
Rất có thể Google Panda đang “dòm ngó” website của bạn!

Nguyên nhân nhận án phạt từ thuật toán Panda

Thuật toán Panda giúp chỉ ra một số vấn đề trên SERP của Google. Từ đó chúng ta có thể rút ra một số nguyên nhân chính như sau:

Nội dung nghèo nàn

Các trang có rất ít nội dung liên quan và nguồn kiến thức. Ví dụ như website chủ đề sức khỏe nhưng mỗi trang trong đó chỉ có vài câu mô tả.

Nội dung thiếu độ tin cậy

Là những nội dung đến từ các trang chưa được xác minh. Một đại diện của Google đã tuyên bố: “Để tránh ảnh hưởng của Panda, các trang web phải xây dựng độ tin cây (trust) và thẩm quyền (authority).” Nếu không trang web của bạn có khả năng bị Google Panda loại bỏ ngay.

Nội dung lặp lại (Duplicate Content)

Những nội dung sao chép xuất hiện trên mạng Internet không chỉ một nơi. Vấn đề này có thể xảy ra với trang web của bạn khi có nhiều trang chứa cùng nội dung. Hoặc là bạn ít thay đổi nội dung giữa các trang.

Google sẽ tính nội dung trùng lặp theo nội dung mỗi trang, thẻ meta description, heading, code HTML, khung giao diện, khung thiết kế mặc định của trang web.

Theo Google: “Nội dung (content) là toàn bộ code HTML của trang web.”

Khi tiến hành crawling dữ liệu, Google bots sẽ crawling code html từ trên xuống dưới, từ trái sang phải. HTML phải độc nhất từ 51% thì trang web của bạn mới an toàn. Nếu khung design mặc định của mỗi trang giống nhau thì cũng tính là trùng lặp.

Ví dụ: bài viết của bạn chỉ có 300-400 từ mà khung design mặc định của website lớn thì chắc chắn website bị tính là duplicate. Vì thế đa số các trang thương mại điện tử đều bị duplicate content.

Nội dung chất lượng thấp

Các trang chỉ cung cấp rất ít giá trị đối với độc giả bởi vì họ không đi sâu vào thông tin chi tiết, viết qua loa, không có sự phân tích chuyên sâu, chủ đề hạn hẹp…

Content Farming

Đây là thuật ngữ dùng để nói về các website spam nội dung. Bằng cách thu thập nội dung, hoặc copy nội dung từ các trang web khác, sau đó nhồi nhét nhiều từ khóa và tối ưu web tốt hơn so với trang web gốc.

Những website dùng hình thức content farming để thăng hạng từ khóa trên các công cụ tìm kiếm. Thay vì tập trung cung cấp bài viết giá trị cho người đọc.

Trang chứa quá nhiều quảng cáo

Các trang này chủ yếu kiếm tiền từ việc đặt banner quảng cáo. Họ cung cấp rất it hoặc thậm chí không có nội dung giá trị cho người dùng.

Trang web bị chặn bởi người dùng

Đó là những trang bị người dùng chặn trực tiếp từ kết quả công cụ tìm kiếm bằng cách sử dụng phần mở rộng trình duyệt Chrome (Chrome browser extension). Điều đó cho thấy trang này chứa nội dung kém chất lượng.

Nội dung không khớp với truy vấn tìm kiếm

Các trang “hứa hẹn” đưa ra câu trả lời liên quan tới truy vấn của người dùng. Tuy nhiên, khi nhấp vào thì họ lại không cung cấp nội dung liên quan. Ví dụ: trang đặt tiêu đề “Tặng phiếu giảm giá cho toàn bộ menu”. Nhưng khi click vào thì không có hoặc trang chỉ chứa toàn quảng cáo, gây thất vọng cho dùng.

Ngoài ra nguyên nhân có thể đến từ lỗi Schema. Quy luật Schema do Google đưa ra như sau:

“Nếu bạn khai thông tin gì trên Schema thì người dùng cũng phải thấy giống hệt vậy trên trang web của bạn.”

Lỗi Schema
Lỗi Schema

Nếu bạn khai báo thông tin sai tức là bạn đang làm trái với quy luật của Google. Một khi Google scan và thu thập dữ liệu về bạn, nó sẽ bị lãnh án phạt ngay.

Cạnh tranh từ khóa

Cạnh tranh từ khóa (Keyword Cannibalization) là hiện tượng xảy ra khi bạn cố ý hoặc vô tình tạo ra nhiều bài viết với cùng một chủ đề hoặc tối ưu cùng một số từ khóa cụ thể nào đó.

Các Url trang dù được hiển thị trên kết quả của công cụ tìm kiếm. Nhưng không có trang nào được đứng ở vị trí top 10.

Lúc này, Google Panda sẽ xem xét ưu tiên các trang được tối ưu nhất. Nếu nó quét một trăm trang và thấy tất thảy các trang đều được tối ưu với bộ từ khóa độc nhất và các chủ đề khác nhau. Thì Google sẽ nhận diện và xếp URL trang lên vị trí phù hợp.

2 cách kiểm tra cạnh tranh từ khóa

  • Dùng công cụ Screaming Frog
  • Gõ trên Google theo cú phép như sau: “site:domain + keyword“.

Ví dụ; Gõ cụm từ “site:bazansolutions.com dịch vụ seo” rồi enter. Bây giờ bạn có thể xem những trang đã tối ưu từ khóa “dịch vụ seo” rồi đấy!

kiểm tra cạnh tranh từ khóa
Kiểm tra cạnh tranh từ khóa

Trộn nội dung

Trộn nội dung hay spin content là cách để tạo ra bài viết hoặc những đoạn nội dung mới.

Bài viết mới này tuy khác câu chữ, từ ngữ sử dụng nhưng nó thường truyền tải cùng một ý nghĩa với nội dung gốc. Tuy nhiên, có lúc nó cũng mang ý nghĩa khác hoàn toàn.

Cách trộn nội dung này thường không được đánh giá cao. Google xem đây là những nội dung rác. Vì thế mà Google thường xuyên cập nhật thuật toán, đặc biệt là thuật toán Panda để loại bỏ các nội dung rác này.

Dấu hiệu website bị phạt do thuật toán Panda

Các dấu hiệu giúp bạn nhận ra website đang bị “phạt” do thuật toán Panda sẽ được đề cập ngay sau đây:

#1 Lưu lượng truy cập tự nhiên giảm dần

Một trọng những dấu hiệu dễ nhận ra nhất là organic traffic hay lưu lượng truy cập tự nhiên giảm dần theo thời gian. Trong thời gian đầu, bạn có thể không thấy ảnh hưởng gì lớn. Nhưng chỉ sau vài tuần hoặc thậm chí 1-2 tháng, bạn sẽ nhận ra mức độ traffic giảm ngày càng trầm trọng.

panda update
Traffic organic giảm do thuật toán Panda

Điều đó có thể dẫn đến hàng loạt ảnh hưởng tiêu cực mà thuật toán Panda gây ra cho trang web của bạn.

Trong trường hợp website của bạn trùng lặp nội dung ở mức độ thấp, Google Panda sẽ chưa phạt ngay. Chỉ khi mức độ trùng lặp khoảng 20-30% thì traffic mới bị kéo xuống.

Lưu ý sự khác biệt giữa án phạt của Google Panda và Penguin:

Với án phạt của thuật toán Panda thì traffic bị kéo xuống dần dần. Ngược lại, khi bị “phạt” bởi Penguin thì traffic bị kéo xuống tận đáy.

#2 Lưu lượng truy cập bị giảm một nửa

Nếu một website đang hoạt động tốt bỗng bị mất phân nửa lưu lượng truy cập. Thì có thể là bạn đã “dính” Google Panda. Việc đó có thể khiến website từ top đầu trang 1 tụt hẳn xuống cuối trang 1 hoặc qua trang 2. Lưu lượng truy cập tự nhiên lúc này vẫn còn nhưng không đáng kể.

Lưu ý: Không nên quá chủ quan nếu website của bạn chưa bị phạt! Vì quá trình Google ghé thăm và thu thập dữ liệu có thể kéo dài vài tháng.

Cách khôi phục website sau khi bị phạt

Thuật toán Panda chủ yếu đánh vào chất lượng nội dung của một trang web. Vì thế nếu lỡ “dính” án phạt Panda thì bạn hãy bình tĩnh từng bước khôi phục website. Bằng cách tập trung vào cải thiện chất lượng nội dung trên trang đó.

Cải thiện chất lượng nội dung

Thuật toán Panda hoạt động liên tục và loại bỏ những trang chứa ít nội dụng hoặc nội dung kém chất lượng. Thường thì Google Panda sẽ xem xét phần lớn các trang trong 1 website để tiến hành đánh giá chất lượng trên toàn bộ trang web. Rồi sau đó mới tiến hành điều chỉnh thứ hạng phù hợp.

Google Panda còn cho điểm thứ hạng của website dựa trên chất lượng các phần nội dung có trong website đó. Chính vì vậy, nâng cao chất lượng nội dung web chính là điều cốt lõi các bạn cần làm.

Để cải thiện chất lượng nội dung bạn nên loại bỏ content kém chất lượng và thin content. Xóa những bài viết chất lượng kém không chỉ hỗ trợ tối ưu web tốt hơn mà còn tạo ra lợi ích cho người dùng.

Hãy đặt mình vào vị trí của người dùng” Từ đó, bạn sẽ biết cách cung cấp những content giá trị & đáp ứng đúng nhu cầu của họ. Nội dung hay sẽ giúp trải nghiệm người dùng tốt hơn. Đồng thời nâng cao khả năng độc giả ghé thăm website của bạn vào những lần tiếp theo.

Thực hiện chiến lược “Giữ và bỏ”

Trước tiên, bạn cần phải lọc ra những phần nội dung kém chất lượng, rồi áp dụng chiến lược “Giữ – Bỏ” sau đây:

“Nếu content cần cải thiện thì bắt tay làm ngay. Nếu content đã đạt chất lượng thì hãy để noindex”.

Với các trang nội dung đã được Google lập chỉ mục, bạn hãy cố gắng duy trì nội dung ở hiệu quả cao nhất. Việc này rất quan trong, nó sẽ giúp trang web của bạn thoát khỏi các thuật toán kiểm tra của Google, điển hình là thuật toán Panda.

Bên cạnh đó, bạn cũng nên đảm bảo rằng Google sẽ chỉ index những nội dung có giá trị nhất của bạn. Sử dụng Noindex thẻ Canonical nhằm ngăn chăn quá trình index nội dung trang web nội bộ trùng lặp hoặc ít trùng lặp.

Nâng cao chất lượng toàn bộ website

Nâng cao chất lượng cho toàn website là một nhiệm vụ không thể bỏ qua. Nó không chỉ dừng lại ở việc nâng cao chất lượng nội dung, mà bạn còn phải cải thiện thêm các yếu tố trải nghiệm người dùng (UX) như giảm các banner quảng cáo, hoặc các form vô nghĩa, gây rối mắt cho độc giả của bạn…

Mục tiêu là xây dựng website của bạn trở thành nơi cung cấp thông tin đáng tin cậy. Thông qua đó, phát triển độ uy tín cho thương hiệu của bạn.

5. Công cụ hỗ trợ tránh bị phạt

Để tránh hình phạt từ Google, trong quá trình viết content SEO, bạn nên sử dụng các công cụ kiểm tra mức độ unique của bài viết. Sau đây là 2 công cụ phổ biến nhất:

Copyscape

Copyscape là công cụ có tính phí, giúp bạn dễ dàng biết được nội dung nào bạn sao chép từ trang khác. Hoặc nội dung nào của bạn bị các trang khác sao chép. Bạn hãy theo dõi cột Risk trong bài viết. Nếu cột này có màu càng đậm có nghĩa là bài viết bị sao chép nhiều nhất. Bạn nên sửa chữa nội dung để tránh bị Google Panda phạt.

Copyscape
Giao diện của Copyscape

Giao diện Copyscape khá đơn giản. Bạn chỉ cần copy và paste Url bài viết bạn cần kiểm tra vào khung và nhấn nút Go. Công cụ Copyscape sẽ bắt đầu đối chiếu và thông báo bài của bạn có trùng lặp với trang nào khác hay không.

Siteliner

Siteliner cũng là một công cụ kiểm tra trùng lặp nội dung. Gồm có phiên bản miễn phí và phiên bản có tính phí. Với chức năng là tìm kiếm nội dung sao chép dựa trên domain gốc của bạn. Nó cho bạn biết phần trăm giống nhau giữa các bài viết. Bạn hãy truy cập ngay “siteliner.com” để trải nghiệm ngay công cụ tuyệt vời này nhé!

Siteliner
Dùng công cụ Siteliner để kiểm tra trùng lặp nội dung

Kết luận

Sau khi đọc xong bài viết này, chắc hẳn bạn đã nắm rõ thuật toán Panda là gì? Và vì sao chúng ta cần phải chú trọng cải thiện chất lượng nội dung để tránh bị phạt bởi Google Panda? Hy vọng những kiến thức trên đã giúp ích cho bạn trong quá trình tiến hành SEO Web. Chúc các bạn thành công và đừng quên theo dõi các chủ đề mà Bazan Solutions chia sẻ trong thời gian tới.

Bazan Solutions tổng hợp