Gần đây, nhiều quản trị viên website đã gặp phải tình trạng trong Google Search Console xuất hiện những URL lạ. Những URL này là liên kết nội bộ của website nhưng lại chứa các từ khóa, tên miền… hoàn toàn không liên quan. Để đơn giản hóa, tình trạng này được gọi là spam index. Vậy cụ thể spam index là gì? Làm thế nào để xác định được website có đang gặp phải tình trạng này hay không? Spam index dẫn đến những hậu quả nào và cách xử lý nó ra sao?

Spam index là một vấn đề phổ biến mà nhiều quản trị viên web phải đối mặt. Việc các trang web bị index một cách không hợp lệ có thể làm giảm uy tín của trang web và ảnh hưởng tiêu cực đến SEO. Dưới đây là một số cách để xử lý tình trạng này trong Google Search Console.

1. Xác Định Các Trang Bị Spam Index

Đầu tiên, bạn cần xác định các trang bị spam index. Đăng nhập vào Google Search Console và kiểm tra báo cáo Index Coverage. Tìm kiếm các trang mà bạn không mong muốn hoặc không cần được index. Đánh dấu lại các trang này để xử lý sau.

hình ảnh website bị spam index
hình ảnh website bị spam index

Spam index là gì?

Spam index là tình trạng Google Bots lập chỉ mục những URL có chứa từ khóa hoặc nội dung hoàn toàn không liên quan tới website của bạn. Đây là chiêu trò của các “chuyên gia SEO bẩn” thường dùng để đẩy từ khóa lên top. Chúng phần lớn được tạo ra bởi các con bots một cách hoàn toàn tự động.

Để biết website của bạn có gặp tình trạng spam index hay không, hãy truy cập Google Search Console => Lập chỉ mục => Trang => click vào nút Xem dữ liệu về các trang đã được lập chỉ mục. Nếu bạn nhìn thấy những URL với những query string lạ như hình bên dưới thì có nghĩa website của bạn đã trở thành một “nạn nhân” của spam index.

 

Ngoài ra, các bạn cũng có thể thử tìm kiếm trên Google với cú pháp site:yourdomain.com. Trong đó, yourdomain.com là tên miền của bạn. Nếu trang tìm kiếm xuất hiện nhiều kết quả mà bạn không mong muốn (khi truy cập thường xuất hiện lỗi 404) thì website của bạn cũng đã bị spam index

Tác hại của spam index

Việc spam index có thể dẫn đến một số hậu quả như:

  1. Lãng phí tài nguyên của Google Bots. Thay vì index những trang mà bạn muốn, giờ đây Google lại mất thời gian để index những trang mà bạn không cần.
  2. Trong trường hợp website của bạn bị spam index thông qua khung tìm kiếm, thậm chí hậu quả còn tệ hại hơn khi nội dung spam xuất hiện luôn trên website của bạn. Google có thể hiểu nhầm website của bạn có chứa nội dung độc hại, từ đó ảnh hưởng xấu đến SEO.
  3. Khách hàng sẽ đánh giá thấp website của bạn vì cho rằng chúng không an toàn => giảm tỉ lệ click vào kết quả tìm kiếm và tỉ lệ mua hàng.

Giảm tỉ lệ click vào kết quả tìm kiếm vì các kết quả hàng đầu đã bị các trang spam chiếm mất.

Khắc phục tình trạng spam index

Trước tiên, hãy xác định xem website của bạn có bị hack hãy nhiễm mã độc không?

  • Nếu bạn bị spam index dạng query string (có dấu ? trong URL) hoặc khi truy cập link spam thì bị báo lỗi 404 thì nhiều khả năng website của bạn không bị hack hay nhiễm mã độc.
  • Nếu bạn bị spam index dạng subdomain (abcxyz.yourdomain.com) thì nhiều khả năng website của bạn không bị hack hay nhiễm mã độc. Vấn đề xuất phát từ DNS của tên miền.
  • Nếu bạn bị spam index không có query string và URL spam có thể truy cập bình thường (không bị báo lỗi 404) thì nhiều khả năng website đã bị hack hoặc nhiễm mã độc. Bạn sẽ cần phải xử lý mã độc và các lỗ hổng bảo mật trên website trước khi xử lý spam trên Google.

 

Quá trình 1: 
Đầu tiên, các bạn cần phải truy cập Google Search Console => Xóa URL => Các yêu cầu xóa tạm thời => click vào nút Yêu cầu mới. Một khung pop-up sẽ hiện lên => điền URL spam vào khung => chọn Chỉ xóa URL này => click vào nút Tiếp.

Click vào nút Gửi yêu cầu để xác nhận.

 

Làm tương tự với những URL khác cho đến hết. Sau khi làm xong, các bạn sẽ cần phải chờ một thời gian để Google thực hiện yêu cầu. Những URL đã ẩn khỏi kết quả tìm kiếm sẽ có trạng thái Đã xóa tạm thời.

 

Trên mạng có một số tiện ích mở rộng (extension) của trình duyệt Google Chrome có thể hỗ trợ xóa index hàng loạt, chẳng hạn như Google Search Console – Bulk URL Removal. Tuy nhiên, chúng không phải là sản phẩm chính chủ của Google nên vẫn tiềm ẩn nhiều nguy cơ. Do đó, chúng tôi khuyên bạn nên cân nhắc kỹ trước khi cài đặt và sử dụng.

Quá trình 2: 
Những URL mà bạn vừa yêu cầu xóa khỏi Google sẽ chỉ bị tạm ẩn trong vòng 6 tháng. Nếu muốn ngăn chúng hiển thị trở lại, bạn phải ngăn Google lập chỉ mục chúng một lần nữa bằng cách:

Đối với spam index dạng query string

Thêm dòng sau đây vào trong file robots.txt: Disallow: *?*

Điều này sẽ giúp ngăn chặn Google index các URL có query string (dấu chấm hỏi). Tuy nhiên, nếu site của bạn đang cài những plugin như LiteSpeed Cache thì nó sẽ chặn Google thu thập các file CSS và JS do LiteSpeed Cache tạo ra, dẫn đến lỗi vỡ giao diện (không thân thiện với thiết bị di động). Do đó, hãy thay thế dòng bên trên bằng các dòng lệnh cụ thể (tùy theo từng trường hợp). Ví dụ:

  • Nếu bạn muốn chặn index các trang kết quả tìm kiếm mặc định của WordPress, hãy sử dụng: Disallow: /?s=*
  • Nếu bạn muốn chặn index các link có chứa ?demo=, hãy sử dụng: Disallow: *?demo=*
  • Nếu bạn muốn chặn index các link có chứa ?main_page=, hãy sử dụng: Disallow: *?main_page=*

Làm tương tự cho những trường hợp khác.

Đối với spam index dạng subdomain

Nếu website của bạn bị dính spam index dạng subdomain. Hãy kiểm tra lại các record DNS của tên miền xem có record nào đặt tên là * hay không. Nếu có thì hãy xóa nó đi. Record này là một “lỗ hổng” để hacker lợi dụng nhằm spam index dạng subdomain. Nếu không có record này thì các subdomain spam kia sẽ không thể truy cập được => Google cũng sẽ không index chúng.

 

Lưu ý: trường hợp này website hoàn toàn không bị hack hay bị dính mã độc. Cũng không có subdomain thực nào được tạo trên trang quản lý DNS domain của bạn. Hacker đơn giản là lợi dụng record * (đại diện cho tất cả subdomain) để cho phép tạo subdomain ngẫu nhiên (ảo) và dùng thủ thuật để ép Google index nó lên kết quả tìm kiếm với nội dung mà chúng mong muốn.

Tiến hành đổi mật khẩu trang quản trị DNS tên miền và bật xác thực 2 bước nếu bạn nghi ngờ thông tin đăng nhập đã bị lộ.

Ngoài ra, chúng tôi cũng khuyến khích bạn nên chuyển qua sử dụng CloudFlare DNS để có khả năng bảo mật tốt hơn, tốc độ phản hồi nhanh hơn và ổn định hơn. Tham khảo bài viết: Tại sao bạn nên sử dụng CloudFlare DNS cho website?

Quá trình 3:
Ngoài ra, các bạn cũng nên redirect 301 các URL spam về trang chủ hoặc trang gốc của nó bằng cách sử dụng các plugin như Yoast SEO Premium hay Redirection.

 

Ngăn spam tìm kiếm trong WordPress

Nếu website của bạn bị spam index thông qua khung tìm kiếm của WordPress, ngoài các công việc ở trên, các bạn cần phải:

  • Vô hiệu hóa tính năng tìm kiếm mặc định của WordPress nếu nó không quá cần thiết. Các bạn có thể sử dụng plugin Disable Search để làm điều này.
  • Thay thế tính năng tìm kiếm mặc định của WordPress bằng dịch vụ của bên thứ ba, chẳng hạn như Google Custom Search. Những dịch vụ này thường cho phép bạn thay đổi URL của trang kết quả tìm kiếm, từ đó chống được tình trạng spam bằng bots. Nó giống như việc bạn đổi link đăng nhập WordPress để chống brute force attack vậy. Tham khảo thêm: Tích hợp công cụ tìm kiếm Google cho theme Paradise.
  • Cài đặt plugin chống spam cho website, chẳng hạn như Akismet (miễn phí), AntiSpam Bee (miễn phí) hoặc CleanTalk (trả phí).
  • Truy cập Yoast SEO => General => Crawl settings => Search cleanup settings và bật tất cả các tính năng Filter search termsFilter searches with emojis and other special charactersFilter searches with common spam patterns lên, nếu bạn đang dùng Yoast SEO Premium (kể từ phiên bản 18.8 trở đi) trên website của mình.

 

Cuối cùng là chờ Google cập nhật dữ liệu thôi. Thật đơn giản phải không nào? Chúc các bạn thành công!

 

 

 

 

 

X
Chat với MMO SOFTWARE
Xin chào, Bạn có nhu cầu mua tool, vui lòng nhập nội dung vào đây, chúng tôi ...
Hỏi chúng tôi

Hiện tại trang website đã hoàn thiện tính năng thanh toán tool qua tài khoản ngân hàng và ví MOMO, quý khách hàng cần mua tool có thể thanh toán trực tiếp qua website. TRÂN TRỌNG CẢM ƠN!

X