Cách xóa URL bị index spam và chặn spam index hiệu quả trên WordPress 2025

Dấu hiệu website bị spam index

Dạng spam index này sẽ khiến cho Google Console của bạn xuất hiện hàng chục nghìn, tới hàng trăm nghìn trang có từ khóa lạ được index nếu bạn chưa thực hiện chặn spam index trong file robots.txt hoặc sẽ ở trạng thái được thu thập dữ liệu nhưng chưa lập chỉ mục, do mình đã chặn spam index trong file robots.txt. Như hình ảnh dưới đây, website của mình đã bị spam tới hơn 100k link, mỗi lần truy cập vào GSC trông rất khó chịu.

Hàng trăm nghìn link spam index xuất hiện trong GSC
Hàng trăm nghìn link spam index xuất hiện trong GSC

Khi kiểm tra trong Google Search Console, và bấm vào xem các trang bị ảnh hưởng bởi các nguyên nhân trên bạn sẽ thấy các URL lạ như:

Đây là dấu hiệu spam index – các bot tự động tạo query string như ?doc, ?tmp, ?vivo, khiến Google hiểu nhầm và lập chỉ mục hàng loạt URL rác. Và những URL này hoàn toàn không tồn tại trên website của bạn.

spam index mac du da chan robots
Rất nhiều url không liên quan và không tồn tại trên website được Google thu thập dữ liệu

Mục đích, nguyên nhân và tác hại của URL spam

Spam Injection là gì và tại sao khiến website bị index rác?

Spam Injection (hoặc Content Injection Attack) là hình thức tấn công phổ biến nhắm vào các website WordPress có lỗ hổng bảo mật.

Bot hoặc hacker sẽ chèn chuỗi mã / truy vấn lạ vào cấu trúc URL, khiến website sinh ra hàng trăm URL ảo như:

Mục đích của kẻ xấu khi sử dụng Spam Injection

Mình luôn thắc mắc tại sao chúng lại Spam website của mình với những từ khóa chẳng liên quan gì đến chủ đề của website, và 100% website thuộc các ngành nghề khác nhau của mình đều gặp phải tình trạng này, nếu bạn cũng đang thắc mắc, chúng ta cùng tìm hiểu mục đích của chúng nhé:

1. Lợi dụng “quyền crawl” của Google cho mục đích spam SEO

Bot spam hiểu rằng Googlebot tin tưởng website của bạn (vì đã tồn tại, có backlink, có index hợp lệ).
Do đó, chúng chèn thêm query string hoặc đường dẫn ảo để Google index nhờ uy tín của bạn, rồi từ đó:

  • Tạo backlink ẩn trỏ về các website spam (casino, thuốc, người lớn, tool hack…).
  • Lợi dụng độ tin cậy (Domain Trust) của bạn để “ký sinh” traffic hoặc xếp hạng tạm thời.
  • Nếu may mắn, Google có thể hiển thị một số trang “rác” đó trong SERP → giúp họ kéo traffic ngắn hạn hoặc gắn link affiliate lậu.

👉 Dễ hiểu hơn: họ “mượn danh” website của bạn để đẩy website khác lên top.

2. Tấn công dò lỗ hổng (injection & scan bot)

Nhiều bot không hẳn nhằm SEO mà là bot dò lỗi (scan bot).
Chúng gửi hàng nghìn truy vấn dạng:

…để xem website có phản hồi không.

Nếu website trả về 200 OK, bot sẽ:

  • Thử chèn code hoặc upload file độc hại (malware, shell).
  • Thu thập thông tin plugin/theme để khai thác tiếp.
  • Tự động spam nội dung hoặc chèn link vào database (nếu bảo mật yếu).

Đây là dạng Spam Injection Attack – giai đoạn đầu của tấn công hack hoặc chèn mã ẩn.

3. Gây nhiễu hoặc hạ uy tín SEO đối thủ (Negative SEO)

Một số bên làm SEO xấu (black-hat) cố tình:

  • Spam hàng nghìn URL rác vào website đối thủ để làm loãng chỉ mục.
  • Khi Google crawl, sẽ thấy 80–90% URL “rác” → đánh giá website “chất lượng thấp”.
  • Kết quả: website bị giảm thứ hạng hoặc bị đánh dấu “Spam content”.

Cách tấn công này thường được gọi là Negative SEO bằng spam index.

4. Kiếm tiền từ redirect hoặc click ẩn

Sau khi URL spam được index, chúng sẽ:

  • Redirect người dùng sang trang lừa đảo / tải ứng dụng / quảng cáo.
  • Hoặc nhúng iframe, quảng cáo ẩn trong nội dung để lấy lượt click.
  • Mỗi lượt truy cập → tạo doanh thu nhỏ cho kẻ tấn công qua mạng quảng cáo đen (black ad network).

Tóm lại: dù bạn không bán “game”, “vivo”, hay “download”,
nhưng bot tạo các từ khóa đó vì nó là nhóm từ khóa có lượng tìm kiếm cao, dễ khiến Google index nhanh.

Tác hại của Spam Injection đối với kết quả SEO web

  • Làm loãng chỉ mục (index) và giảm độ uy tín của website.
  • Xuất hiện nhiều trang mỏng nội dung (thin content) → giảm điểm SEO.
  • Chiếm tài nguyên crawl của Googlebot, khiến trang thật bị index chậm.
  • Làm loãng chỉ mục, giảm uy tín SEO.
  • Google dễ hiểu nhầm website bị hack hoặc spam.
  • Ảnh hưởng đến CTR, uy tín thương hiệu và hiệu suất SEO tổng thể.

Các bước xóa URL bị index spam và chặn spam index hiệu quả

Xóa URL spam khỏi Google Search Console

Bước 1: Đăng nhập vào Google Search Console → chọn website.
Bước 2: Chọn vào nút Xóa URL (Removals).

xoa duong link khong mong muon trong google search console
Xóa URL trên Google Search Console

Bước 3: Chọn “Yêu cầu xóa tạm thời (Temporary Removal)” -> Yêu cầu mới

Chọn Yêu cầu mới để gửi link cần xóa
Chọn Yêu cầu mới để gửi link spam cần xóa

Tại đây một khung pop-up sẽ hiện lên. Lúc này bạn hãy nhập các URL bị Spam Injection vào.

Xóa tạm thời các url bị spam index
Xóa tạm thời các url bị spam index

Lưu ý: Có thể lựa chọn giữa Xóa chỉ URL cụ thể (Exact URL Removal) và Xóa tiền tố URL (Prefix Removal)

1. “Chỉ xóa URL này” – Remove this URL only

Công dụng: Ẩn chính xác một URL cụ thể khỏi kết quả tìm kiếm trong vòng 6 tháng.

Khi nên dùng:

  • Khi chỉ có một trang đơn lẻ bị index sai (ví dụ: test, bản nháp, landing lỗi).
  • Khi bạn muốn ẩn tạm thời một URL trong khi vẫn xử lý nội dung hoặc tối ưu lại.
  • Khi URL đó không có biến thể khác (không có query string phía sau).

Ví dụ:
Giả sử bạn có trang lỗi:

→ Bạn chọn “Chỉ xóa URL này”, nhập nguyên đường link trên → Tiếp → Sau đó sẽ hiển thị pop-up xác nhận lại thông tin. Bạn bấm Gửi yêu cầu để hoàn thành.

GSC xác nhận lại lần nữa url bạn vừa gửi yêu cầu xóa
GSC xác nhận lại lần nữa url bạn vừa gửi

Sau vài giờ, trang này sẽ biến mất khỏi Google, nhưng vẫn tồn tại trên website.
Nếu bạn cập nhật nội dung và muốn Google index lại, chỉ cần chọn Yêu cầu lập chỉ mục (Request indexing).

Thích hợp cho các URL riêng lẻ, không có dạng truy vấn hoặc chuỗi con tương tự.

2. “Xóa tất cả URL có tiền tố này” – Remove all URLs with this prefix

Công dụng: Ẩn toàn bộ các URL bắt đầu bằng cùng một chuỗi (prefix) khỏi kết quả tìm kiếm.
Rất hữu ích khi bạn bị index hàng loạt URL rác có cùng cấu trúc.

Khi nên dùng:

  • Khi website bị spam index dạng query string giống nhau, ví dụ ?doc, ?tmp, ?game.
  • Khi bạn cần xóa hàng loạt URL cùng tiền tố mà không thể nhập từng cái thủ công.
  • Khi bạn muốn ẩn toàn bộ thư mục con hoặc nhóm URL (ví dụ /demo/, /backup/, /test/…).

Ví dụ:
Nếu bạn thấy hàng loạt URL spam như:

→ Chọn “Xóa tất cả URL có tiền tố này”

Chọn Xóa tất cả URL có tiền tố này để xóa hàng loạt link có cùng cấu trúc
Chọn Xóa tất cả URL spam có tiền tố này để xóa hàng loạt link có cùng cấu trúc

→ Nhấn Tiếp → Gửi yêu cầu

GSC xác nhận xóa toàn bộ đường link có chứa tiền tố trên
GSC sẽ hỏi lại bạn để xác nhận xóa toàn bộ đường link có chứa tiền tố trên
Kết quả khi gửi yêu cầu xóa url hàng loạt trên Google Search Console
Kết quả khi gửi yêu cầu xóa url hàng loạt trên Google Search Console

Khi đó, Google sẽ ẩn toàn bộ URL bắt đầu bằng chuỗi ?doc khỏi chỉ mục.

Không cần thêm dấu * ở cuối. GSC tự hiểu tất cả URL có cùng tiền tố này đều cần xóa.
Thích hợp để xử lý nhanh spam index hàng loạt hoặc thư mục rác.

Lưu ý quan trọng:

  • Google chỉ ẩn tạm thời các URL đó khỏi kết quả tìm kiếm trong 6 tháng.
    Nếu bạn không chặn tận gốc (bằng robots.txt hoặc noindex code), chúng có thể bị index lại sau đó.
  • Bạn có thể lặp lại thao tác với các chuỗi khác nhau, ví dụ: https://tenmiencuaban.com/?tmp https://tenmiencuaban.com/?game https://tenmiencuaban.com/?down
  • Nếu có rất nhiều nhóm URL, bạn có thể dùng Chrome Extension “GSC Bulk Removal” để nhập hàng loạt tiền tố URL qua file CSV — cực kỳ tiết kiệm thời gian.

Mẹo tối ưu:

  • Sau khi xóa xong, hãy quay lại mục “Kiểm tra URL” (Inspect URL) → nhập 1 URL spam bất kỳ → nhấn Yêu cầu lập chỉ mục lại để đảm bảo Google xác nhận là “Không nằm trong chỉ mục”.
  • Kết hợp song song với robots.txtcode noindex, đảm bảo 100% các URL rác không quay lại SERP.

Việc cần làm để chặn spam index, Spam Injection hiệu quả

1. Cấu hình robots.txt để chặn URL rác

Mở file robots.txt (thường nằm tại /public_html/robots.txt) và thêm:

Dấu *? giúp chặn mọi URL có dấu “?” và chuỗi sau đó.
robots.txt chỉ ngăn crawl, không xoá URL đã index.

Nếu bạn sử dụng Rank Math SEO truy cập Cài đặt chung -> Edit Robots.txt

Cập nhật robots.txt qua Rank Math SEO
Cập nhật robots.txt qua Rank Math SEO

2. Thêm code noindex & chặn truy cập trong WordPress

Code tự động thêm thẻ noindex và ngăn truy cập trực tiếp vào các URL độc hại

Bên cạnh robots.txt, bạn có thể chặn triệt để bằng đoạn code PHP trong file functions.php của theme (hoặc child theme):

Tác dụng kép

  • Tự động thêm thẻ “noindex, nofollow” vào các URL chứa chuỗi rác
  • Ngăn bot truy cập vào các URL đó (trả về lỗi 403 Forbidden)
  • Không ảnh hưởng đến các trang thật (ví dụ /gioi-thieu/, /lien-he/…)

Nếu bạn đang dùng Rank Math SEO

Nếu website đã cài plugin Rank Math, bạn có thể thay phần code noindex ở trên bằng đoạn hook riêng của Rank Math (đảm bảo không bị trùng thẻ <meta>):

Nếu bạn muốn chặn thêm các query khác trong tương lai, chỉ cần thêm vào mảng:

Cách này cho phép Rank Math tự động sinh đúng thẻ <meta name="robots" content="noindex, nofollow"> mà không cần can thiệp vào thẻ <head> thủ công.
Tất cả vẫn được xử lý bởi hệ thống meta của Rank Math, an toàn và chuẩn SEO hơn.

Kết hợp các bước để tối ưu triệt để

  1. Xóa URL rác tạm thời trong Search Console.
  2. Chặn crawl bằng robots.txt.
  3. Tự động noindex + chặn truy cập bằng code hoặc Rank Math.
  4. Cập nhật lại sitemap và gửi lại cho Google.

Khi áp dụng đủ 4 bước, website sẽ “sạch index”, bảo toàn điểm SEO và tránh tái nhiễm spam.

Lời khuyên thêm

  • Sử dụng plugin bảo mật (Wordfence / BBQ Firewall) để ngăn bot độc hại.
  • Định kỳ kiểm tra tab Trang đã lập chỉ mục trong Search Console.

Nếu bạn đang gặp tình trạng website bị index hàng nghìn URL rác, hãy để lại bình luận bên dưới hoặc liên hệ đội ngũ kỹ thuật của thietkewebxin.com để được hỗ trợ xử lý tận gốc

Đánh giá post

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Săn deal Shopee