Cách xóa nhanh các trang index Google và giảm hình phạt Google Panda

Google-Panda

Như bạn có thể đã biết, tôi đã không bắt đầu voquocan.com từ đầu. Thay vào đó, tôi đã sửa lại điện thoại thông minh yêu thích và blog công nghệ chung của mình và vừa có một miền mới cho nó. Vì tôi không đăng nội dung điện thoại thông minh hoặc tin tức công nghệ nói chung, v.v. nữa, nên Google đã sớm gặp khó khăn trong việc xác định nội dung thực sự của website.

Sau đó tôi nhận ra rằng do điều này, và vì thực tế là website cũ từng chứa các bài đăng mà tôi không cho là chất lượng thấp, nhưng chắc chắn là chúng ngắn và thiếu chiều sâu. Tôi không cần những bài đăng đó nữa (vì hầu hết đều nhạy cảm về thời gian), nhưng tôi cũng không muốn xóa chúng hoàn toàn. Mặt khác, Quyền tác giả đã không thực hiện được điều kỳ diệu của nó trên SERP cho website này và nó đang xếp hạng khủng khiếp. Vì vậy, tôi quyết định không index khoảng 1.100 bài đăng cũ. Nó không dễ dàng và WordPress không có cơ chế tích hợp sẵn hoặc một plugin có thể giúp tôi thực hiện công việc dễ dàng hơn. Vì vậy, tôi đã tự tìm ra một lối thoát.

Phần 1: Các trang không index

Nếu bạn đang tìm cách xóa nhiều trang trên website của mình khỏi Google hoặc bất kỳ chỉ mục nào của công cụ tìm kiếm khác, trước tiên bạn cần đảm bảo rằng bạn đang ra hiệu cho họ không index chúng. Bạn có thể thêm thẻ meta no-index vào phần <head> của các trang đó, chặn chúng khỏi robots.txt, sửa đổi tiêu đề HTTP để thêm thẻ no-index, v.v.

Tôi thích thêm thẻ không có chỉ mục vào các trang trong phần <head> vì nó:

  1. rất dễ thực hiện.
  2. duy trì Xếp hạng Trang của bạn (vì Google vẫn có thể thu thập dữ liệu, họ chỉ không index nó).

Và bạn có thể chọn chính xác trang nào không index và trang nào để nguyên. Nhưng khi bạn có hàng nghìn trang không index cùng một lúc, đó là lúc mọi thứ trở nên phức tạp một chút.

Đây chính xác là cách tôi quản lý để thêm thẻ không có chỉ mục vào hơn 1.100 bài đăng trên WordPress:

1. Cài đặt Plugin ‘WP Robots Meta’ của Yoast

Bạn có thể tìm thấy nó ở đây . Nó đã không được cập nhật trong nhiều thời gian, bởi vì nó đã được thành công bởi WordPress SEO by Yoast. Nhưng dù sao, nó vẫn hoạt động hoàn toàn tốt và lý tưởng cho công việc của chúng tôi.

2. Mở phpMyAdmin

Nếu máy chủ web của bạn sử dụng cPanel, thật tuyệt vời! Nếu không, tôi không chắc bạn sẽ truy cập phpMyAdmin bằng cách nào. Khi bạn ở trong bảng điều khiển cPanel, bạn thường có thể thấy nó nằm bên trong phần ‘cơ sở dữ liệu’.

phpMyAdmin trong cPanel

3. Chọn Cơ sở dữ liệu WordPress của bạn

Hãy nhớ, chọn cơ sở dữ liệu của website bạn đang xử lý. Đừng tiếp tục nếu bạn không chắc cơ sở dữ liệu nào thuộc về website cụ thể đó (sẽ không thành vấn đề nếu bạn chỉ có một cơ sở dữ liệu MySQL duy nhất trên máy chủ của mình).

Choose-mysql-database

4. Nhấp vào ‘wp_posts’

Đó là phần lưu trữ tất cả dữ liệu về bài đăng của bạn,  bao gồm cả thông tin meta rô bốt khi bạn đã cài đặt plugin đó .

5. Chọn Chỉ Hiển thị các Bài đăng ‘Đúng’

Phần ‘wp_posts’ không chỉ lưu trữ thông tin về các bài đăng hoặc bản nháp đã xuất bản của bạn hoặc những thứ khác, nó còn lưu trữ từng file đính kèm được tải lên riêng lẻ, các mục menu và nhiều thứ khác. Vì vậy, nếu bạn có 1.000 bài đăng thực tế, bạn có thể có khoảng 5.000 mục nhập riêng lẻ trong ‘wp_posts’. Để chỉ xem các  bài viết đúng , bạn có thể làm như sau:

  1. Nhấp vào ‘tìm kiếm’ trên thanh trên cùng. Nó trông như thế này:
    search-phpMyAdmin
  2. cuộn xuống cho đến khi bạn thấy ‘post_type’. Thay đổi dấu bên cạnh nó thành ‘bằng’ hoặc ‘=’. Nhập ‘bài đăng’ vào trường trống liền kề.
    loại thưĐiều này làm được là nó chỉ trả về các mục nhập có chính xác ‘post’ làm giá trị của ‘post_type’. Vì vậy, nó chỉ trả về  các bài đăng WordPress thực tế .

6. Bắt đầu công việc của bạn

Bây giờ, bạn sẽ phải thực sự xem qua các tiêu đề bài đăng và gán thẻ ‘no-index, follow’ cho các bài đăng mà bạn chọn.

  1. Có nhiều cột trong ‘wordpress_posts’, vì vậy bạn cần di chuyển / sắp xếp lại thứ tự (đừng lo, đó là kéo và thả) cột ‘robotsmeta’ và đặt nó bên cạnh ‘post_title’.
    đặt hàng lại
  2. Bây giờ, hãy chọn bao nhiêu hàng bạn muốn xem trên mỗi trang. Tôi thường chọn 100. Vì vậy, có nghĩa là, tôi có thể xem qua 100 mục nhập mà không cần nhấp vào ‘trang tiếp theo’ ở dưới cùng.
  3. Vì bạn sẽ không theo dõi các bài viết một cách có chọn lọc, bạn phải xem qua từng bài viết và dán nội dung sau vào các trường NULL của ‘robotsmeta’ (một hộp văn bản sẽ xuất hiện ngay khi bạn nhấp vào một hộp như vậy có NULL trên đó ):  noindex, follow
    Điều về cơ bản có nghĩa là các công cụ tìm kiếm sẽ vẫn thu thập dữ liệu chúng, nhưng không chỉ mục chúng. Các liên kết trên các trang đó vẫn được theo dõi, vì vậy chúng vẫn vượt qua Xếp hạng Trang đến các trang bên trong và bên ngoài khác mặc dù không được index.
    Bạn có thể không phải lúc nào cũng thích điều này. Giả sử, có 25 bài đăng trên blog của bạn chứa nhiều liên kết gửi đi spam. Bạn có thể điều chỉnh giá trị một chút và nhập  noindex, nofollow trong trường hợp các bài đăng đó.
    noindexed
  4. Điều này có thể tốn thời gian. Tôi mất khoảng 1,5 giờ để xem qua hơn 1.300 bài đăng và bài đăng riêng lẻ không có chỉ mục. Nhưng cuối cùng, nỗ lực đó rất đáng giá vì tôi vẫn có thể không index cụ thể các bài đăng mà tôi cho rằng đang ảnh hưởng đến thứ hạng website của tôi. Tôi không cần phải index mọi thứ, tôi cũng không phải để mọi thứ như chúng vốn có. Nếu bạn không thể phân bổ 90 phút thời gian của mình cho nhiệm vụ, bạn có thể thuê dịch vụ viết bài chuẩn SEO tại Hmgsearch và yêu cầu họ thực hiện công việc cho bạn dựa trên hướng dẫn của bạn.

Tài nguyên hữu ích:

7. Xác nhận

Sau khi hoàn tất việc thêm ‘noindex, follow’ vào các bài đăng, bạn nên xác minh xem nỗ lực của mình có thành công hay không. Để làm như vậy, bạn có thể tải xuống và sử dụng phiên bản miễn phí của Screaming Frog SEO Spider .

Chỉ cần nhập URL website của bạn vào Screaming Frog và đợi một lúc để thu thập dữ liệu website của bạn. Sau đó, chỉ cần lọc kết quả và chọn chỉ hiển thị kết quả HTML (website). Di chuyển (kéo và thả) cột ‘Dữ liệu Meta 1’ và đặt nó bên cạnh tiêu đề bài đăng hoặc URL của bạn. Sau đó, xác minh với 50 bài đăng hoặc lâu hơn xem chúng có ‘noindex, follow’ hay không. Nếu họ làm vậy, điều đó có nghĩa là bạn đã thành công với công việc không index của mình.

xác minh bằng hét

Phần 2: Thu thập thông tin các trang

Bây giờ bạn đã thực hiện chiến lược không index của mình, bạn sẽ muốn Google, Bing và các công cụ tìm kiếm khác thu thập dữ liệu lại tất cả các trang đó. Đó không phải là một công việc dễ dàng, đặc biệt nếu website của bạn không quá phổ biến và hàng nghìn trang trong số đó đã được thu thập thông tin hàng ngày.

Bao gồm chúng trong (các) sitemap của bạn

Nhiều người nghĩ rằng bạn chỉ nên đưa các trang mà bạn muốn Google index vào sitemap của mình. Chà, nó hoàn toàn mơ hồ. Nếu bạn muốn Google thu thập lại dữ liệu một thứ gì đó và nó được tham chiếu đến từ hư không, rất có thể – googlebot sẽ không bao giờ tìm và thu thập lại dữ liệu đó nữa.

Đây là lý do tại sao, dù có index hay không, bạn nên tham chiếu đến tất cả các trang nội bộ từ sitemap của mình. Tốt nhất, bạn nên tạo một sitemap trung tâm và liệt kê nhiều sitemap chứa các tham chiếu đến các bài viết, danh mục, v.v. của bạn theo cách phân cấp.

Xóa Bit ‘Sửa đổi Cuối cùng’ khỏi (các) sitemap của bạn

Tôi chưa bao giờ thực sự nghĩ rằng Google coi trọng ‘lần sửa đổi cuối cùng’ nhiều như tôi đã thấy. Tôi không index những bài đăng đó vào ngày 28 tháng 9, khoảng 2 tháng trước.

Tôi chỉ đợi Google thu thập dữ liệu lại chúng trong một tháng. Trong thời gian một tháng, Google chỉ xóa khoảng 100 bài đăng trong tổng số hơn 1.100 bài đăng khỏi chỉ mục của mình. Tốc độ thực sự chậm. Sau đó, một ý tưởng xuất hiện trong đầu tôi và tôi đã xóa tất cả các trường hợp ‘sửa đổi lần cuối’ khỏi sitemap của mình. Điều này thật dễ dàng đối với tôi vì tôi đã sử dụng plugin WordPress sitemap XML của Google. Vì vậy, bỏ chọn một tùy chọn duy nhất, tôi đã có thể xóa tất cả các trường hợp ‘sửa đổi lần cuối’ – ngày và giờ. Tôi đã làm điều này vào đầu tháng mười một.

Sau đó, đây là những gì đã xảy ra trong tháng qua:

sitemap-index-status

Tuyệt vời, phải không?

Buộc Google thu thập dữ liệu lại các trang trong website của bạn

Trụ sở để Công cụ Googles search console Tìm nạp như Googlebot. Nhập URL của sitemap chính của bạn và nhấp vào ‘gửi để index’. Bạn sẽ thấy hai tùy chọn, một để gửi trang cá nhân đó để index và một tùy chọn khác để gửi trang đó  và tất cả các trang được liên kết để index. Chọn tùy chọn thứ hai.

Hãy nhớ rằng, bạn chỉ nhận được 10 ‘URL và các trang được liên kết gửi’ mỗi tháng, vì vậy hãy sử dụng chúng một cách khôn ngoan. Vì (các) sitemap của bạn không có thông tin ‘được sửa đổi lần cuối’ và bạn đang yêu cầu Google thu thập lại thông tin tất cả các trang được liên kết (về cơ bản là mọi thứ được bao gồm trong các sitemap được liên kết với nhau của bạn), Google sẽ thu thập thông tin lại và cập nhật các trang trong đó mục lục.

Phần kết luận

Vì vậy, đó là một cách khá hay để xóa hàng tấn trang trên website của bạn khỏi chỉ mục của Google trong một khoảng thời gian ngắn. 🙂

Tôi có thể hoàn thành toàn bộ quy trình trong 2 giờ cho 1.000 bài đăng, vì vậy nó cũng tiết kiệm thời gian. Vì vậy, nếu bạn chắc chắn rằng bạn cần không index nhất định hoặc một nghìn trang trên website của mình để dỡ bỏ hình phạt Google Panda hoặc bất kỳ hình phạt thuật toán nào có thể xảy ra khác nhằm vào chất lượng, thì quy trình này sẽ thực sự hữu ích cho bạn.

Hiện tại, việc làm mới dữ liệu Panda của Google diễn ra khoảng một lần mỗi tháng, do đó, việc thực hiện đúng quy trình này sẽ được dỡ bỏ hình phạt của bạn trong vòng 2-3 tháng.

Bạn đề xuất những cách nào khác để xóa các trang của website một cách nhanh chóng khỏi chỉ mục của Big G? 🙂

1 Comment

  1. CBD for anxiety
    February 11, 2021

    Thanks for finally writing about > Cách
    xóa nhanh các trang khỏi chỉ mục của Google để giảm hình phạt < Loved it!

    Here is my blog CBD for anxiety

Comments are closed.