Sự Thật Đằng Sau Lỗi 404
Trong một buổi podcast của Google Office Hours, Gary Illyes từ Google đã trả lời một câu hỏi về việc sụt hạng mà có vẻ liên quan đến lỗi trang 404 Page Not Found.
Lỗi 404 Giả Mạo Từ Bên Ngoài
Có rất nhiều lý do cho việc 404 errors được tạo ra bởi các bot. Một trong những lý do cho các phản ứng lỗi này có thể là chúng xuất phát từ các máy quét tự động đang tìm kiếm các tệp hoặc thư mục phổ biến cho các plugin hoặc themes dễ bị tấn công. Kiểm tra địa chỉ IP và user agent của bot gây ra các phản ứng lỗi máy chủ 404 cũng có thể cho biết nếu những phản ứng 404 đó đến từ các bot quét tự động. Nếu địa chỉ IP cho thấy nó xuất phát từ một máy chủ web, hoặc một địa chỉ IP Nga hoặc Trung Quốc thì có thể đó là hacker. Nếu user agent là một phiên bản lỗi cũ của Chrome hoặc Firefox thì có thể đó là bot của hacker. Đó chỉ là một trong nhiều lý do.
Google Đáp Lời
Người đặt câu hỏi liên kết việc sụt hạng với các phản ứng máy chủ 404 Page Not Found.
Đây là câu hỏi đã được đặt ra: "Có URL 404 giả mạo đang đến từ nguồn bên ngoài trang web của tôi, có thể liên quan đến việc sụt hạng không? Tôi có thể làm gì để sửa chữa nó?"
Gary Illyes từ Google đã trả lời: "Các 404 giả mạo mà Googlebot có thể đã quét không thể được hợp lý gán cho việc sụt hạng. Bình thường khi có bất kỳ số lượng 404 nào trên một trang web và bạn không cần phải sửa chúng, tuy nhiên, nếu bạn thấy trong phần mềm phân tích của mình rằng một số lượng lớn người dùng thực sự cũng đang truy cập thông qua những URL 404 đó, tôi cá nhân sẽ cố gắng chuyển hướng họ bằng cách nào đó, ví dụ như hiển thị cho họ một nội dung liên quan thay vì.
Sụt Hạng và 404 Page Not Found
Gary nói rằng 404 là điều bình thường và không gây ra sự sụt hạng trong việc tìm kiếm. Đúng là lỗi 404 là một vấn đề phổ biến. Thông thường điều đó là ổn và hầu hết thời gian không cần phải sửa gì cả.
404s Được Tạo Ra Bởi Người Dùng Thực
Có những trường hợp khác nơi 404 được tạo ra bởi người thực sự đang theo đuổi một liên kết từ đâu đó và nhận được một phản ứng Page Not Found. Điều này dễ dàng chẩn đoán bằng cách kiểm tra xem URL mà khách truy cập trang web đang cố gắng truy cập có gần giống với một URL thực sự. Đó là một biểu hiện cho thấy ai đó đã viết sai một URL và cách để sửa chữa điều đó là tạo một chuyển hướng từ URL viết sai đến URL chính xác.
Về Việc Sụt Hạng
Một điều mà Gary không đề cập nhưng đáng giá để nói đến là có thể có một khả năng nhỏ rằng một bot đã tìm thấy một lỗ hổng và các lỗi 404 được tạo ra bởi một máy quét đang quét lỗ hổng trước khi cuối cùng tìm thấy một lỗ hổng.
Một cách để kiểm tra điều đó là sử dụng phpMyAdmin, một ứng dụng máy chủ, để xem các bảng cơ sở dữ liệu của bạn trong phần cho người dùng và xem xem có một người dùng không được nhận ra hay không.
Một cách khác, nếu trang web được lưu trữ trên WordPress, là sử dụng một plugin bảo mật để quét trang web xem nó có sử dụng một theme hoặc plugin dễ bị tấn công hay không.
Jetpack Protect là một công cụ quét lỗ hổng miễn phí được tạo bởi các nhà phát triển tại Automattic. Nó sẽ không sửa một lỗ hổng nhưng nó sẽ cảnh báo người dùng nếu nó phát hiện lỗ hổng liên quan đến plugin hoặc theme. Phiên bản trả phí cung cấp nhiều bảo vệ hơn.
Các plugin bảo mật WordPress đáng tin cậy khác là Sucuri và Wordfence, cả hai đều làm các công việc khác nhau và có sẵn trong phiên bản miễn phí và trả phí.
Nhưng nếu không phải trường hợp đó thì sự sụt hạng chỉ là sự trùng khớp và nguyên nhân thực sự nằm ở nơi khác.
Nghe câu hỏi và câu trả lời tại thời điểm 12:27 phút của podcast Office Hours.
Hình ảnh nổi bật từ Shutterstock/Asier Romero