Khi chú ý nhiều đến tính hợp lệ, chúng tôi đã phát triển một hệ thống được sử dụng như một thang đo chất lượng để đo lường tình trạng chúng tôi đang áp dụng trên các trang riêng của mình. Đây là những gì chúng tôi làm: chấm mỗi trang của mình một số điểm từ 0-10 điểm, 0 là tệ nhất (trang với 10 hoặc nhiều hơn lỗi hợp lệ HTML và CSS) và 10 là tốt nhất (0 có lỗi về tính hợp lệ). Chúng tôi đã bắt đầu thực hiện điều này hơn hai năm trước, đầu tiên qua thử nghiệm, còn bây giờ là kiểm tra thực tất cả các trang của mình.”
Các Webmasters không hiểu rõ tầm quan trọng của mã HTML hợp lệ. Một số nghĩ rằng nó rất quan trọng trong khi số khác cho rằng chẳng hề. Đầu tháng 12, Google phát biểu rằng mã HTML hợp lệ là một tín hiệu chất lượng.
“Tại sao tính hợp lệ quan trọng ? Có nhiều quan điểm khác nhau về tính hợp lệ – tại Google cũng có nhiều cách tiếp cận và ưu tiên khác nhau, nhưng Webmaster Team xem tính hợp lệ như một thuộc tính chất lượng chuẩn [để tham chiếu]. Nó không đảm bảo khả năng tiếp cận, năng suất hay duy trì, nhưng nó làm giảm số lượng các vấn đề khả dĩ có thể phát sinh và trong nhiều trường hợp chỉ cho thấy việc sử dụng công nghệ phù hợp.
Khi chú ý nhiều đến tính hợp lệ, chúng tôi đã phát triển một hệ thống được sử dụng như một thang đo chất lượng để đo lường tình trạng chúng tôi đang áp dụng trên các trang riêng của mình. Đây là những gì chúng tôi làm: chấm mỗi trang của mình một số điểm từ 0-10 điểm, 0 là tệ nhất (trang với 10 hoặc nhiều hơn lỗi hợp lệ HTML và CSS) và 10 là tốt nhất (0 có lỗi về tính hợp lệ). Chúng tôi đã bắt đầu thực hiện điều này hơn hai năm trước, đầu tiên qua thử nghiệm, còn bây giờ là kiểm tra thực tất cả các trang của mình.”
Hầu hết các trang web đều được viết bằng HTML. Đối với mỗi ngôn ngữ, HTML có ngữ pháp, từ vựng và cú pháp riêng của nó, và mọi tài liệu được viết bằng HTML có nghĩa vụ phải tuân thủ các quy tắc này.
Giống như mọi ngôn ngữ khác, HTML thay đổi liên tục. Vì HTML đã trở thành một ngôn ngữ tương đối phức tạp, nên rất dễ bị sai. Mã HTML không tuân theo các quy tắc chính thức được gọi là mã HTML không hợp lệ.
Công cụ tìm kiếm phải phân tích cú pháp mã HTML trang web của bạn để tìm thấy nội dung liên quan. Nếu mã HTML của bạn chứa lỗi, công cụ tìm kiếm không thể tìm thấy bất kể thứ gì trên trang đó.
Chương trình crawler [bọ tìm kiếm = agent program = chương trình robot tự động chạy theo 1 thuật toán đã được cài đặt] công cụ tìm kiếm tuân theo các tiêu chuẩn HTML. Nó chỉ có thể index [phân tích, xử lý dữ liệu, trích lọc thông tin cần thiết mà crawler thu thập được, tổ chức thành cơ sở dữ liệu riêng] trang web của bạn nếu trang web tuân thủ các tiêu chuẩn HTML. Nếu có lỗi trong mã trang web, nó có thể ngừng crawl trang web của bạn và mất những gì đã thu thập được cho đến lúc đó vì lỗi.
Mặc dù hầu hết các công cụ tìm kiếm có thể xử lý những lỗi nhỏ trong mã HTML, nhưng một khung đơn còn thiếu trong mã HTML của bạn có thể là nguyên nhân nếu web của bạn không được công cụ tìm kiếm tìm thấy.
Nếu bạn không đóng một số tag đúng cách, hoặc nếu một số tag quan trọng bị thiếu, công cụ tìm kiếm có thể bỏ qua hoàn toàn nội dung của trang đó.
Mặc dù không phải tất cả các lỗi HTML đều sẽ gây ra vấn đề cho thứ hạng tìm kiếm của bạn, nhưng một số lỗi trong số đó có thể ngăn không cho web spiders index các trang web của bạn. Mã HTML hợp lệ làm cho spiders của công cụ tìm kiếm index trang web của bạn dễ dàng hơn. Kiểm tra mã HTML các trang web của mình chỉ mất một vài phút nhưng nó sẽ có tác động lớn đến khả năng tiếp cận của các trang web đó.