Tạo và sử dụng file robots cho google

Robots.txt có thể quy định từng loại bot khác nhau của các SE khác nhau có thể vào website hay từng khu vực của website hay không? Vài loại bot của các SE: Googlebot (Google), Googlebot-Image(Google), Yandex(SE của Nga), Bingbot(Bing)/Yahoo Slurp(Yahoo)…

Mục lục

Dưới đây là hướng dẫn tạo và sử dụng file robots.txt cho website, để các bộ máy tìm kiếm quản lý index nội dung của website bạn

Tạo và sử dụng file robots cho google

Robots.txt là gì?

Robots.txt là file văn bản có cấu trúc, khi các spider (bot, crawler) của các SE (Search engine) vào website để thu thập dữ liệu thì sẽ vào file robots.txt để xem các chỉ dẫn trong file này. robots.txt có thể quy định từng loại bot khác nhau của các SE khác nhau có thể vào website hay từng khu vực của website hay không? Vài loại bot của các SE: Googlebot (Google), Googlebot-Image(Google), Yandex(SE của Nga), Bingbot(Bing)/Yahoo Slurp(Yahoo)…

Những cú pháp thông dụng trong file robots.txt User-agent

Đối tượng bot được chấp nhận Disallow/Allow: URL muốn chặn/cho phép *: Đại diện cho tất cả Ví dụ: User-agent: * (Có nghĩa là chấp nhận tất cả các loại bot.) Khóa toàn bộ site Disallow: / Chặn 1 thư mục và mọi thứ nằm trong nó Disallow: /wp-admin/ Chặn 1 trang Disallow: /private_file.html Loại bỏ 1 hình từ Google Images User-agent: Googlebot-Image Disallow: /images/sexy.jpg Bỏ tất cả các hình từ Google Images: User-agent: Googlebot-Image Disallow: / Chặn 1 file hình bất kỳ, ví dụ .gif User-agent: Googlebot Disallow: /*.gif$ Những điều cần tránh trong file robots.txt - Phân biệt chữ hoa chữ thường. - Không được viết dư, thiếu khoản trắng. - Không nên chèn thêm bất kỳ ký tự nào khác ngoài các cú pháp lệnh. - Mỗi một câu lệnh nên viết trên 1 dòng. Cách tạo và vị trí đặt file robots.txt - Dùng notepad hay bất cứ chương trình nào tạo file, sau đó đổi tên file là robots.txt. - Đặt ở thư mục gốc của website. (doamin/robots.txt )

Henry Hoàng
Henry Hoàng
Chuyên gia SEO Henry Hoàng. Có nhiều năm kinh nghiệm trong lĩnh vực seo, cải thiện % CTR cho website, nhằm tăng tỉ lệ chuyển đổi. Phân tích đánh giá độ cạnh tranh từ khóa, từ đó đưa ra định hướng SEO phù hợp. Xem thêm
FollowAction (12616) - LikeAction (12816) - WriteAction (900)