Web crawler, web spider hay web robots là một chương trình tự động tìm kiếm trên Internet được thiết kết để thu thập tài nguyên Internet Web crawler, web spider hay web robot còn gọi là bọ tìm kiếm là một chương trình tự động tìm kiếm trên Internet. Nó được thiết kết để thu thập tài nguyên Internet (trang Web, hình ảnh, video, tài liệu Word, PDF hay PostScrips) , cho phép máy tìm kiếm đánh chỉ số sau đó.
Là một tập tin đơn giản không chứa mã HTML được đặt trong thư mục gốc của website, được sử dụng để thông báo cho các chương trình tìm kiếm về cấu trúc của trang web.
Là URL mà các webmasters muốn search engine coi như là địa chỉ chính thức của 1 webpage. Hay nói cách khác, một canonical URL là URL mà webmaster muốn visitors nhìn thấy.
Nội dung (content) là nội dung của bài viết trên website, là phần quan trọng và ưu tiên nhất của một trang web muốn làm SEO. Để có một website tốt và làm tốt SEO, cần phải chú ý rất kỹ đến nội dung bài viết tránh lỗi trùng lặp nội dung (Duplicate Content). “Duplicate Content” hưởng lớn đến thứ hạng của website bạn và là một trong những lỗi mà nhiều Webmaster mắc phải khi tiến hành SEO (Search Engine Optimize) cho website của mình.
Web crawler, web spider hay web robots là một chương trình tự động tìm kiếm trên Internet được thiết kết để thu thập tài nguyên Internet Web crawler, web spider hay web robot còn gọi là bọ tìm kiếm là một chương trình tự động tìm kiếm trên Internet. Nó được thiết kế để thu thập tài nguyên Internet (trang Web, hình ảnh, video, tài liệu Word, PDF hay PostScrips) , cho phép máy tìm kiếm đánh chỉ số sau đó.
Backlink chính là những liên kết từ một website khác trỏ đến website hay trang page của bạn . Nếu như trước đây backlink chỉ được sử dụng với chức năng chính là điều hướng website.
Backlink đóng vai trò quan trọng vì nó ảnh hưởng trực tiếp tới pagerank của trang web và ảnh hưởng lớn đến thứ hạng web site của bạn. Càng nhiều backlink trỏ về trang web của bạn thì có điểm càng cao trong mắt Google.
Viết tắt của Search Engine Marketing, và như tên của nó liên quan đến các dịch vụ tiếp thị hoặc các sản phẩm thông qua công cụ tìm kiếm. SEM được chia làm hai thành phần chính đó là SEO và PPC.
Trang của bạn càng nhận nhiều liên kết trỏ đến thì mức độ quan trọng trang của bạn càng tăng. Tuy nhiên đó chỉ là những khái niệm sơ đẳng nhất mà Google hiếm khi thông báo chính thức. Nó sẽ không đảm bảo cho những người lạm dụng thuật toán quá mức.
Một linkbait là một phần của nội dung trang web được xuất trên một trang web hoặc blog với mục tiêu thu hút backlinks càng nhiều càng tốt. Thông thường nó là một văn bản, nhưng cũng có thể là một đoạn video, hình ảnh, hoặc bất cứ điều gì khác. Miễn là chèn được link là ok.
Là một hay một số các webiste được tạo ra nhằm tạo ra nhiều các liên kết đến các website khác, hay các liên kết trong website đó là ảo. Nội dung trong các website được coi là link farm phần lớn là link liên kết. Và là một nhóm các websites được tạo ra với mục đích là nâng cao số lượng các đường link đến một website có sẵn sử dụng Javascript, php, asp… Điều này thực tế hiệu quả trong những ngày đầu của công cụ tìm kiếm, nhưng hiện tại SE đã có bộ lọc mới để đánh giá, trường hợp xấu nhất webiste của bạn sẽ bị penalty.
Anchor text là đoạn văn bản được dùng để hiển thị link và được mọi người sử dụng để link tới site của bạn. Nói một cách khác, chính là đoạn text link cụ thể mà người dùng nhấp vào.
Nofollow Là một thuộc tính liên kết nằm trong meta tag. Được sử dụng bởi chủ sở hữu trang web nhằm báo hiệu với Google rằng họ không xác nhận trang web mà họ đang liên kết hay nói cách khác là báo hiệu cho spider (bọ thu thập thông tin) không lần theo liên kết này nữa. Khi Google nhìn thấy các thuộc tính “nofollow” thì về cơ bản nó sẽ không tính liên kết cho pagerank và các thuật toán tìm kiếm.
Pagerank Sculpting Tạm dịch là chế tác pagerank là việc mà Webmaster quản lý những link liên kết ra ngoài. Liên kết nào phải dùng no-follow để chặn không cho các máy tìm kiếm nhận biết sự liên quan, liên kết nào phải chú trọng link sang để tiến hành cho website đó.
Keyword Stuffing là Thủ thuật liên quan đến các phần trong trang web lặp lại nhiều lần một từ khóa nhất định để gây ảnh hưởng lớn lên kết quả công cụ tìm kiếm. Nhiều năm trước các công cụ tìm kiếm đã vô hiệu hóa thủ thuật này, nhưng vì một vài lý do thủ thuật này hiện nay vẫn đang được sử dụng rộng rãi và tinh vi hơn rất nhiều.
Về cơ bản nó là một chỉ số riêng biệt. Cách Sandbox hoạt động: Bởi Google nghĩ rằng KHÔNG CÓ SITE MỚI NÀO có thể có được thứ hạng cao cho đến khi chúng chứng minh được giá trị của mình. Do vậy Google cho các site mới vào Sandbox và trì hoãn việc đánh giá và xếp hạng các site này lại.
Là thẻ tiêu đề của một trang web, nó là một trong những yếu tố quan trọng nhất trong thuật toán tìm kiếm của Google. Thẻ tiêu đề của bạn là duy nhất và chứa những từ khóa chính của trang web. Bạn có thể xem tiêu đề của trang web ở trên cùng củng trình duyệt trong khi điều hướng.
Giống như thẻ tiêu đề, meta tag được sử dụng để cung cấp, mô tả cho công cụ tìm kiếm thêm thông tin về nội dung các trang web của bạn . Các thẻ meta được đặt trong phần HEAD của mã HTML.
Thuật toán tìm kiếm của Google được sử dụng để tìm các trang web có liên quan nhất chó bất kỳ truy vấn tìm kiếm . Thuật toán xem xét hơn 200 yếu tố (theo Google), bao gồm cả gí trị pageRank
Thẻ tiêu đề, thẻ meta nội dung của trang web, tuổi tên miền….
SERP tạm dịch là những trang kết quả được các bộ máy tìm kiếm (Google, Yahoo, Bing ..) trả về khi một ai đó thực hiện một truy vấn tới các bộ máy tìm kiếm này. Số lượng truy cập tìm kiếm trang web của bạn phụ thuộc và bảng xếp hạng sẽ có bên trong các SERPs.
Mật độ từ khóa (Keyword density) là một trong những khái niệm cơ bản nhất trong SEO? Vì thế nếu muốn tìm hiểu SEO và triển khai một chiến dịch SEO hiệu quả.
Mật độ từ khóa chính chính là tỉ lệ phần trăm giữa số lần xuất hiện từ hay cụm từ khóa so với tổng số từ hiển trị trong trang web của bạn.
Dựa vào mật độ từ khóa xuất hiện trong trang web của bạn, các spider sẽ căn cứ vào số liệu này để đánh giá trang web của bạn đang cung cấp nội dung liên quan đến nội dung hay chủ đề gì.
Đây được xem là yếu tố quan trọng khi bạn muốn các spider xác định đúng từ khóa cho trang landing-page của mình.
Trong kỹ thuật SEO thì cloaking ám chỉ hành động của webmaster(VD: Google Webmaster) che dấu bot của search engine như Google crawl các nội dung mà người dùng nhìn thấy, đồng thời đề xuất cho các Bot nhìn thấy các nội dung được Onpage optimize tốt nhằm mục đích đạt được các vị trí cao trên SERP.