Cách Google tìm kiếm sắp xếp thứ hạng website

Lọc 1 trang sách rất dễ nhưng với hàng tỷ trang web thì nó lọc và sắp xếp nó sẽ là khối lượng công việc khổng lồ. Google giải quyết bài toán này qua thư viện từ vựng, xây dựng cơ chế chạy song song cho phép xử lý hàng trăm nghìn luồng 1 lúc. Giúp họ sắp xếp toàn bộ các trang website trên thế giới 1 cách nhanh chóng hơn

Tìm thông tin – Web Crawling, Lập chỉ mục – Indexing, Xếp hạng – Ranking...Là các giai đoạn tìm kiếm thông tin của Google

Google là cỗ máy tìm kiếm lớn nhất thế giới hiện nay, thuật toán và quy trình tìm kiếm dữ liệu website của nó đã được phát triển rất tối ưu. Trong bài viết này tôi sẽ mô tả quy trình tìm kiếm thông tin của Google. Bạn hiểu được quy trình này nó sẽ hỗ trợ rất nhiều cho bạn trong quá hình học và làm SEO.

Matt Cutt mô tả quá trình tìm kiếm của Google

Mattcutt đã có 1 video mô tả quá trình tìm kiếm của Google, các bạn có thể bật CC để xem bản dịch tiếng việt.

Những điều nên biết

Khi bạn tìm kiếm không phải tìm trực tiếp trên Internet mà đang tìm dữ liệu trong Sever của Google.
Google sử dụng phần mềm tìm kiếm thông tin trên Internet gọi là Spider.
Spider di chuyển giữa các trang web thông qua Link.
Google sử dụng thuật toán để sắp xếp và đưa những kết quả tốt nhất có thể và cho hiển thị lên trên top 10.

Các giai đoạn tìm kiếm thông tin của Google

Tìm thông tin – Web Crawling

Google bot tìm kiếm thông tin, tin tức mới và những trang web được thiết kế mới theo các nguồn:

Khám phá qua link – Discovery Craw

Tưởng tượng Internet như 1 hệ thống xe buýt trong thành phố, mỗi điểm dừng là 1 tài liệu (bài viết, hình ảnh, file pdf,…). Nhiệm vụ của SE bot là phải đi qua hết các điểm này để thu thập thông tin. Giống như tuyến đường xe buýt, sẽ dẫn ta từ điểm A -> điểm B. Các Link liên kết giúp SE Bot đi từ webpage này sang webpage khác. Xem thêm bài viết: Cách SEO website lên top Google và ra đơn.

Khám phá qua link – Discovery Craw

Khám phá qua Sitemaps – Sitemap Crawl

Làm sao website của bạn được Google crawl nếu như nó không có backlink nào cả? Để giải quyết vấn đề này Google phát hiện url mới thông qua việc submit sitemaps trên Google webmaster tool, hoặc HTTP request >> www.google.com/addurl.html.

Khám phá qua Sitemaps – Sitemap Crawl

Lọc link với Spam Filter

Quá trình tìm nội dung mới được Google thực hiện thường xuyên. Tuy nhiên spider không chạy theo các liên kết 1 cách ngẫu nhiên mà đi theo 1 thứ tự ưu tiên. SE bot sẽ quét dữ liệu trong các Danh bạ website lớn (dmoz, yahoo,…) – nơi có nhiều website, thường được update website mới -> Nhóm 1.

SE Bot tiếp tục tìm các link trong Nhóm 1 để tìm liên kết ngoài và đưa các link này -> nhóm 2. Toàn bộ các url này sẽ được quăng sang quá trình tiếp theo là Spam Filter để lọc các liên kết trùng lặp, hỏng. Trong quá trình này, nếu như những link đến bị lỗi (không truy cập được) nó sẽ được đưa lại quá trình Discovery Crawl. Tìm hiểu về thiet ke website

Giai đoạn 2: Lập chỉ mục – Indexing.

Các URL sạch có được sau quá trình Spam Filter sẽ được Google tung web cralwer vào để thu thập nội dung và xây dựng chỉ mục.

Đầu tiên Google phải thu thập nội dung trong website bằng cách sử dụng web crawler. Web Crawler tạo ra các HTTP request để truy cập vào website rồi bắt đầu thực hiện quá trình thu (retrieve) dữ liệu trên các trang đó. (Trong lúc này URL mới được nó phát hiện ra sẽ tiếp tục được đưa trở lại bước Discovery Crawl).

Sau khi có được dữ liệu phải làm bước tiếp theo là phân tích cú pháp để xác định nội dung của webpage.

Parsing – phân tích cú pháp: Parsing cho phép Google loại bỏ các từ phổ biến (và, thì,mà, là,…), loại bỏ các khoảng trống, con số để kết hợp các từ thành cụm từ lại thành có ý nghĩa.

Lọc 1 trang sách rất dễ nhưng với hàng tỷ trang web thì nó lọc và sắp xếp nó sẽ là khối lượng công việc khổng lồ. Google giải quyết bài toán này qua thư viện từ vựng, xây dựng cơ chế chạy song song cho phép xử lý hàng trăm nghìn luồng 1 lúc. Giúp họ sắp xếp toàn bộ các trang website trên thế giới 1 cách nhanh chóng hơn.

Sau khi 1 webpage qua bước Parsing nó sẽ được đánh dấu và cho vào 1 box riêng được mã hóa theo ID. Nó được phân loại theo nhiều cách khác nhau (khu vực, loại ngôn ngữ, chủ đề,…) để nhanh chóng nhất hiển thị ra khi có truy vấn tìm kiếm liên quan đến nó (từ khóa) – thông thường dưới 1s.

Bạn có biết?

Cản trở lớn nhất cho Google trong Quá trình này đó là các lỗi html. Khi gặp lỗi Google không thể tự xử lý ngày mà phải dùng thuật toán để xác định lại. Điều này sẽ làm web của bạn sẽ bị chậm trễ khi index và đôi khi sẽ đưa ra kết quả sai.

Nên hãy xử lý triệt để các lỗi html nếu có trong website

Xếp hạng – Ranking

Sau khi website của bạn đã được index trong data center của Google. Nó sẽ được đánh giá và xếp hạng để hiển thị ra ngoài trang kết quả tìm kiếm (SERP) thông qua thuật toán của Google.

Nhân tố On-Page – mức độ quan trọng

Bảng dưới đây là các nhân tố cơ bản và có ảnh hưởng cao nhất tới thuật toán xếp hạng của máy tìm kiếm, được đánh giá theo thang điểm 5.

Title Tags - 4.9/5
Mật độ & tần suất của từ khóa – 3.7 /5
Từ khóa trong Heading (h1, h2,h3): h1 – 3.1/5; h2 – 2.8/5.
Từ khóa trong URL 2.8/5
Từ khóa trong Meta Description – 2/5.

Dễ dàng bạn có thể nhận thấy các nhân tố Onpage được ứng dụng để hỗ trợ trong quá trình Parsing. Những từ khóa được làm nổi bật, xuất hiện trên những điểm nóng, có tần suất, mật độ xuất hiện cao. Giúp Google dễ dàng nhận biết được đâu là từ khóa chính, cụm từ chính để sắp xếp và phân loại website.

Nhân tố Off-Page Link anchor text contains keyword = 4.4/5

Back link từ trang có PR cao 4/5
Mức độ phổ biến của link liên kết trong trang (Internal Link)=4/5
Mức độ quan trọng của Page 3.5/5
Page assessed as an authority = 3.5/5
Tốc độ xây dựng liên kết* = 3.5/5

Các nhân tố Offpage liên quan rất nhiều đến việc xếp hạng website. Các Anchortext Link, Internal Link, Link velocity giúp Google tìm ra những trang đích có chất lượng và được đánh giá cao (có nhiều backlink chất lượng trỏ về). Xem thêm: 200 yếu tố quan trọng về từ khóa website xếp hạng google.

Chúng ta đã vừa đi qua các giai đoạn tìm kiếm và sắp xếp dữ liệu của Google, hi vọng bài viết này sẽ giúp các bạn căn bản hiểu được cách tìm kiếm của Google qua đó các bạn có thể dễ dàng giải thích các yếu tố ảnh hưởng đến thứ hạng của website trên Google.

* Tốc độ xây dựngliên kết – link velocity thể hiện tốc độ tăng trưởng của backlink trong một thời gian. Xem thêm bài viết: Dịch vụ seo website lên top google tìm kiếm thần tốc.

Hiện tại chúng tôi đang có chương trình khuyến mãi thiết kế web được thiết kế logo miễn phí + tên miền + hosting + hướng dẫn quảng cáo seo tổng thể marketing online miễn phí. Hãy liên hệ chúng tôi để biết thêm chi tiết.

Henry Hoàng

Chuyên gia SEO Henry Hoàng. Có nhiều năm kinh nghiệm trong lĩnh vực seo, cải thiện % CTR cho website, nhằm tăng tỉ lệ chuyển đổi. Phân tích đánh giá độ cạnh tranh từ khóa, từ đó đưa ra định hướng SEO phù hợp. Xem thêm

FollowAction (13034) - LikeAction (13234) - WriteAction (900)

BÀI VIẾT CÙNG CHỦ ĐỀ

Các tiêu chí của Google để xếp hạng một web 200 tiêu chí của Google

Thuật toán tìm kiếm của Google ngày càng phức tạp và thông minh hơn. Các phương pháp nhồi nhét từ khóa. Hoặc mua lại các nội dung sẽ làm mất hiệu quả...

Ba lời khuyên về SEO giúp nội dung Pr cua bạn xếp thứ hạng cao Google

Việc triên khai thuật toán Panda 4.2 của Google đã được bắt đầu vào cuối tuần qua và đang tiếp tục thực hiện cam kết của Google trao cho những nội...

Tiêu chí xếp hạng của google trong kết quả tìm kiếm seo từ khóa

Phần 7 trong Search Quality Guidelines của Goolge tư vấn cho nhóm đánh giá về cách xác định các trang chất lượng thấp nhất trên Internet...

Nội dung thể Description ảnh hưởng đến xếp hạng từ khóa của Google?

Câu hỏi được rất nhiều các chuyên gia SEO quan tâm là nội dung thể Description có được Google đưa vào yếu tố xếp hạng từ khóa hay không?

4 yếu tố quan trọng ảnh hưởng đến xếp hạng từ khóa seo google

Google không xem tỷ lệ nhấp chuột (CTR) là một tín hiệu xếp hạng, tuy nhiên, một số sáng chế của Google ngụ ý rằng CTR có ảnh hưởng rất lớn đến xếp...

BÀI VIẾT LIÊN QUAN

Bí quyết SEO Youtube Cách đưa video trên Youtube lên top

Cách seo youtube rất đơn giản, bạn chỉ cần làm theo hướng dẫn là thành công? Việc đưa video lên top là một chuyện, quan trọng nhất vẫn phải là nội dung...

Seo (search engine optimization) là gì? Seo là gì trong Marketing?

Nội dung là yếu tố quyết định. Có lẽ bạn đã nghe điều này hàng trăm lần rồi khi tìm hiểu về mối quan hệ giữa nội dung và SEO. Tạo dựng được nguồn...

Dịch vụ seo là gì? Tìm hiểu về dịch vụ seo web và các công ty seo

Theo như Wikipedia, SEO là tối ưu hóa công cụ tìm kiếm (tiếng Anh: Search Engine Optimization- viết tắt: SEO), là một tập hợp các phương pháp nhằm...

Cách SEO web hiệu quả phương pháp SEO top Google Bing

Dịch vụ seo chuyên nghiệp Nắng Xanh hi vọng với các cách đề cập sau đây, bạn có thể giúp cho trang web của mình xuất hiện đầu tiên trên các trang kết quả...

Web có nhiều trang nội dung có tốt cho SEO? Google Bing Youtube

Có nhiều công ty xa lánh các trang web có nhiều trang và tạo ra các trang web một trang tuyệt đẹp và thành công. Xu hướng là có quy mô nhỏ, dễ dàng điều...

Seo marketing Seo la gì trong Marketing Seo Digital Marketing là gì

Ai tìm hiểu về Digital Marketing chắc chắn cũng từng nghe đến Seo. Seo là lĩnh vực quan trọng trong Marketing Online, góp phần to lớn ảnh hưởng đến sự thành...

Cách đưa từ khóa lên trang nhất Google cách SEO từ khóa lên top Google

Muốn Seo từ khóa lên top bạn cần tối ưu tổng thể, nhờ vậy mà điểm chất lượng của toàn website cũng sẽ được đánh giá tốt hơn. Ngoài...

Cách SEO website lên top Google và ra đơn chốt sale hiệu quả

Nếu so với trước đây, SEO website hiện đã không còn đơn giản vì các công cụ tìm kiếm, cụ thể là Google đã trở nên “khắt khe” hơn với sự ra đời...

Hướng dẫn SEO web WordPress tổng thể từ A-Z cách seo bên vững

SEO Website WordPress là cụm từ ngày càng được tìm kiếm nhiều trong thời gian gần đây. Tại sao các chủ doanh nghiệp dần có xu hướng sử dụng mã nguồn...

Xem thêm