Thứ Ba, 16 tháng 7, 2013

Các công cụ tìm kiếm hoạt động thế nào P1

Mỗi công cụ tìm kiếm gồm có 4 chức năng:  thu thập thông tin, xây dựng một nội dung (lập chỉ mục), các thuật toán và cho ra những kết quả hữu dụng.

dich vu seo website

Hãy tưởng tượng thế giới mạng rộng lớn như một hệ thống mạng lưới những trạm dừng tàu điện ngầm trong 1 thành phố lớn. Mỗi trạm dừng là một tài liệu riêng biệt của công cụ tìm kiếm (thường là 1 trang web, nhưng đôi khi là 1 bản PDF, 1 file ảnh hay thứ gì khác). Công cụ tìm kiếm cần 1 cách để “điều chỉnh” toàn bộ thành phố và tìm ra tất cả những trạm dừng trong suốt quãng đường, và vì vậy nó sử dụng con đường tốt nhất sẵn có – những đường dẫn.   “Cấu trúc 1 đường dẫn của trang web kết nối toàn bộ nội dung của những trang hiện có” (Hoặc là, ít nhất, toàn bộ những  gì công cụ có thể thâm nhập). Qua đường dẫn, những rôbốt tự động của  bộ máy tìm kiếm, gọi là “crawlers” hay là “spiders” có thể chạm tới hàng tỉ tài liệu đã được kết nối. Một khi những công cụ này tìm ra những trang này,nhiệm vụ tiếp theo của chúng là phân tích những kí tự, kí hiệu từ đó và lưu trữ những phần được chọn của trang web trong những ổ cứng đồ sộ, và được lấy lại bất cứ khi nào cần. Để hoàn thành nhiệm vụ nắm giữ hang tỉ trang nội dung có thể tiếp cận chỉ trong vòng  1 phần nhỏ của giây, những công cụ tìm kiếm đã xây dựng hệ thống dữ liệu ở các thành phố trên toàn thế giới. Những phương tiện lưu trữ khổng lồ này nắm giữ hang nghìn công cụ đảm bảo 1 lượng thong tin lớn khó tưởng tượng. Sau đó, khi 1 người nào đó thực hiện 1 thao tác tìm kiếm với 1 vài công cụ chính, họ đòi hỏi kết quả ngay lập tức – thậm chí chậm 3 hay 4 giây cũng gây ra sự thiếu hài lòng, bởi thế các công cụ tìm kiếm phải cung cấp câu trả lời càng nhanh càng tốt. Càng nhiều link trỏ đến trang web hoặc tài liệu, thì độ quan trọng của nó càng cao.   seo-providing-answers 2.    Cung cấp hồi đáp Khi một người tìm kiếm một cái gì đó trực tuyến, các công cụ tìm kiếm lục tìm ngữ liệu của hàng tỷ các tài liệu và làm hai điều - đầu tiên, trở lại chỉ những kết quả có liên quan hoặc hữu ích cho truy vấn của người tìm kiếm, và thứ hai, xếp hạng những kết quả theo thứ tự giá trị nhận thức (hay tầm quan trọng). Như vậy, "tính phù hợp" và "tầm quan trọng" là 2 thứ mà quá trình tối ưu hóa công cụ tìm kiếm phải hướng tới. Đối với các công cụ tìm kiếm, tính liên quan có nghĩa nhiều hơn việc chỉ đơn giản là có một trang với những từ bạn tìm kiếm được hiển thị nổi bật. Trong thời gian đầu, công cụ tìm kiếm đã không đi xa hơn bước đơn giản này, và thấy rằng những kết quả ko tốt đẹp họ phải chịu đựng chính là 1 hệ quả. Như vậy, thông qua việc lặp đi lặp lại quá trình cải tiến, các kỹ sư thông minh với các công cụ khác nhau nghĩ ra nhiều cách tốt hơn để tìm kết quả có giá trị mà người tìm kiếm sẽ đánh giá cao và hài lòng. Hiện nay, có hàng trăm yếu tố ảnh hưởng đến tính lien quan, vài điều trong số đó chúng ta sẽ thảo luận ngay trong bản hướng dẫn này.   Tầm quan trọng là là một nội dung tương tự rất khó để định lượng, nhưng các bộ máy tìm kiếm sẽ được lập trình những thuật toán tốt nhất.  [caption id="attachment_768" align="alignright" width="302"]seo-search-engine-results Bạn có thể đoán ngay rằng các bộ máy tìm kiếm tin rằng Ohio State là trang web liên quan nhất và phổ biến nhất cho từ khóa "Universities" trong kết quả tìm kiếm, Havard, ít liên quan và ít phổ biến hơn.[/caption] Hiện nay, các công cụ tìm kiếm chính thể hiện tầm quan trọng dưới tính phổ biến - một trang web, trang thông tin hoặc tài liệu càng phổ biến bao nhiêu thì các thông tin chứa đựng càng phải có giá trị bấy nhiêu. Giả thuyết này đã được chứng minh khá rõ rệt trong thực tế, các công cụ tìm kiếm đã không ngừng làm tăng sự hài lòng của người sử dụng bằng cách sử dụng các số liệu phổ biến. Tính phổ biến và tính liên quan ko được tính toán bằng tay (hàng nghìn tỷ thời gian tính toán này hẳn sẽ đòi hỏi toàn bộ sức lao động của tất cả dân số thế giới). Thay vào đó, các công cụ này cần thận thực hiện những phương trình tính toán – thuật toán – để tách lúa mì ra khỏi vỏ và sau đó xếp hạng theo độ ngon (tuy nhiên đó là việc của những người nông dân kiểm tra giá trị của hạt lúa mì).  Các thuật toán này thường bao gồm hàng trăm thành phần.Trong lĩnh vực SEO, chúng ta thường gọi là "yếu tố để đánh giá xếp hạng". Tôi sẽ cập nhật các yếu tố đánh giá xếp hạng trong thời gian gần nhất.

Nguyễn Thảo dịch SEOMOZ, Quang Minh biên tập.

Không có nhận xét nào:

Đăng nhận xét