Kết quả 1 đến 5 của 5
Chủ đề: Góc Kỹ nghệ, sáng tạo
Hybrid View
-
22-10-2012, 02:36 AM #1
Goole Bot cỗ máy tìm kiếm
Theo tài liệu miêu tả của Google: Google Bot là những “bọ tìm kiếm” giúp Google tìm kiếm xử lý thông tin trên các website. Xử lý thông tin là quá trình sàng lọc thông tin mới, update những thông tin thay đổi trên mỗi website và thu thập các thông tin này vào kho “đám mây dữ liệu” của Google. Các trang trên website sau khi đã được Google sàng lọc thông tin, chúng ta thường sử dụng “đã được google index” để gọi chúng.
Trên thế giới có hàng trăm, hàng ngàn trang web được sử dụng. Để sàng lọc thông tin từ số lượng trang web khổng lồ như vậy Google bot được thiết lập các thuật toán, các giải thuật để xử lý thông tin nhanh chóng.
Có thể tới đây bạn sẽ thắc mắc vậy bao lâu thì Google Bot sẽ sàng lọc lại thông tin trên trang web một lần? Và số lượng trang trên website được sàng lọc trên mỗi lần sàng lọc là bao nhiêu?
Google sàng lọc thông tin dựa trên một list các danh sách link ( URLs) trên mỗi website. Đó là lý do vì sao chúng ta nên tạo sitemap cho các website. Tạo sitemap đảm bảo cho Google Bot có thể sàng lọc được lượng thông tin nhanh và nhiều nhất trên mỗi website. Khi Google Bot “ghé thăm” mỗi website, chúng “đọc” – Tìm kiếm các đường link trên site, tất nhiên chúng có thể đọc được tất cả các đường link bên trong mỗi trang (SRC- Nguồn của bức ảnh và HREF- Đường link dẫn trong các thẻ <a>) và thêm những link này vào danh sách các URLs sẽ được sàng lọc thông tin và tất nhiên nó sẽ tiếp tục tìm kiếm, chắt lọc các thông tin từ nguồn dữ liệu của các đường link này chỉ tới.
Hãy chú ý một điều rằng, vì một lý do nào đó các link trên site của bạn bị thay đổi không “trỏ” đúng vị trí, Google luôn luôn cập nhật thông tin do vậy các link cũ của bạn sẽ được gọi là link “chết”, bạn nên hạn chế điều này vì Google bot “không thích” chắt lọc thông tin từ những link “không có gì”. Thực ra chúng ta có thể khắc phục vấn đề link “chết” này, và tư vấn SEO Bizviet sẽ hướng dẫn trong câu hỏi thứ 3 (Làm sao để biết được rằng website của bạn đã được Google index? ) Chắc hẳn các bạn đã phần nào hiểu được Google Bot là gì?
Google Bot truy cập vào website của bạn như thế nào?
Google xây dựng rất nhiều Google Bot phân rải trên các website để tăng hiệu suất sàng lọc và cập nhật thông tin. Nếu một website có lượng thông tin thường xuyên thay đổi, số lượng Google Bot thường xuyên lưu trú sẽ lớn hơn. Google Bot lưu trú sẽ cập nhật những thay đổi trên website của bạn về kho dữ liệu Google, đó là lý do vì sao người dùng có thể tìm thấy thông tin hữu ích khi search trên Google.com.
Các trung tâm dữ liệu toàn cầu của Google
Council Bluffs, bang Iowa, Hoa Kỳ - lơ lửng trên tầng ở Council Bluffs, Iowa, quy mô của trung tâm dữ liệu này đang hình thành. Các xà rầm thép lớn hỗ trợ các cấu trúc và giúp phân phối lực.
Douglas County, bang Georgia, Hoa Kỳ - Những đường ống màu sắc này chuyển và lấy nước về để làm mát trung tâm. Ngoài ra, còn có hình ảnh về một chiếc xe đạp mang tên G-Bike, phương tiện dành cho thành viên nhóm đi quanh bên ngoài các trung tâm dữ liệu.
Douglas County, bang Georgia, Hoa Kỳ - Các LED màu xanh trên dãy các server cho thấy mọi thứ đang vận hành trôi chảy.
St. Ghislain, Bỉ - Như là một phần cam kết của Google để dữ dữ liệu người sử dụng an toàn, Google đã phá hủy những ổ cứng hỏng tại chỗ.
Mayes County, tiểu bang Oklahoma, Hoa Kỳ - Một hình ảnh hiếm gặp sau bên hồi server. Ở đây có hàng trăm cái quạt làm tỏa nhiệt từ trên các giá server vào buồng làm mát sẽ được tuần hoàn khép kín. Những chiếc đèn xanh là các LED tình trạng server phản chiếu từ phía trước của các server.
Nguon: tren Web
Góc Kỹ nghệ, sáng tạo
Đánh dấu