KIẾN THỨC > KIẾN THỨC CƠ BẢN
Google Caffeine - search index (đánh chỉ mục) mới của Google
29/10/2018 - Xem: 3385
 

Google thông báo đã hoàn thành hệ thống search index (đánh chỉ mục) website mới có tên là Caffeine. Caffeine mang lại nhiều hơn 50% kết quả tìm kiếm cấp nhật nhất so với hệ thống cũ, nó là tập hợp nội dung web lớn nhất chúng tôi cung cấp. Nếu blog, forum của bạn có bài post mới bạn có thể tìm thấy ngay trên kết quả tìm kiếm trong thời gian nhanh hơn nhiều so với trước đây.

Khi bạn search Google thực chất bạn không tìm kiếm các website thật mà bạn chỉ đang tìm kiếm những website Google đã Index (Search Index), giống như mục lục ở mỗi cuốn sách giúp bạn tìm kiếm chính xác nội dung mình cần ở trang nào. (Bạn có thể tìm hiểu kỹ hơn về nguyên lý hoạt động của SE tại đây)

Tại sao chúng tôi xây dựng hệ thống Index mới? Nội dung website phát triển chóng mặt, nó không chỉ phát triển về số lượng nội dung mà còn phát triển nhiều hình thức khác nhau như video, ảnh, tin tức cập nhật thời gian thực. Các webpage nhiều nội dung hơn và ngày càng phức tạp hơn. Hơn nữa người dùng Google cũng đòi hỏi ngày càng cao hơn, họ đòi hỏi tìm thấy nội dung mới nhất và phù hợp nhất. Người xuất bản nội dung thì mong muốn nội dung của họ phải được tìm thấy ngay sau khi xuất bản.

Để theo kịp sự tiến hoá của web và đáp ứng nhu cầu của người dùng chúng tôi xây dựng Caffeine. Ảnh dưới đây mô tả sự khác nhau giữa hệ thống index cũ và caffein.

Hệ thống cũ có vài lớp, một vài thông tin mới cập nhật sẽ nhanh hơn số khác. Lớp cơ bản sẽ update trong vòng 2 tuần. Để cập nhật một lớp cũ chúng tôi sẽ phân tích toàn bộ website, điều đó có nghĩa là sẽ có thời gian trễ từ lúc tìm thấy website cho đến lúc đưa kết quả đến với người dùng.

Với Caffeine, chúng tôi sẽ phân tích website theo từng mảnh nhỏ và update nội dung trong Search Index một cách liên tục. Khi tìm thấy một webpages mới hoặc một thông tin mới trên một trang cũ, chúng tôi sẽ đưa trực tiếp vào Search Index. Điều đó có nghĩa là bạn sẽ tìm được nội dung cập nhật nhất của một website.

Caffeine cho phép chúng tôi Index một khối lượng lớn webpages. Mỗi giây Caffeine xử lý song song hàng trăm nghìn web pages . Nếu quy lượng thông tin ra giấy thì mỗi giây Caffeine xử lý một chồng giấy tờ cao 3 miles ( khoảng 5km). Caffein cũng sử dụng 100 triệu Gigabyte bộ nhớ trên một database và thêm vào 100 đến 1.000 Gigabyte mỗi ngày. Bạn cần 625.000 chiếc iPod để lưu trữ lượng thông tin đó, nếu xếp số iPod đó bạn sẽ được một cây iPod cao 40 miles (khoảng 70km).

Chúng tôi xây dựng Caffeine với tầm nhìn cho tương lai. Không chỉ cập nhật hơn, nó là một nền tảng mạnh mẽ cho phép chúng tôi xây dựng một Search Engine đủ sức đáp ứng được sự phát triển thông tin trên Internet và đưa kết quả tìm kiếm tới bạn.

Video :

Kiến thức khác:
Bật mí cách viết content thu hút khách hàng cho copywriter (28/7/2020)
SEO MOBILE và những yếu tố cần thiết trong Seo mobile (16/7/2020)
Google Trends là gì? Cách sử dụng Google Trends? (16/7/2020)
Cách nhúng tạo Google Form doc vào Website (17/6/2020)
Tổng hợp những từ bị CẤM khi chạy quảng cáo Facebook Ads (24/5/2020)
Hướng dẫn Cách tạo bản đồ doanh nghiệp trên Google Maps (26/9/2019)
Cách tạo email theo tên miền với IMPROVMX và GMAIL (18/9/2019)
Dân mạng dính trò lừa bình luận 'BFF' để xác minh Facebook (30/10/2018)
Thêm nút chia sẻ zalo, chat zalo cho website (30/10/2018)
Tư duy từ khóa nhìn từ dienmay.com (29/10/2018)
Tạo email tên miền riêng miễn phí với Zoho Mail (29/10/2018)
Hệ thống Quangcaocantho.vn bị phạt (29/10/2018)
Ảnh hưởng của sandbox với những URL mới (29/10/2018)
Thay đổi tên miền mà không làm thay đổi traffic và ranking (29/10/2018)
Javascript chuyển hướng website sang giao diện điện thoại (29/10/2018)
Công ty CP Truyền thông Công nghệ TVC 
Địa chỉ: Số 45 Ngô Gia Tự - TP Vinh - Nghệ An
Tel/ Fax: 0386.524.375 - Hotline: 0915.050.067
Email: truyenthongcongnghe@gmail.com - http://sarahitech.com
Giấy phép ĐKKD: 2901225066 cấp ngày 9/3/2010 tại Nghệ An - Giám đốc: Trần Viết Cường
Hôm nay: 1,239 | Tất cả: 9,253,882

0915.050.067

Chat hỗ trợ
Chat ngay