Bật mí những bí mật có thể bạn chưa biết về Pagerank

Pagerank chính thức bị loại bỏ vào năm 2016 khi Google thông báo sẽ ngừng cập nhật cho nó. Bạn đọc đến đây và bảo rằng vậy có phải tôi điên rồi không? Hay rảnh rổi quá nên “đào mộ quá khứ” với thuật toán chẳng giúp ích gì cho đời nữa. Nhưng đừng vội rời đi. PageRank vẫn đóng một vai trò quan trọng trong thuật toán xếp hạng của Google.

Gary Illyes, một nhân viên làm việc cho Google đã đăng bài viết trên Tweet của anh ta. Theo Gary, Google vẫn dùng thuật toán Pagerank (và hơn 100 yếu tố khác) để đánh giá xếp hạng của một website. Tuy nhiên, chỉ có điểm khác là thanh công cụ pagerank không còn tồn tại mà thôi! Và nếu chỉ có tôi biết, bạn biết, vài người biết điều ấy, chúng ta sẽ làm được điều gì đó hay ho cho trang web của mình.

Chúng ta cùng tìm hiểu một vài điều về Pagerank nhé!

PageRank là gì?

PageRank (PR) là công thức toán học đánh giá giá trị của trang thông qua việc xem xét số lượng, chất lượng của các trang liên kết đến nó. Mục đích của PageRank là đánh giá tầm quan trọng tương đối của website trong toàn bộ hệ thống world wide web.

Sơ lược về lịch sử bí ẩn của Pagerank

Sự ra đời của Pagerank

Các bằng sáng chế PageRank đầu tiên đã được nộp vào ngày 01 tháng chín 1998. Trở thành thuật toán ban đầu mà Google sử dụng để tính toán tầm quan trọng của một trang website và xếp hạng của trang web đó. Nói tóm lại, Google thực sự được hình thành dựa trên ý tưởng của Sergey Brin rằng thông tin trên website có thể được xếp hạng dựa trên mức độ phổ biến liên kết của một trang, rằng càng nhiều liên kết trỏ đến một trang thì nó càng được xếp hạng cao.

PageRank thực sự là thứ khiến Google trở nên độc đáo. Khi mà thời điểm ấy, công cụ tìm kiếm (như Yahoo, Altavista) gặp phải các vấn đề: Hoạt động không hiệu quả, trả về kết quả tìm kiếm không phù hợp với mong đợi người dùng,..

Google giới thiệu Google Tools

Vào năm 2000, Google đã giới thiệu thanh công cụ mà ngày nay tất cả chúng ta đều nhớ đến như một cách mà chúng ta có thể xem điểm pagerank của trang website (và của đối thủ cạnh tranh).

Và các SEOer bắt đầu chỉ tập trung vào việc tăng Pagerank như một thước đo để cải thiện thứ hạng, phần lớn được thúc đẩy bởi sự hiểu biết đơn giản về thuật toán đề xuất rằng một trang web có số lượng liên kết cao nhất sẽ xếp hạng cao nhất.

Pagerank bị lạm dụng và quá trình đào thải của Google

Google sau đó phát động thông báo sẽ ngừng cập nhật thanh công cụ công khai này vào năm 2014 (với bản cập nhật được xác nhận cuối cùng là tháng 12 năm 2013) và gỡ bỏ hoàn toàn vào năm 2016. Với lý do được đưa ra bởi một phát ngôn viên của Google:

Pagerank bị gỡ bỏ hoàn toàn vào năm 2016
Pagerank bị gỡ bỏ hoàn toàn vào năm 2016

“Khi Internet phát triển và mọi người hiểu hơn về Internet, điểm số trên Toolbar PageRank – chỉ là một chỉ số đơn lẻ dần không còn hữu ích đối với người dùng. Do vậy, việc loại bỏ Pagerank toolbar giúp tránh gây nhầm lẫn cho người dùng và quản trị viên trang web về tầm quan trọng của chỉ số này.”

Điều này có phải là lý do duy nhất khiến Pagerank bị đào thải không?

Câu trả lời là không. Một yếu tố khác góp phần vào quyết định này chính là: spam link.
Các SEO-er đã từng bị ám ảnh trong thời gian dài với chỉ số Pagerank. Xem nó là một yếu tố giúp Google xếp hạng website. Nguyên nhân đơn giản cũng chỉ vì cái tên “pagerank” của nó. Do vậy, mọi người đã sớm bắt đầu mua bán các link có “PageRank cao”. Vào giữa những năm 2000, một trong những chiến thuật mua lại pagerank chính là để lại bình luận trên blog.

Về phía Google, đây là một vấn đề lớn. Cơ bản, các liên kết được đánh giá có chất lượng tốt bởi vì chúng được link đến các trang thực sự chất lượng. Ngược lại, các liên kết không tự nhiên làm cho thuật toán của Google kém hiệu quả hơn trong việc phân loại và sắp xếp các trang chất lượng cao so với các trang chất lượng thấp. Đây là yếu tố quan trọng trong quyết định “khai tử” của Google.

Pagerank không được cập nhật sau khi hết bản quyền

Bảng Pagerank 1998 đã hết hạn vào năm 2018. Trước sự ngạc nhiên của nhiều người, nó đã không được gia hạn. Vào khoảng thời gian này, một cựu nhân viên của Google đã xác nhận rằng thuật toán ban đầu đã không được sử dụng từ năm 2006.

Pagerank có thực sự mất đi?

Ngoài khẳng định của nhân viên Google như chúng tôi đã đề cập ở bên trên. Còn có những minh chứng khác về sự tồn tại của Pagerank dưới một lớp vỏ bọc mới mẻ. Pagerank được cho là đã được thay thế bởi một thuật toán mới. Điều đó nói rằng, bản cập nhật này không thực sự đề cập đến PageRank (hoặc tuyên bố là phiên bản cập nhật của thuật toán).

Thay vào đó, nó đã được cộng đồng SEO hiểu rằng hoạt động như một công cụ sửa đổi Pagerank dựa trên sự gần gũi và liên kết với các trang web.

Tìm hiểu về thuật toán của Google Pagerank

Giả sử trang web A được các trang T1… Tn trỏ đến. Ta có công thức tính chỉ số Page Rank của trang A như sau:

Công thức tính pagerank
Công thức tính pagerank
  • T: Số lượng và chất lượng internal links trên các trang
  • C; Số lượng outlink trên mỗi trang
  • PR: Chỉ số PageRank trên từng trang

Tham số d (d: damping factor): Hệ số điều chỉnh (*) có thể được đặt trong khoảng từ 0 đến 1. Đa phần thường lấy d là 0,85.

Lưu ý: PageRanks tạo một tỉ lệ % phân bố điểm số trên các trang web. Do đó pagerank của tổng tất cả các trang web sẽ là một. Tôi sẽ giải thích chi tiết về điều này:

Google định nghĩa 3 yếu tố trong khi phân tích đường dẫn của trang web

  • Số lượng và chất lượng của các Internal link trỏ đến trang;
  • Số lượng outlink trên mỗi trang;
  • Chỉ số PageRank của mỗi trang liên kết.

Giả sử trang C có 2 liên kết: 1 từ trang A & 1 từ trang B. Trang A mạnh hơn trang B và cũng có ít liên kết trỏ ra ngoài hơn.  Đưa thông tin này vào thuật toán PageRank và bạn sẽ nhận được PageRank của trang C.

Yếu tố hệ số đường dẫn trong công thức tính PageRank

Công thức PageRank có 1 yếu tố được gọi là hệ số điều chỉnh – Tham số d (damping factor – dịch sát nghĩa ra là hệ số giảm xóc).

Tham số d mô phỏng xác suất của một người dùng ngẫu nhiên liên tục nhấp vào liên kết trên trang khi họ truy cập vào website.

Thực tế số lần click vào link sẽ giảm dần trong quá trình người dùng dạo chơi trên website của bạn. Xác suất bạn click vào liên kết trên trang đầu tiên bạn truy cập là khá cao. Nhưng khả năng bạn click vào link trên trang tiếp theo sẽ giảm dần một chút. Và cứ thế tiếp tục giảm cho đến khi bạn thoát khỏi website.

Theo đó, tổng điểm số cho một trang website sẽ được nhân với hệ số điều chỉnh d của Google (thường được lấy bằng 0,85) với mỗi lần lặp của thuật toán PageRank.

Chẳng hạn, trang seo.bnn.vn link đến một trang thông qua 4 bước nhảy liên kết. Thì giá trị của liên kết đó sẽ bị giảm xuống. Cứ như thế đến trang web cuối cùng thì sẽ chẳng còn giá trị gì.
Nhưng nếu người dùng link đến cùng một trang chỉ qua 2 bước nhảy thì liên kết đó sẽ có ảnh hưởng mạnh mẽ đến trang.

Thuật tính của pagerank
Thuật tính của pagerank

Kết luận

Bài viết phía trên đã cung cấp một số thông tin về  khái niệm cho đến bốc trần những sự thật xung quanh pagerank. Trong bài viết tiếp theo, tôi sẽ giới thiệu đến các bạn những thông tin liên quan đến tối ưu hóa Pagerank cho website của mình.

Hẹn gặp lại!

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *