Canonical url là phương thức chỉ trang chuẩn giúp trang web của bạn có thứ hạng cao hơn trên website. Để biết khi nào nên dùng thuộc tính Canonical, trước hết phải xem khi nào thì các trang được xem là trùng lặp nhau.
Chúng tôi sẽ cung cấp cho bạn những kiểu trùng lặp phổ biến nhất. Rất đơn giản và bạn có thể kiểm tra ngay sau khi đọc bài viết này!
Những trường hợp dùng Canonical Url để SEO WEBSITE
Phiên bản “www” và không “www”+ phiên bản “http” và “https”
Thường thấy nhất là khác nhau về tên miền phụ www và giao thức https. Hoặc với website có phiên bản máy tính và phiên bản di động riêng.
Chẳng hạn với website Seo của tôi thì ít nhất có 4 url dưới đây đều có nội dung và được xem là trùng lặp
Trong trường hợp này, chỉ cần cho Google 1 url chuẩn, bằng cách đưa vào thẻ <head> đoạn lệnh sau:
<link rel=”canonical” href=”https://seo.bnn.vn/” />
Ngoài ra, cần sử dụng một vài kỹ thuật khác liên quan đến Điều hướng 301 để trỏ hết các phiên bản trên Url sử dụng https và không có www. Với website của bạn, nếu không biết cách thực hiện, bạn cần nhờ sự trợ giúp nhân viên lập trình web.
Phiên bản Url có và không có dấu gạch chéo ở cuối cùng
Đây cũng là tình huống phổ biến vì cùng một trang nhưng sẽ có 2 phương án có hoặc không có dấu gạch chéo ở phần cuối của Url.
Chẳng hạn như cùng 2 url đều hoạt động:
https://www/vietnamairlines.com/vn/vi/home/
https://www/vietnamairlines.com/vn/vi/home
Phiên bản máy tính và di động
Như trang báo Dân trí, có 2 phiên bản riêng với 2 url như thế này:
2 trang này có nội dung gần như giống nhau hoàn toàn. Do đó, trong Source Code của họ cũng có dòng chỉ rõ đâu là url chuẩn
<link rel=”canonical” href=”https://dantri.com.vn/” />
Bộ lọc và sắp xếp
Việc sử dụng công cụ bộ lọc hoặc sắp xếp thường gây ra sự trùng lặp. Đơn giản là vì những tác vụ này tạo ra Url khác nhau nhưng lại mang cùng một nội dung.
Ví dụ, với website sàn giao dịch ô tô bonbanh.com. Đây là trang danh sách các xe BMW được chào bán:
Khi sắp xếp theo năm sản xuất (mới/cũ), giá xe (thấp/cao) thì được 4 trang khác nhau:
https://bonbanh.com/oto/bmw=sf000000010
https://bonbanh.com/oto/bmw=sf000000020
https://bonbanh.com/oto/bmw=sf000000030
https://bonbanh.com/oto/bmw=sf000000040
Rõ ràng, cả 5 trang trên đều có cùng một nội dung (các xe BMW trên sàn giao dịch) chỉ là được sắp xếp theo các thứ tự khác nhau. Những trang này được xem là trùng lặp nên trong code chỉ cần có 1 Url chuẩn. Và đây chính là kết quả tôi tìm thấy trong code của công ty này:
<link rel=”canonnical” href=”https://bonbanh.com/oto/bmw” />
Trang tìm kiếm nội bộ
Vào tìm kiếm nội dung trên trang luatvietnam.vn với những cụm từ khác nhau:
https://luatvietnam.vn/tim-van-ban.html?Keywords=abc
https://luatvietnam.vn/tim-van-ban.html?Keywords=xyz
Cùng 1 trang, tìm kiếm từ khóa khác nhau thì cho Url khác nhau. Vì vậy, cũng bị xem là trùng lặp.
Và với trường hợp này trong mã website này cũng đã chỉ rõ Canonical url để Google biết đâu là chuẩn:
<link rel=”canonical” href=”http”//luatvietnam.vn/tim-van-ban.html” />
Trang đích trỏ tới từ 1 trang liên kết
Trong tiếp thị liên kết, bạn thường đặt link từ trang của mình đến trang đích. Khi người dùng nhấp chuột vào link sẽ dẫn tới trang đích có tham số giới thiệu. Về bản chất thì vẫn là trang cũ nhưng đã được thay đổi url và bị lỗi trùng lặp.
Ví dụ: 2 url dưới đây cùng 1 trang nhưng khác nhau về ID của người làm tiếp thị liên kết như sau:
https://unica.vn/bat-dau-lam-xuat-nhap-khau-tu-con-so-0
https://unica.vn/bat-dau-lam-xuat-nhap-khau-tu-con-so-0?coupon=VNL01
Unica cũng đã chỉ rõ Url chuẩn trong code:
<link ref=”canonical” href=”http://unica.vn/bat-dau-lam-xuat-nhap-khau-tu-con-so-0.html” />
Xảy ra trùng lặp chéo giữa các tên miền, hãy dùng canonical url
Nghĩa là bạn có 2 hay nhiều website có tên miền khác nhau. Nhưng có những trang trong ấy có nội dung bị trùng lặp. Như vậy, để tránh lỗi, bạn nên chỉ rõ trang nào là trang domain chuẩn, những trang trùng lặp chỉ là bản sao và cần trỏ về trang chuẩn khi người khác tìm kiếm trên công cụ tìm kiếm.
Ví dụ: Bạn có một vài website trong hệ thống vệ tinh. Khi viết một bài mới, bạn đăng bài mới ấy lên tất cả các website này. Để tránh bị Google bắt lỗi trùng lặp nội dung. bạn cần chọn 1 url trên 1 site làm chuẩn. Sau đó trỏ canonical Url trên tất cả các trang kia về trang chuẩn mà bạn đã chọn.
Một số lưu ý khi dùng thẻ Canonical Url
Tránh trường hợp gắn thẻ Canonical url chéo
Việc gắn thẻ Canonical chéo (gắn thẻ Canonical trang A vào B hoặc ngược lại) sẽ khiến công cụ tìm kiếm hiểu sai hoặc bỏ qua thẻ. Để tránh điều này xảy ra, cần cho công cụ tìm kiếm biết ý định gắn thẻ một cách rõ ràng.

Kiểm tra lại các thẻ Canonical sau khi gắn
Cần kiểm tra đã gắn đúng URL trong thẻ Canonical chưa. Tránh trường hợp lỗi hoặc sơ suất dẫn đến gắn sai thẻ Canonical. Kiểm tra lại URL đã gắn thẻ Canonical, đặc biệt với các trang thương mại điện tử (E-commerce) và sử dụng hệ thống quản lý nội dung (CMS-driven). Hiện nay, có khá nhiều tool chất lượng để check Canonical URL. Trong đó có thể kể đến Open SEO Stats được nhiều SEOer lựa chọn.

Hậu quả của việc gắn sai thẻ canonical cho page đang có ranking cao và nhiều traffic rất lớn (ví dụ như trang A được gắn canonical là trang B) rất đáng tiếc công sức. Lúc này Google xem trang B là trang gốc và truyền toàn bộ SEO value sang trang B. Nếu trang gắn link sai (Trang B) có nội dung hoàn toàn khác hoặc tối ưu không tốt. Toàn bộ keyword của trang ban đầu (trang A) sẽ bị drop.
Đọc thêm: Thẻ Canonical là gì? Tối ưu hóa thẻ Canonical trong SEO
Nên Chủ động sử dụng Canonical cho Homepage
Duplicate Homepage là trường hợp phổ biến hay mắc phải (trường hợp hay gặp nhất là gắn UTM tracking hoặc A/B testing).
Vì vậy việc gắn thẻ Canonical trong trường hợp này là cần thiết để đẩy website của bạn lên.

Sử dụng cross-domain Canonical Url
Trường hợp quản lý nhiều site và thường xuyên đăng các bài báo, blog có nội dung giống nhau trên các trang thì việc gắn thẻ Canonical nhằm tập trung điểm ranking cho URL gốc từ site bạn muốn.
Cẩn trọng với những trang “gần như duplicate nội dung”
Thẻ Canonical trong SEO có thể dùng cho những trang có nội dung gần như trùng lặp. Như những trang về sản phẩm và chỉ khác nhau về đơn vị tiền tệ, đặc điểm hay một vài tính năng sản phẩm. Còn nếu nội dung của những trang quá khác nhau thì công cụ tìm kiếm có thể bỏ qua thẻ Canonical.
VD: URL của trang sản phẩm điện thoại iphone như sau:
Khi người dùng lọc sản phẩm theo địa điểm, URL sẽ thay đổi nhưng nội dung vẫn giữ nguyên.
http://example.com/iphone/tphcm
http://example.com/iphone/hanoi
Nếu để Google index những URL mới sinh ra sẽ gây nên một số vấn đề phức tạp. Lúc này bạn nên sử dụng thẻ Canonical trang http://example.com/iphone/ gắn vào 2 URL mới.
Quan trọng: trường hợp trên để tránh trùng lặp nội dung thì các page lọc theo địa điểm nên bổ sung thêm content tầm 500-1000 từ để giảm tỉ lệ trùng lặp và không cần phải set canonical về trang http://example.com/iphone/
Tổng kết
Trên đây là những lỗi thường gặp trong xây dựng nội dung trang web khiến google đánh giá thấp trang web của bạn qua những trang trùng lặp. Bên cạnh đó, chúng tôi đã cung cấp cho bạn những trường hợp cần phải sử dụng thẻ canonical url và những lưu ý khi sử dụng để đạt được hiệu quả.
Đừng bỏ qua những tiểu tiết khiến trang web của bạn tối ưu hơn đối thủ. Chúc bạn thành công!