Canonical không còn là một thuật ngữ xa lạ với những làm SEO, thuật ngữ này được phát triển bởi các công ty lớn như Google, Microsoft và Yahoo nhằm hỗ trợ các chủ website giải quyết vấn đề về Duplicate Content một cách hiệu quả và nhanh chóng hơn. Tuy nhiên, có thể có những khía cạnh của thẻ Canonical mà bạn chưa hiểu rõ.

Trong bài viết này, IMTA sẽ đi sâu vào khái niệm của thẻ Canonical, giải thích về canonical link là gì, và cách sử dụng chúng một cách đúng đắn.

Thẻ Canonical Trong SEO
Thẻ Canonical Trong SEO

Canonical trong SEO là gì?

Canonical URL, hay còn được biết đến với tên gọi “Rel=canonical”, là một phần mã HTML được sử dụng để thông báo cho các công cụ tìm kiếm về trang nào được xem là trang gốc trong trường hợp có nhiều URL chứa nội dung trùng lặp hoặc tương tự nhau trên website.

Thẻ canonical thường được đặt trong phần <head> của mã nguồn HTML của trang và có dạng như sau:

Nói một cách đơn giản, khi website của bạn có nhiều nội dung giống hệt hoặc tương tự được hiển thị trên các URL khác nhau, bạn có thể sử dụng thẻ canonical để chỉ định trang nào là trang tốt nhất mà Google nên ưu tiên xếp hạng. Điều này giúp cải thiện hiệu suất SEO và tránh việc phân tán tài nguyên của công cụ tìm kiếm vào các phiên bản trùng lặp của nội dung.

Tại sao Canonical lại quan trọng trong SEO?

Thẻ Canonical, hay còn gọi là “Rel=canonical”, được tạo ra để giải quyết vấn đề của Duplicate Content. Khi một website ngày một phát triển và cung cấp nhiều thông tin hơn, thì thường sẽ xuất hiện hoặc sinh ra những trang có nội dung tương tự hoặc trùng lặp nhau trên các URL khác nhau.

Điều này dẫn đến tình trạng “Duplicate Content” và có thể khiến website của bạn bị các thuật toán của Google phạt.

Ngoài ra, các trang bị trùng lặp nội dung cũng có thể gây ra hiện tượng Cannibalization ( Ăn thịt từ khóa), khi nhiều trang cạnh tranh với nhau trên cùng một từ khóa SEO. Điều này có thể dẫn đến các trang sẽ bị mất đi vị trí SEO và không có trang nào được xếp hạng trên kết quả tìm kiếm.

Google cũng không thích Duplicate Content bởi sẽ khiến con Google Bots thu thập thông tin từ các phiên bản trùng lặp thay vì khám phá nội dung mới và quan trọng trên website của bạn, gây tốn tài nguyên, làm ảnh hưởng đến “ngân sách thu thập dữ liệu” của Google

Tuy nhiên, bằng cách sử dụng thẻ canonical, giống như bạn thông báo cho Google biết trang nào là phiên bản tốt nhất, đảm bảo rằng trang chính sẽ được ưu tiên xuất hiện khi search tìm kiếm. Đồng thời, các liên kết trỏ về các phiên bản thay thế cũng được xem xét là trỏ về URL canonical, góp phần tăng cường hiệu quả SEO.

Việc sử dụng thẻ canonical mang lại một số lợi ích, bao gồm:

  • Xác định một URL chuẩn mà bạn muốn người dùng nhìn thấy trên kết quả tìm kiếm.
  • Hợp nhất các URL với nội dung trùng lặp.
  • Theo dõi chỉ số cho sản phẩm/dịch vụ được đơn giản hóa.
  • Quản lý nội dung được phân phối trên các tên miền khác nhau.
  • Ngăn chặn bots của công cụ tìm kiếm dành thời gian thu thập dữ liệu từ các trang trùng lặp, giúp chúng tập trung vào việc khai thác nội dung mới và quan trọng hơn trên trang web.

Dưới đây là những trường hợp nên sử dụng Canonical trong website của bạn:

H3: Website có nhiều phiên bản khác nhau

https://example.com/canonical-la-gi/
https://m.example.com/canonical-la-gi/
https://amp.example.com/canonical-la-gi/

H3: Thiết lập cho URL động với trang tìm kiếm, bộ lọc,…

https://example.com/?s=canonical
https://example.com/?s=fbclid=canonical
https://example.com/?gclid=canonical

H3: Hệ thống Blogs tự động lưu nhiều URL khi lưu nội dung dưới nhiều chuyên mục khác nhau

https://example.com/seo/canonical-la-gi/
https://example.com/marketing/canonical-la-gi/
https://example.com/blog/canonical-la-gi/

H3: Bài viết được phân phối trên nhiều tên miền khác nhau

https://example.com/seo/canonical-la-gi/
https://blogs.example.com/canonical-la-gi/

H3: Nội dung được phân phối trên nhiều biến thể web khác nhau http/https hay www/non-www

https://https://example.com/seo/canonical-la-gi/
https://example.com/canonical-la-gi/

H3: Nội dung có nhiều phần, vd phần 1, phần 2, phần 3

https://example.com/canonical-la-gi/
https://example.com/canonical-la-gi-phan-2/
https:/example.com/canonical-la-gi-phan-3/

Cách sử dụng thẻ Canonical để tối ưu SEO website

Nếu sử dụng thẻ canonical không đúng cách, Google có thể bỏ qua nó hoàn toàn, gây hại đến hiệu suất SEO của trang web. Dưới đây là những cách tối ưu hóa việc sử dụng thẻ Canonical:

Sử dụng chữ viết thường trong URL

Trong thực tế, các công cụ tìm kiếm như Google phân biệt giữa các URL viết thường và viết hoa như hai liên kết khác nhau. Để đảm bảo tính nhất quán và hiệu quả của thẻ Canonical, bạn nên viết thường URL trên toàn bộ website của mình.

Chỉ sử dụng duy nhất một thẻ canonical cho mỗi trang

Khi SEO, bạn nên chỉ định duy nhất một URL canonical cho mỗi trang để tránh làm rối Google. Không gắn nhầm hai URL canonical trên một trang. Nếu bạn sử dụng các hệ thống quản lý nội dung (CMS) thì thường không cần phải thêm thẻ canonical vào mã HTML thủ công. Nếu bạn đã thêm thẻ rel=”canonical” vào mã HTML, hãy không thêm nó vào tiêu đề HTTP.

Sử dụng phiên bản miền HTTPS hoặc HTTP

Khi triển khai thẻ Canonical, nếu bạn đã chuyển sang giao thức SSL (tức là HTTPS), đảm bảo rằng bạn chỉ sử dụng URL có định dạng SSL. Bởi nếu bạn canonical về một URL không có SSL thì vô tình chung sẽ khiến con Google Bots nhầm lẫn và kết quả xếp hạng website của bạn thấp, dẫn đến giảm hiệu suất xếp hạng của trang web. Một URL có chuẩn SSL là có thêm chữ “s” đằng sau “http” khi canenical sẽ như thế này:

<link ref=”canonical” href=”https://example.com/page-1/”/>.

Mặt khác, nếu không sử dụng HTTPS thì bạn nên dùng dạng URL như sau:

<link ref=”canonical” href=”http://example.com/page-1/”/>.

Xác định URL có hoặc không có dấu gạch chéo

Khi thiết lập thẻ canonical, bạn cần chú ý xem trang của bạn có đang sử dụng dấu gạch chéo ở cuối hay không. Ví dụ, “https://example.com/” và “https://example.com” có thể được coi là hai URL riêng biệt bởi các công cụ tìm kiếm. Hãy đảm bảo rằng URL canonical được xác định là chính xác và nhất quán trên toàn bộ trang web.

Xác định URL có hoặc không có “www”

Các phiên bản có hoặc không có “www” của một URL thường được xem là các trang trùng lặp nhau. Hãy chọn ra một phiên bản và sử dụng nó trên toàn bộ trang web để tránh sự nhầm lẫn.

Sử dụng URL tuyệt đối

Thẻ Canonical nên sử dụng URL tuyệt đối thay vì URL tương đối. Điều này bao gồm cả tên miền, ví dụ:
<link ref=”canonical” href=”https://example.com/page-1/”/>
Nên tránh sử dụng URL tương đối như này:
<link ref=”canonical” href=”/page-1/”/>

Sử dụng URL viết thường

Đảm bảo rằng các URL trong website của bạn được viết thường, vì Google có thể xem các URL viết hoa và viết thường là 2 URL khác nhau. Như đã nói ở trên, việc sử dụng URL viết thường cho thẻ canonical còn để tránh nhầm lẫn sau này.

Hướng dẫn cách thiết lập Canonical trong WordPress

WordPress hiện là một nền tảng quản lý nội dung (CMS) mã nguồn mở được sử dụng nhiều không chỉ ở Việt Nam mà trên toàn thế giới. Với giao diện thân thiện và dễ sử dụng, WordPress cho phép người dùng ở mọi trình độ kỹ thuật tạo ra các trang web chuyên nghiệp một cách nhanh chóng và tiện lợi.

Hệ thống đa dạng plugin của WordPress cung cấp nhiều các công cụ hỗ trợ SEO, giúp người dùng thực hiện nhiều công việc mà không cần phải có quá nhiều kiến thức kỹ thuật đằng sau. Cụ thể, để gắn thẻ canonical cho website của bạn, bạn có thể sử dụng các plugin như Yoast SEO hoặc Rank Math SEO. Dưới đây là hướng dẫn cách thực hiện:

Đối với Yoast SEO

Bước 1: Sau khi đăng nhập vào WordPress, bạn cài đặt Plugin Yoast SEO như trong hình và kích hoạt nó.

Cài đặt và kích hoạt plugin Yoast SEO
Cài đặt và kích hoạt plugin Yoast SEO

Bước 2: Tiếp đến bạn chọn vào mục “Advanced“ để cài đặt Canonical

Đối với Rankmath

Tương tự như trên, sau khi đăng nhập vào tài khoản WordPress, bạn chọn mục Plugin Rank Math SEO.

Chọn và mở tab “Advanced”. Trường “URL Canonical” cho phép bạn chỉ định URL định cho trang.


Cách để kiểm tra thẻ canonical đã được thiết lập chưa

Khi thêm thẻ Canonical vào trang web, thường xuất hiện một số lỗi như việc chỉ định URL chính tắc vào một URL bị ngăn chặn bởi File Robots.txt hoặc “noindex”. Điều này có thể khiến cho Google có thể khó hiểu, và làm giảm hiệu suất SEO web bạn xuống.

Do đó, để đảm bảo thẻ Canonical hoạt động đúng, bạn nên kiểm tra thủ công. Duwosi đây là 3 cách phổ biến để kiểm tra thẻ Canenical hay dùng như sau:

Kiểm tra Canonical bằng cách xem View Page Source:

Bước 1: Di chuyển đến bất kỳ vị trí trống nào trên trang, nhấn chuột phải và chọn View Page Source hoặc sử dụng tổ hợp phím Ctrl + U để mở nguồn trang trong một tab mới.

Chọn View Page Source hoặc Ctrl + U
Chọn View Page Source hoặc Ctrl + U

Bước 2: Nhấn tổ hợp phím Ctrl + F để mở hộp thoại tìm kiếm, sau đó nhập “canonical”.

Bước 3: Tất cả các thẻ rel=”canonical” sẽ hiển thị. Đảm bảo URL được chỉ định là URL chuẩn và có chính xác.

Sử dụng công cụ SEOQuake:

Bước 1: Cài đặt extension SEOQuake vào trình duyệt của bạn.

Bước 2: Chọn biểu tượng SEOQuake trong danh mục tiện ích ở góc phải màn hình và chọn DIAGNOSIS.

Bước 3: Xác định và kiểm tra thẻ Canonical tag để đảm bảo URL được chỉ định là chính xác.

Kiểm tra bằng Google Search Console:

Bước 1: Sử dụng Google Search Console để tìm hiểu và xác định URL chuẩn trên trang web của bạn.

Bước 2: Mở phần “URL Inspection” và chọn “Page indexing”.

Bước 3: Cuộn xuống để xem “Google-selected canonical” và đảm bảo rằng URL được hiển thị là URL chuẩn của bạn. Nếu URL không chính xác, bạn có thể cần xem xét lại chiến lược loại bỏ trùng lặp trên trang của mình.

Đảm bảo rằng “User-declared canonical” đã được chỉ định và chính xác để hoàn tất quá trình kiểm tra.

Một số lỗi thường gặp khi dủng Canonical trong SEO

Đặt sai vị trí thẻ liên kết rel=”canonical” trong <body>

Việc đặt thẻ Canonical trong phần thân trang HTML (<body>) thường là một lỗi phổ biến trong quá trình tối ưu hóa SEO. Thay vào đó, thẻ Canonical nên được đặt trong phần đầu của trang (<head>) để đảm bảo tính hiệu quả đối với việc chỉ định trang đích của nội dung. Các công cụ tìm kiếm thường bỏ qua thẻ Canonical khi nó được đặt trong phần <body>, qua đó sxlàm giảm khả năng tối ưu hóa SEO cho trang web.

Chặn URL trong Robots.txt

Một vấn đề khác thường gặp là việc liên kết đến các trang đã bị chặn bởi tệp Robots.txt hoặc được gắn nhãn với thuộc tính “noindex”. Điều này dẫn đến việc Google bot không thể truy cập hoặc lập chỉ mục các trang này, gây ra mất mát về dữ liệu và hiệu suất SEO của trang web.

Chặn URL trong tệp Robots.txt ngăn cản Google bot khỏi truy cập các trang này. Trong khi đặt URL vào thuộc tính “noindex” khiến cho các trang không được lập chỉ mục. Điều này có thể ảnh hưởng tiêu cực đến hiển thị và thứ hạng của trang web trên các công cụ tìm kiếm.

Đặt mã HTTP 4XX cho URL gốc

Thực hiện việc đặt mã trạng thái HTTP 4XX cho URL gốc tương tự như việc sử dụng thẻ noindex.

Chèn quá nhiều thẻ canonical

Lỗi phổ biến khác khi triển khai SEO là việc gắn nhiều thẻ Canonical trên cùng một trang. Điều này thường xuyên xảy ra khi website bạn sử dụng nhiều plugin SEO khác nhau cùng lúc trên website, dẫn đến việc khai báo nhiều thẻ Canonical khác nhau cho cùng một trang. Hậu quả là các công cụ tìm kiếm sẽ bỏ qua các thẻ này hoặc không xử lý chính xác.

Khai báo thẻ Cannonical lẫn lộn

Một vấn đề phức tạp hơn là khi bạn khai báo thẻ Canonical lẫn lỗn các link với nhau, khiến cho Google không biết được đâu là URL gốc để ưu tiên, do đó có thể đẫn việc Google bỏ qua hết tất cả. Ví dụ như 2 trường hợp phổ biến này:

  • Khai báo thẻ chồng chéo với nhau: Điều này xảy ra khi thẻ Canonical từ trang A được gắn đến trang B và ngược lại, từ trang B lại Canonical ngược lại cho trang A, tạo thành một vòng lặp. Do đó Google sẽ không biết A hay b mới là URL chính, dẫn đến việc cả 2 URL sẽ bị Google bỏ qua hết.
  • Hoặc Khai báo thẻ vòng lặp với nhau: khi thẻ Canonical được gắn từ trang A đến trang B, từ trang B đến trang C, C đến D và tiếp tục, tạo thành một lặp.
  • Cả hai trường hợp đều có thể làm cho các công cụ tìm kiếm không biết được cái nào URL gốc, thậm chí bỏ qua thẻ Canonical của bạn. Vì vậy, quan trọng là đảm bảo xác định ra 1 URL gốc và Cannonical cho các URL còn lại để đảm bảo SEO hiệu quả, không gây ra nhầm lẫn cho các công cụ tìm kiếm.
Khai báo thẻ Canonical vòng lặp lên nhau
Khai báo thẻ Canonical vòng lặp lên nhau

Thiết lập URL tương đối thay vì tuyệt đối

Chú ý trong SEO, thẻ Canonical ghi nhận cả URL tương đối (URL không chứa “http://” hoặc “https://”) và URL tuyệt đối (URL đầy đủ) khi bạn nhập liệu.

Ví dụ, khi bạn gắn một URL tương đối vào thẻ Canonical: <link ref=”canonical” href=”/page-1.html”/>

Thẻ sẽ hiểu rằng bạn đang muốn áp dụng Canonical cho trang http://example.com/page-1.html.

Tuy nhiên, nếu bạn gắn một URL tuyệt đối nhưng thiếu cú pháp (thiếu “http://” hoặc “https://”): <link ref=”canonical” href=”example.com/page-1.html”/>

Thẻ sẽ hiểu rằng bạn muốn áp dụng Canonical cho trang http://example.com/example.com/page-1.html. Điều này không phản ánh đúng ý định ban đầu của bạn khi gắn thẻ.

Cẩn thận khi sử dụng thẻ Canonical cho nội dung không trùng lặp

Hãy cẩn trọng khi sử dụng thẻ Canonical cho các trang web không có vấn đề trùng lặp nội dung. Việc này có thể dẫn đến việc thẻ Canonical không cung cấp giá trị cho Google và có thể làm chậm tốc độ tải trang web của bạn. Ngoài ra, việc sử dụng thẻ Canonical cho nội dung không trùng lặp có thể gây nhầm lẫn cho người dùng vì họ có thể không biết trang web nào được xác định là trang chính của bạn.

Kết Luận

Dưới đây là chia sẻ của IMTA về Canonical là gì và tầm quan trọng của thẻ Canonical trong SEO, nhằm giúp bạn hiểu rõ hơn về khái niệm này và áp dụng nó một cách hiệu quả nhất cho website của mình. Có thể khẳng định rằng, thẻ Canonical đóng vai trò quan trong việc tối ưu hóa thứ hạng trang web trên các kết quả tìm kiếm.

Nếu bạn đang quan tâm đến khóa học SEO có thể đăng ký tại đây: https://imta.edu.vn/khoa-hoc-seo-website/