Dữ liệu có cấu trúc đóng vai trò quan trọng trong việc cải thiện sự hiểu biết của các công cụ tìm kiếm về nội dung trên trang web của bạn. Đối với các trang tin tức, blog và trang tin thể thao, việc tích hợp dữ liệu có cấu trúc loại Bài viết (Article) không chỉ giúp Google nhận diện và hiển thị thông tin chính xác mà còn tối ưu hóa trải nghiệm người dùng. Trong bài viết này, chúng ta sẽ tìm hiểu cách thêm dữ liệu có cấu trúc Article vào trang web của bạn để cải thiện SEO và tăng cường sự hiện diện trên các kết quả tìm kiếm.
Việc tích hợp dữ liệu có cấu trúc loại Article vào các trang tin tức, blog, và trang tin thể thao là một chiến lược quan trọng giúp Google có thể hiểu rõ hơn về nội dung trang web của bạn. Điều này cho phép Google hiển thị các yếu tố như tiêu đề, hình ảnh, và thông tin ngày tháng một cách chính xác và tối ưu hơn trên kết quả tìm kiếm và các sản phẩm khác của Google, chẳng hạn như Google News và Trợ lý Google. Mặc dù việc sử dụng schema markup không phải là điều kiện bắt buộc để tham gia vào các tính năng của Google News (như mục Tin bài hàng đầu), nhưng việc triển khai dữ liệu có cấu trúc Article có thể cung cấp cho Google thông tin chi tiết hơn về nội dung của bạn, bao gồm loại bài viết, tên tác giả, và tiêu đề bài viết.
Ví dụ
Để minh họa cho việc triển khai dữ liệu có cấu trúc Article, sau đây là một ví dụ cụ thể về cách tích hợp schema này vào trang web của bạn.
JSON-LD:
<html>
<head>
<title>Tiêu đề bài viết tin tức</title>
<script type=”application/ld+json”>
{
“@context”: “https://schema.org”,
“@type”: “NewsArticle”,
“headline”: “Tiêu đề bài viết tin tức”,
“image”: [
“https://example.com/photos/1×1/photo.jpg”,
“https://example.com/photos/4×3/photo.jpg”,
“https://example.com/photos/16×9/photo.jpg”
],
“datePublished”: “2024-01-05T08:00:00+08:00”,
“dateModified”: “2024-02-05T09:20:00+08:00”,
“author”: [{
“@type”: “Person”,
“name”: “Jane Doe”,
“url”: “https://example.com/profile/janedoe123”
},{
“@type”: “Person”,
“name”: “John Doe”,
“url”: “https://example.com/profile/johndoe123”
}]
}
</script>
</head>
<body>
</body>
</html>
Vi dữ liệu:
<html>
<head>
<title>Tiêu đề bài viết tin tức</title>
</head>
<body>
<div itemscope itemtype=”https://schema.org/NewsArticle”>
<div itemprop=”headline”>Tiêu đề bài viết tin tức</div>
<meta itemprop=”image” content=”https://example.com/photos/1×1/photo.jpg” />
<meta itemprop=”image” content=”https://example.com/photos/4×3/photo.jpg” />
<img itemprop=”image” src=”https://example.com/photos/16×9/photo.jpg” />
<div>
<span itemprop=”datePublished” content=”2024-01-05T08:00:00+08:00″>
ngày 5 tháng 1 năm 2024 lúc 8:00 sáng
</span>
(sửa đổi lần cuối
<span itemprop=”dateModified” content=”2024-02-05T09:20:00+08:00″>
ngày 5 tháng 2 năm 2024 lúc 9:20 sáng
</span>
)
</div>
<div>
bởi
<span itemprop=”author” itemscope itemtype=”https://schema.org/Person”>
<a itemprop=”url” href=”https://example.com/profile/janedoe123″>
<span itemprop=”name”>Jane Doe</span>
</a>
</span>
và
<span itemprop=”author” itemscope itemtype=”https://schema.org/Person”>
<a itemprop=”url” href=”https://example.com/profile/johndoe123″>
<span itemprop=”name”>John Doe</span>
</a>
</span>
</div>
</div>
</body>
</html>
Cách thêm dữ liệu có cấu trúc
Dữ liệu có cấu trúc là một định dạng tiêu chuẩn giúp cung cấp thông tin chi tiết về một trang web và tổ chức nội dung trên trang một cách có hệ thống. Nếu bạn mới làm quen với khái niệm này, hãy tìm hiểu kỹ về cơ chế hoạt động của dữ liệu có cấu trúc.
Dưới đây là hướng dẫn tổng quan về quy trình xây dựng, kiểm tra và phát hành dữ liệu có cấu trúc.
- Thêm càng nhiều thuộc tính đề xuất cho trang web của bạn càng tốt. Không có thuộc tính nào là bắt buộc, tuy nhiên, bạn nên chọn những thuộc tính phù hợp nhất với nội dung của mình. Tuỳ theo định dạng bạn đang sử dụng, hãy tìm hiểu vị trí chính xác để chèn dữ liệu có cấu trúc vào trang.
Nếu bạn đang sử dụng hệ thống quản lý nội dung (CMS), việc sử dụng một plugin tích hợp trong CMS có thể giúp bạn dễ dàng thêm dữ liệu có cấu trúc hơn.
Nếu bạn sử dụng JavaScript, hãy nghiên cứu cách tạo và triển khai dữ liệu có cấu trúc bằng JavaScript. - Đảm bảo tuân thủ các nguyên tắc đã được đề ra.
- Sau khi hoàn thành, hãy xác thực mã của bạn bằng công cụ Kiểm tra kết quả nhiều định dạng và sửa tất cả các lỗi nghiêm trọng. Bạn cũng nên xem xét việc khắc phục các vấn đề nhỏ mà công cụ này phát hiện, vì việc giải quyết những vấn đề này có thể cải thiện chất lượng dữ liệu có cấu trúc của bạn. Tuy nhiên, việc này không bắt buộc để nội dung của bạn đủ điều kiện xuất hiện dưới dạng kết quả nhiều định dạng.
- Triển khai một vài trang có chứa dữ liệu có cấu trúc và sử dụng Công cụ kiểm tra URL để xem Google nhận diện trang của bạn như thế nào. Đảm bảo rằng Google có thể truy cập trang của bạn và trang không bị chặn bởi tệp robots.txt, thẻ noindex hoặc yêu cầu đăng nhập. Nếu trang không gặp vấn đề nào, bạn có thể yêu cầu Google thu thập lại dữ liệu các URL của mình.
Lưu ý rằng bạn sẽ cần chờ một thời gian để Google thu thập lại dữ liệu và lập chỉ mục lại trang. Thông thường, có thể mất vài ngày sau khi bạn xuất bản trang để Google tìm và thu thập dữ liệu trên trang đó. - Để thông báo cho Google về các thay đổi sau này, bạn nên gửi sơ đồ trang web. Bạn có thể tự động hóa quy trình này bằng cách sử dụng Search Console Sitemap API.
Nguyên tắc
Để đảm bảo dữ liệu có cấu trúc của bạn đủ điều kiện xuất hiện trong kết quả tìm kiếm của Google, bạn phải tuân thủ chặt chẽ các nguyên tắc này.
Cảnh báo: Nếu trang web của bạn vi phạm bất kỳ nguyên tắc nào, Google có thể áp dụng hình phạt thủ công, ảnh hưởng tiêu cực đến thứ hạng trang web. Sau khi khắc phục vấn đề, bạn có thể gửi yêu cầu xem xét lại để Google đánh giá lại trang web của bạn.
- Yêu cầu cơ bản cho Tìm kiếm
- Nguyên tắc chung về dữ liệu có cấu trúc
- Nguyên tắc kỹ thuật
Nguyên tắc kỹ thuật
Đối với các bài viết có nhiều phần, hãy đảm bảo rằng thẻ rel=canonical trỏ đến từng trang riêng lẻ hoặc một trang “xem toàn bộ” thay vì chỉ trỏ đến trang đầu tiên của loạt nội dung. Tìm hiểu thêm về quy trình chuẩn hóa này để tối ưu hóa khả năng hiển thị nội dung.
Nếu trang web của bạn cung cấp nội dung có giới hạn truy cập dựa trên gói thuê bao hoặc yêu cầu người dùng đăng ký, hãy cân nhắc việc bổ sung dữ liệu có cấu trúc cho nội dung thuê bao và nội dung có tường phí để đảm bảo Google hiểu rõ cách nội dung của bạn được hiển thị cho người dùng.
Định nghĩa các loại dữ liệu có cấu trúc
Để giúp Google hiểu rõ hơn về nội dung trên trang web của bạn, hãy tích hợp càng nhiều thuộc tính liên quan càng tốt. Không có thuộc tính nào là bắt buộc; hãy lựa chọn những thuộc tính phù hợp nhất với nội dung của bạn.
Đối tượng Article
Đối tượng Article phải được xây dựng dựa trên một trong các loại schema.org sau: Article, NewsArticle, BlogPosting.
Dưới đây là các thuộc tính được Google hỗ trợ:
Thuộc tính nên có
- author
Loại dữ liệu: Person hoặc Organization
Tác giả của bài viết. Để Google hiểu rõ hơn về tác giả từ nhiều khía cạnh khác nhau, bạn nên tuân thủ các phương pháp tốt nhất về mã đánh dấu cho tác giả. - author.name
Loại dữ liệu: Text
Tên của tác giả. - author.url
Loại dữ liệu: URL
Liên kết đến một trang web xác định duy nhất tác giả của bài viết, chẳng hạn như trang mạng xã hội, trang “giới thiệu về bản thân” hoặc trang tiểu sử của tác giả. Nếu URL là một trang hồ sơ nội bộ, bạn nên đánh dấu tác giả đó bằng dữ liệu có cấu trúc loại trang hồ sơ. Bạn cũng có thể sử dụng thuộc tính sameAs; Google có thể hiểu cả sameAs và url khi phân biệt các tác giả. - dateModified
Loại dữ liệu: DateTime
Ngày giờ chỉnh sửa bài viết gần nhất theo định dạng ISO 8601. Bạn nên cung cấp thông tin về múi giờ; nếu không, Googlebot sẽ sử dụng múi giờ mặc định. Thuộc tính dateModified giúp cung cấp cho Google thông tin ngày chính xác hơn, dù Công cụ Kiểm tra kết quả nhiều định dạng không đưa ra cảnh báo cho thuộc tính này. - datePublished
Loại dữ liệu: DateTime
Ngày giờ xuất bản lần đầu của bài viết theo định dạng ISO 8601. Bạn nên cung cấp thông tin về múi giờ; nếu không, Googlebot sẽ sử dụng múi giờ mặc định. Thuộc tính datePublished giúp cung cấp thông tin ngày chính xác hơn, dù Công cụ Kiểm tra kết quả nhiều định dạng không đưa ra cảnh báo cho thuộc tính này. - headline
Loại dữ liệu: Text
Tiêu đề của bài viết. Nên sử dụng tiêu đề ngắn gọn để tránh bị cắt ngắn trên một số thiết bị. - image
Loại dữ liệu: ImageObject hoặc URL
URL đến hình ảnh đại diện cho bài viết. Nên chọn hình ảnh có liên quan đến nội dung bài viết, tránh sử dụng biểu trưng hoặc chú thích.
Nguyên tắc bổ sung về hình ảnh:
-
- Mỗi trang phải có ít nhất một hình ảnh, dù bạn có đánh dấu hình ảnh đó hay không. Google sẽ chọn hình ảnh tốt nhất dựa trên tỷ lệ khung hình và độ phân giải để hiển thị trong kết quả tìm kiếm.
- URL của hình ảnh phải cho phép Google thu thập dữ liệu và lập chỉ mục. Sử dụng Công cụ kiểm tra URL để đảm bảo Google có thể truy cập URL của bạn.
- Hình ảnh phải đại diện cho nội dung được đánh dấu.
- Tệp hình ảnh phải ở định dạng mà Google Hình ảnh hỗ trợ.
- Để đạt kết quả tốt nhất, bạn nên cung cấp nhiều hình ảnh có độ phân giải cao (tối thiểu 50.000 pixel khi nhân chiều rộng với chiều cao) và theo tỷ lệ khung hình 16×9, 4×3 hoặc 1×1.
Ví dụ:
"image": [
"https://example.com/photos/1x1/photo.jpg",
"https://example.com/photos/4x3/photo.jpg",
"https://example.com/photos/16x9/photo.jpg"
]
Các phương pháp hay nhất về mã đánh dấu tác giả
Để giúp Google hiểu rõ hơn và hiển thị chính xác thông tin về tác giả nội dung, bạn nên tuân theo các phương pháp hay nhất sau đây khi đánh dấu tác giả trong mã của trang:
Đưa tất cả tác giả vào mã đánh dấu
Đảm bảo rằng tất cả những người được liệt kê là tác giả đều được đưa vào mã đánh dấu trên trang web.
Chỉ định nhiều tác giả
Khi có nhiều tác giả, hãy liệt kê từng người trong trường author riêng biệt:
"author": [
{"name": "Willow Lane"},
{"name": "Regula Felix"}
]
Đừng hợp nhất nhiều tác giả trong cùng một trường author:
"author": {
"name": "Willow Lane, Regula Felix"
}
Sử dụng các trường bổ sung
Để giúp Google hiểu rõ hơn về tác giả, bạn nên sử dụng các thuộc tính type và url (hoặc sameAs). Đảm bảo sử dụng URL hợp lệ cho các thuộc tính này.
Ví dụ: nếu tác giả là một người, bạn có thể liên kết đến trang cá nhân của tác giả để cung cấp thêm thông tin:
"author": [
{
"@type": "Person",
"name": "Willow Lane",
"url": "https://www.example.com/staff/willow_lane"
}
]
Nếu tác giả là một tổ chức, bạn có thể liên kết đến trang chủ của tổ chức đó:
"author": [
{
"@type": "Organization",
"name": "Some News Agency",
"url": "https://www.example.com/"
}
]
Chỉ nêu tên tác giả trong thuộc tính author.name
Trong thuộc tính author.name, chỉ nên chỉ định tên của tác giả. Không thêm bất kỳ thông tin nào khác như:
- Tên của nhà xuất bản (hãy sử dụng thuộc tính publisher cho thông tin này).
- Chức danh của tác giả (sử dụng thuộc tính jobTitle nếu cần).
- Kính ngữ dạng tiền tố hoặc hậu tố (sử dụng thuộc tính honorificPrefix hoặc honorificSuffix nếu cần).
- Các từ giới thiệu như “đăng bởi”.
Ví dụ:
"author": [
{
"name": "Echidna Jones",
"honorificPrefix": "Dr",
"jobTitle": "Editor in Chief"
}
],
"publisher": [
{
"name": "Bugs Daily"
}
]
Sử dụng Type phù hợp
Sử dụng kiểu Person cho cá nhân và kiểu Organization cho tổ chức. Không sử dụng kiểu Thing và không sử dụng sai kiểu (ví dụ: không dùng kiểu Organization cho người).
Dưới đây là ví dụ về cách áp dụng các phương pháp hay nhất trong mã đánh dấu tác giả:
"author": [
{
"@type": "Person",
"name": "Willow Lane",
"jobTitle": "Journalist",
"url": "https://www.example.com/staff/willow-lane"
},
{
"@type": "Person",
"name": "Echidna Jones",
"jobTitle": "Editor in Chief",
"url": "https://www.example.com/staff/echidna-jones"
}
],
"publisher": {
"name": "The Daily Bug",
"url": "https://www.example.com"
}
// + Các trường khác liên quan đến bài viết...Khắc phục sự cố
Khi gặp khó khăn trong việc triển khai hoặc gỡ lỗi dữ liệu có cấu trúc, bạn có thể tham khảo các tài nguyên hỗ trợ sau đây.
- Nếu bạn đang sử dụng hệ thống quản lý nội dung (CMS) hoặc có người quản lý trang web của mình, hãy nhờ họ hỗ trợ. Đừng quên chuyển tiếp mọi thông báo từ Search Console để làm rõ vấn đề.
- Google không đảm bảo rằng các tính năng sử dụng dữ liệu có cấu trúc sẽ xuất hiện trong kết quả tìm kiếm. Để hiểu rõ hơn về các lý do phổ biến khiến Google không thể hiển thị nội dung của bạn trong kết quả nhiều định dạng, hãy tham khảo Nguyên tắc chung về dữ liệu có cấu trúc.
- Có thể có lỗi trong dữ liệu có cấu trúc của bạn. Hãy kiểm tra danh sách các lỗi liên quan đến dữ liệu có cấu trúc để xác định và khắc phục.
- Nếu trang của bạn bị áp dụng biện pháp thủ công, dữ liệu có cấu trúc trên trang sẽ bị bỏ qua (mặc dù trang vẫn có thể xuất hiện trong kết quả tìm kiếm của Google). Để giải quyết các vấn đề này, hãy sử dụng báo cáo Biện pháp thủ công.
- Xem lại các nguyên tắc để xác định xem nội dung của bạn có tuân thủ đúng không. Nguyên nhân gây lỗi có thể là do sử dụng nội dung không hợp lệ hoặc thẻ đánh dấu không chính xác. Tuy nhiên, một số vấn đề có thể không phải lỗi cú pháp, nên Công cụ kiểm tra kết quả nhiều định dạng sẽ không phát hiện được.
- Khắc phục sự cố thiếu kết quả nhiều định dạng hoặc giảm tổng số kết quả nhiều định dạng
- Hãy kiên nhẫn chờ đợi để Google thu thập dữ liệu và lập chỉ mục lại trang. Lưu ý rằng có thể mất vài ngày sau khi bạn xuất bản trang để Google tìm và thu thập dữ liệu. Đối với các câu hỏi chung về quy trình thu thập dữ liệu và lập chỉ mục, hãy tham khảo Câu hỏi thường gặp về thu thập dữ liệu và lập chỉ mục trên Google Tìm kiếm.
- Nếu vẫn gặp vấn đề, hãy đăng câu hỏi trên diễn đàn của Trung tâm Google Tìm kiếm để nhận được sự hỗ trợ từ cộng đồng.
Việc thêm dữ liệu có cấu trúc loại Bài viết vào trang web không chỉ giúp Google hiểu rõ hơn về nội dung của bạn mà còn cải thiện khả năng hiển thị của trang web trên kết quả tìm kiếm. Bằng cách tuân thủ các nguyên tắc và phương pháp hay nhất, bạn có thể tối ưu hóa dữ liệu có cấu trúc để đạt được hiệu quả SEO cao nhất. Hãy bắt đầu áp dụng ngay hôm nay để tăng cường sự hiện diện của trang web của bạn trên Google Tìm kiếm và các sản phẩm khác của Google.
