LSI

TỪ KHÓA LSI LÀ GÌ? VÀ CÁCH HOẠT ĐỘNG TỪ KHÓA LSI

“Từ khóa LSI là gì?”, “LSI keyword có tác động tích cực đến thứ hạng website hay không?”, “Làm thế nào để tìm kiếm các từ khóa liên quan để phục vụ cho việc viết bài?”… là những câu hỏi được VFFTECH trả lời chi tiết trong bài viết sau về chủ đề LSI keyword.

LSI

Từ khóa LSI Là Gì?

LSI keyword (còn gọi là từ khóa LSI) là những từ và cụm từ được Google coi là có liên quan đến một chủ đề nào đó về mặt ngữ nghĩa. Ví dụ, khi nói đến “xe hơi”, các từ khóa LSI bao gồm “động cơ”, “phương tiện giao thông”, “lốp xe”, “đường xá”…

Tuy nhiên, theo chuyên gia John Mueller từ Google, từ khóa LSI không tồn tại. Vậy thực chất vấn đề là gì?

Latent Semantic Indexing (LSI) Là Gì?

Latent Semantic Indexing (LSI – Lập chỉ mục ngữ nghĩa tiềm ẩn) hoặc Latent Semantic Analysis (LSA – Phân tích ngữ nghĩa tiềm ẩn) là một kỹ thuật xử lý ngôn ngữ tự nhiên được phát triển từ thập niên 80.

Một số trường hợp, cụm từ người dùng sử dụng để tìm kiếm sẽ không trùng khớp với thông tin đã được index. Ví dụ, khi tìm kiếm từ khóa “fall” (mùa thu), kết quả được index là “fall” nhưng lại có nghĩa là “té ngã”, trong khi kết quả người dùng mong muốn lại được index dưới cái tên khác là “autumn” (cũng có nghĩa là mùa thu). Và LSI được phát minh để giải quyết vấn đề này.

Từ Đồng Nghĩa Là Gì?

Synonym (từ đồng nghĩa) là từ hoặc cụm từ có nghĩa y hệt hoặc gần giống với từ hoặc cụm từ khác. Ví dụ, rich và wealthy (giàu có), fall và autumn (mùa thu), car và automobile (xe hơi)…

Người dùng với nhu cầu, kiến thức và thói quen ngôn ngữ khác nhau sẽ mô tả cùng một thông tin bằng những cụm từ khác nhau. Ví dụ, nếu sử dụng bộ máy tìm kiếm nguyên thủy, kết quả sẽ chỉ hiển thị webpage có từ “car”, trong khi “automobile” cũng là kết quả phù hợp. Do đó, bộ máy tìm kiếm cần hiểu từ đồng nghĩa để trả về kết quả tốt nhất.

Từ Đa Nghĩa Là Gì?

Polysemic word là từ đa nghĩa, tức mang nhiều nghĩa khác nhau. Ví dụ, trong tiếng Anh, từ “bank” vừa mang nghĩa ngân hàng, vừa mang nghĩa bờ sông; “bright” vừa mang nghĩa sáng sủa, vừa mang nghĩa thông minh.

Từ đa nghĩa gây ra vấn đề tương tự như từ đồng nghĩa. Ví dụ, cụm “Apple computer”, bộ máy tìm kiếm nguyên thủy có khả năng cho ra kết quả hai trang dưới. Tuy nhiên, có một kết quả rõ ràng là không phù hợp. Do đó, bộ máy tìm kiếm khi không hiểu sự khác nhau của từ đa nghĩa thường trả về kết quả sai.

LSI Hoạt Động Thế Nào?

Máy tính không thể tự hiểu thấu đáo mối quan hệ giữa các từ như con người. Vì thế, LSI ra đời và giải quyết vấn đề này bằng cách áp dụng thuật toán để rút ra mối liên hệ giữa các từ, cụm từ trong một chuỗi văn bản.

Ví dụ, nếu áp dụng LSA cho một chuỗi văn bản về chủ đề “các mùa trong năm” thì máy tính có thể phân tích như sau:

Đầu tiên, “fall” (mùa thu) đồng nghĩa với “autumn”. Tiếp theo, những từ như “season” (mùa), “summer” (hạ), “winter” (đông), “fall” (thu) và “spring” (xuân) có liên hệ với nhau về mặt ngữ nghĩa. Cuối cùng, “fall” có quan hệ ngữ nghĩa với hai chuỗi từ khác. “Fall” lúc này trở thành hai khái niệm hoàn toàn khác: “fall” đầu tiên liên quan đến bốn mùa, “fall” thứ hai liên quan đến tai nạn. Bộ máy tìm kiếm sẽ phối hợp những thông tin trên để đưa ra kết quả tìm kiếm phù hợp nhất cho người dùng.

LSI

Google Có Sử Dụng Công Nghệ LSI Hay Không?

Trong quá trình tìm kiếm, có nhiều dấu hiệu cho thấy Google có thể hiểu cả từ đồng nghĩa và từ đa nghĩa, nhưng đại diện của Google lại từ chối việc sử dụng công nghệ LSI. Chuyên gia Bill Slawski nhận định Google đã có nỗ lực để chỉ mục các từ đồng nghĩa và các nghĩa khác của từ, nhưng không sử dụng công nghệ LSI để thực hiện điều đó.

Từ Khóa Liên Quan Có Tác Dụng Tăng Thứ Hạng Cho Website Hay Không?

Hầu hết các chuyên gia SEO đều coi từ khóa LSI là những từ, cụm từ và thực thể (entity) liên quan đến nhau. Dù khái niệm “từ khóa LSI” không chính xác theo mặt kỹ thuật, nhưng việc sử dụng từ, cụm từ liên quan trong viết nội dung sẽ giúp cải thiện SEO.

Khi tìm kiếm từ khóa “dogs” (chó), bạn không muốn trang kết quả xuất hiện hàng trăm lần từ “dogs”. Thuật toán Google sẽ xem xét trang có chứa những nội dung khác bên cạnh từ khóa “dogs” hay không, ví dụ hình ảnh, video về chó hoặc danh sách các giống chó.

Trên một trang về chủ đề “dogs”, Google sẽ nhận định tên các giống chó có liên hệ với nhau về mặt ngữ nghĩa, bởi những cái tên đó giúp Google hiểu được chủ đề tổng thể của trang.

Cách Tìm Và Sử Dụng Từ, Cụm Từ Liên Quan

Dựa Theo Tâm Lý Chung

Kiểm tra xem trang của bạn có thiếu ý nào không và thêm vào từ, cụm từ liên quan. Hãy nhớ rằng không có cách nào để biết chắc chắn liệu Google có nhìn nhận các từ, cụm từ đó có liên quan ngữ nghĩa với nhau hay không. Tuy nhiên, Google luôn hướng đến việc hiểu mối liên hệ giữa các từ và thực thể mà con người vốn dĩ tự hiểu nên bạn có thể dựa trên tâm lý chung và sự hiểu biết để bổ sung từ, cụm từ liên quan.

Quan Sát Kết Quả Autocomplete

Kết quả autocomplete không thường xuyên hiển thị từ khóa liên quan quan trọng, nhưng lại đưa ra gợi ý các từ nên đề cập.

Ví dụ, những cụm từ “donald trump spouse,” “donald trump age,” và “donald trump twitter” đều là kết quả autocomplete của “donald trump.”

Bản chất những cụm trên không phải là từ khóa liên quan, tuy nhiên những người và sự việc chúng đề cập lại là từ khóa liên quan. Trong trường hợp này đó là Melania Trump (vợ của Donald Trump), 73 tuổi (tuổi của Donald Trump) và @realDonaldTrump (Twitter của Donald Trump).

Quan Sát Tìm Kiếm Liên Quan (Related Searches)

Tìm kiếm liên quan nằm cuối trang kết quả tìm kiếm. Tương tự kết quả autocomplete thì Tìm kiếm liên quan gợi ý từ khóa, cụm từ và entity liên quan nên được đề cập.

Dùng Công Cụ LSI Keyword

Như ví dụ hình dưới, khi gõ “donald trump” sẽ xuất hiện những người liên quan (entity) như “barron trump” (con trai của Donald Trump) và “melania trump” (vợ của Donald Trump).

Quan Sát Từ Khóa Khác Từ Các Trang Top

Dùng chức năng “Also rank for” trong Ahrefs’ Keywords Explorer để tìm từ, cụm từ và entity có tiềm năng liên quan. Nếu xuất hiện quá nhiều gợi ý, bạn có thể gom gọn lại trong 3 trang top bằng cách chọn “3” trong phần intersection của Content Gap.

Sử Dụng TF-IDF

TF-IDF không liên quan gì đến LSI hay LSA, nhưng thỉnh thoảng sẽ giúp bạn phát hiện ra các từ, cụm từ hoặc entity bị “thất lạc”.

Quan Sát Knowledge Base

Knowledge base là các trang như Wikidata.org hay Wikipedia, cung cấp nguồn thông tin dồi dào về các cụm từ liên quan. Dữ liệu knowledge graph của Google cũng thu thập thông tin từ hai knowledge base nêu trên. Tận Dụng Knowledge Graph

Google lưu trữ mối quan hệ giữa người, vật và khái niệm trong knowledge graph. Kết quả từ knowledge graph thường xuất hiện trong kết quả tìm kiếm Google.

Hãy thử gõ từ khóa và xem có dữ liệu nào từ knowledge graph xuất hiện không, bởi vì đó là các entity và data point (điểm dữ liệu) mà Google đánh giá là có liên quan đến chủ đề nên sẽ đáng được nhắc đến.

Dùng Google’s Natural Language API Để Tìm Entity

Dán phần text từ các trang top vào Google’s Natural Language API để tìm kiếm entity quan trọng và phù hợp mà bạn có thể bỏ lỡ.

LSI

Kết

Tóm lại, theo Google, từ khóa LSI hầu như không tồn tại. Thế nhưng từ, cụm từ và entity có liên hệ với nhau về mặt ngữ nghĩa lại đóng vai trò quan trọng trong việc tăng thứ hạng cho website. Đây là điều mà các SEO-er cần nhớ nếu muốn đạt kết quả tốt nhất cho SEO on-page.

0935 45 3888