Từ Google Analytics Tôi có danh sách từ khóa (dài) mà mọi người đã sử dụng trong công cụ tìm kiếm để tìm trang web của tôi. Tôi muốn tìm những 'từ khóa lõi', giả dụ:Làm cách nào để cụm từ khóa công cụ tìm kiếm?
java online training
learning java
scala training
training for java
online training java
learn scala programming
Kết quả lý tưởng sẽ là: 'java', 'đào tạo trực tuyến', 'đào tạo', 'scala' và 'học'.
Khó khăn có vẻ là phát hiện cụm từ hoàn chỉnh, bỏ qua các từ phổ biến (cho) và xử lý các biến thể (học hỏi).
Có thư viện nào có thể làm điều đó (tốt nhất cho JVM) không? Hoặc là có một thuật toán phù hợp tôi có thể thực hiện bản thân mình?
Tôi nghĩ bạn cần dành nhiều thời gian hơn để chỉ định yêu cầu của bạn. Ngay cả trong ví dụ hạn chế của bạn, tôi không biết tại sao bạn không coi "lập trình" là "cốt lõi". –
Điều gì sẽ xảy ra nếu bạn sử dụng số lượng kết quả của googles để tìm từ khóa tốt? Scala sẽ có ít kết quả hơn -> từ tốt hơn. Bạn có thể thực hiện tìm kiếm tất cả các cụm từ có thể và ghi lại số kết quả cho từng cụm từ, sau đó tìm một phạm vi có cụm từ tốt. (Đó chỉ là một suy nghĩ nhanh chóng, vì vậy tôi không đặt nó như là một câu trả lời) –