Tôi muốn nhận được sự đồng thuận của cộng đồng về thiết kế tốt để có thể lưu trữ và truy vấn số lượng tần số từ. Tôi đang xây dựng một ứng dụng mà trong đó tôi phải phân tích các đầu vào văn bản và lưu trữ số lần một từ đã xuất hiện (theo thời gian). Vì vậy, cho các đầu vào sau:Theo dõi/đếm tần số từ
- "To Kill a Mocking Bird"
- "Mocking một người chơi đàn piano"
sẽ lưu trữ các giá trị sau:
Word Count
-------------
To 1
Kill 1
A 2
Mocking 2
Bird 1
Piano 1
Player 1
Và sau đó được có thể nhanh chóng truy vấn giá trị đếm của một từ tùy ý nhất định.
Kế hoạch hiện tại của tôi là lưu trữ các từ và số lượng trong cơ sở dữ liệu, và dựa vào các giá trị đếm từ bộ nhớ ... Nhưng tôi nghi ngờ rằng tôi sẽ không nhận được đủ số lần truy cập bộ nhớ cache.
Ai đó có thể đề xuất thuật toán hoặc cấu trúc dữ liệu hoặc bất kỳ ý tưởng nào khác có thể làm cho giải pháp này hoạt động tốt không?