Tôi đang lập trình một ứng dụng java đọc các tệp văn bản nghiêm ngặt (.txt). Các tệp này có thể chứa tối đa 120.000 từ.Cách tốt nhất để lưu trữ và truy cập 120.000 từ trong java
Ứng dụng cần lưu trữ tất cả +120.000 từ. Nó cần phải đặt tên chúng là word_1, word_2, v.v. Và nó cũng cần truy cập những từ này để thực hiện các phương thức khác nhau trên chúng.
Tất cả các phương pháp đều liên quan đến Chuỗi. Ví dụ, một phương thức sẽ được gọi để nói có bao nhiêu chữ cái trong word_80. Một phương pháp khác sẽ được gọi để nói những chữ cái cụ thể trong word_2200.
Ngoài ra, một số phương pháp sẽ so sánh hai từ. Ví dụ, một phương thức sẽ được gọi để so sánh word_80 với word_2200 và cần trả lại có nhiều chữ cái hơn. Một phương thức khác sẽ được gọi để so sánh word_80 với word_2200 và cần phải trả về những chữ cái cụ thể nào cả hai từ chia sẻ.
Câu hỏi của tôi là: Vì tôi đang làm việc gần như độc quyền với Strings, cách tốt nhất để lưu trữ những từ này trong một ArrayList lớn? Một số ArrayLists nhỏ? Hoặc tôi nên sử dụng một trong nhiều khả năng lưu trữ khác, như Vectors, HashSets, LinkedLists?
Hai mối quan tâm chính của tôi là 1.) tốc độ truy cập và 2.) có số lượng phương pháp được tạo sẵn nhất có thể tùy ý sử dụng.
Cảm ơn sự giúp đỡ của bạn trước !!
Wow! Cảm ơn tất cả mọi người đã cung cấp phản hồi nhanh như vậy cho câu hỏi của tôi. Tất cả các đề xuất của bạn đã giúp tôi vô cùng. Tôi đang suy nghĩ và xem xét tất cả các tùy chọn được cung cấp trong phản hồi của bạn.
Hãy tha thứ cho tôi vì bất kỳ sự mờ nhạt nào; và để tôi giải quyết các câu hỏi của bạn:
Q) Tiếng Anh?
A) Các tệp văn bản thực ra là các sách được viết bằng tiếng Anh. Sự xuất hiện của một từ trong ngôn ngữ thứ hai sẽ hiếm - nhưng không phải là không thể. Tôi sẽ đặt phần trăm từ không phải tiếng Anh vào các tệp văn bản tại .0001%Q) Bài tập về nhà?
A) Tôi đang mỉm cười nhìn vào từ ngữ của câu hỏi của tôi ngay bây giờ. Có, nó giống như một bài tập ở trường. Nhưng không, nó không phải là bài tập về nhà.Q) Bản sao?
A) Có. Và có thể cứ năm từ hoặc nhiều từ, xem xét các liên từ, bài viết, v.v.Q) Truy cập?
A) Cả hai ngẫu nhiên và tuần tự. Chắc chắn có thể một phương pháp sẽ định vị một từ ngẫu nhiên. Cũng có thể một phương pháp sẽ tìm kiếm một từ phù hợp giữa word_1 và word_120000 theo tuần tự. Điều này dẫn đến câu hỏi cuối cùng…Q) Lặp lại toàn bộ danh sách?
A) Có.
Ngoài ra, tôi dự định phát triển chương trình này để thực hiện nhiều phương pháp khác về từ. Tôi xin lỗi lần nữa vì sự mờ nhạt của tôi. (Chi tiết làm nên một thế giới khác biệt, phải không?)
Chúc mừng!
khi bạn nói những lời làm bạn có nghĩa là từ tiếng Anh bình thường không? trung bình khoảng 5-6 ký tự mỗi, chiều dài tối đa khoảng 30 ký tự hoặc lâu hơn? –
Hmmm ... giống như một âm thanh Nếu vậy, điều này nên được gắn thẻ như vậy –
Có bản sao không? – Kezzer