Có cơ sở dữ liệu/địa điểm miễn phí nào có tỷ lệ chung/sử dụng từ tiếng Anh không? (Anh hoặc Mỹ, không quan trọng)từ cơ sở dữ liệu sử dụng?
Tôi không quan tâm đến các con số chính xác, chỉ liên quan đến nhau. Một cái gì đó như:
the | 0.2
xe hơi | 0,08
chroma | 0,005
ghi đè | 0.0000007
Edit:
Tôi đã tìm thấy http://en.wiktionary.org/wiki/Wiktionary%3aFrequency_lists mà tôi có thể cạo cho dữ liệu. Tuy nhiên tôi thích một định dạng sql dễ làm việc hơn.
Tính tương đối sẽ phụ thuộc vào độ tuổi, chủng tộc, giới tính, phương ngữ, quốc tịch, ... của người đó. Dường như là một bài tập vô ích để thu thập hoặc cố gắng sử dụng thông tin đó IMHO –
@Ed Heal - Tôi đang tìm các tần số sử dụng chung trên toàn bộ dân số. Nguồn không quan trọng chính xác, và nó không cần phải quá chính xác, chỉ có thể sử dụng được. – manixrock
Xin chào @manixrock, đã bốn năm kể từ khi bạn hỏi câu hỏi này. Bạn đã tìm thấy nguồn hài lòng của mình chưa? – Ooker