2011-08-30 52 views
5

Có cơ sở dữ liệu/địa điểm miễn phí nào có tỷ lệ chung/sử dụng từ tiếng Anh không? (Anh hoặc Mỹ, không quan trọng)từ cơ sở dữ liệu sử dụng?

Tôi không quan tâm đến các con số chính xác, chỉ liên quan đến nhau. Một cái gì đó như:

the | 0.2
xe hơi | 0,08
chroma | 0,005
ghi đè | 0.0000007

Edit:

Tôi đã tìm thấy http://en.wiktionary.org/wiki/Wiktionary%3aFrequency_lists mà tôi có thể cạo cho dữ liệu. Tuy nhiên tôi thích một định dạng sql dễ làm việc hơn.

+0

Tính tương đối sẽ phụ thuộc vào độ tuổi, chủng tộc, giới tính, phương ngữ, quốc tịch, ... của người đó. Dường như là một bài tập vô ích để thu thập hoặc cố gắng sử dụng thông tin đó IMHO –

+0

@Ed Heal - Tôi đang tìm các tần số sử dụng chung trên toàn bộ dân số. Nguồn không quan trọng chính xác, và nó không cần phải quá chính xác, chỉ có thể sử dụng được. – manixrock

+0

Xin chào @manixrock, đã bốn năm kể từ khi bạn hỏi câu hỏi này. Bạn đã tìm thấy nguồn hài lòng của mình chưa? – Ooker

Trả lời

4

Cụm từ bạn muốn google là "tần suất từ". Một trong những lần truy cập hàng đầu là http://www.wordfrequency.info/

+0

Liên kết đó chỉ dành cho chữ viết! Khác với phần sử dụng. –

+1

Liên kết không miễn phí. Họ chỉ cung cấp các bản trình diễn với 1% từ. Bạn phải trả $ 195 cho các mục đích học tập. – manixrock

+0

Có những lần truy cập google khác dành cho bạn, bạn đã thử chưa? Corpus họ trích xuất các thông tin từ là có sẵn, vì vậy bạn có thể thử nó cho mình. Hoặc chỉ cần truy cập http://en.m.wikipedia.org/wiki/Most_common_words_in_English cũng nằm trong số các kết quả. – tripleee

Các vấn đề liên quan