Tôi cần một danh sách các tên gọi chung cho mọi người, như "Bill", "Gordon", "Jane", v.v. Có một số danh sách miễn phí rất nhiều tên đã biết, thay vì tôi phải loại chúng ra? Một cái gì đó mà tôi có thể dễ dàng phân tích cú pháp với chương trình để điền vào một mảng ví dụ?Danh sách đồng bộ, máy tính có thể phân tách các tên phổ biến đầu tiên?
Tôi không lo lắng về việc:
- Biết nếu một tên là nam tính hay nữ tính (hoặc cả hai)
- Nếu dữ liệu có một đống toàn bộ dương tính giả
- Nếu có là những cái tên không có trên nó, rõ ràng là không có tập dữ liệu như thế này sẽ được hoàn thành.
- Nếu có 'trùng lặp', nghĩa là tôi không quan tâm liệu tập dữ liệu có liệt kê "Bill" và "William" và "Billy" là các tên khác không. Tôi muốn có dữ liệu hơn ít
- Tôi không quan tâm đến biết sự phổ biến tên
Tôi biết Wikipedia có list of most popular given names, nhưng đó là tất cả trong một trang HTML và manged lên với cú pháp wiki khủng khiếp . Có cách nào tốt hơn để có được một số dữ liệu mẫu như thế này mà không cần phải màn hình wikipedia cạo?
Tùy chọn * cmlimit * trong truy vấn tối đa (500) được phép cho người dùng trái phép và có thể tăng lên 5000 mục. Dù sao bằng cách sử dụng tùy chọn * cmcontinue * để truy xuất tất cả các kết quả được phân đoạn bởi đoạn ... –