2012-03-17 57 views
5

'Tôi phải phát triển phần mềm dành cho Chuyên viên phân tích doanh nghiệp của Siêu thị "Cửa hàng tương lai", phần mềm thực hiện Quy tắc liên kết khai thác dữ liệu chuyển tiếp của giao dịch bán hàng siêu thị và chuẩn bị chính sách chiết khấu bằng cách chuẩn bị kết hợp . Phần mềm này sử dụng các thuật toán khai phá dữ liệu cụ thể là Apriori Algorithm. Quy tắc của Hiệp hội sẽ được hiển thị theo cách thân thiện với người dùng để tạo ra chính sách chiết khấu dựa trên các quy tắc kết hợp tích cực '.Bộ dữ liệu siêu thị cho thuật toán Apriori

Từ nơi nào tôi có thể lấy tập dữ liệu siêu thị để kiểm tra thuật toán Apriori mà tôi đã mã hóa?

+1

là bài tập về nhà này? – millimoose

Trả lời

6

Để có được một bộ dữ liệu thị trường, bạn có thể vào đây:. Fimi.ua.ac.be/data/ và tải về các tập dữ liệu lẻ

Nó là một tập hợp dữ liệu ẩn danh của các giao dịch từ một cửa hàng bỉ .

Nó là hoàn hảo để thử nghiệm Apriori hoặc tập phổ biến khai thác khoáng sản và luật kết hợp các thuật toán khai thác khác.

0

Thay vì tìm kiếm tập dữ liệu trong thế giới thực, bạn nên thiết kế một tập dữ liệu nhỏ, cụ thể cho mỗi bài kiểm tra đơn vị. Tập dữ liệu nên cung cấp điều kiện tiên quyết tối thiểu cần thiết để xác minh một tính năng duy nhất của hệ thống. Điều này sẽ giúp phát hiện lỗi dễ dàng hơn, duy trì kiểm tra theo thời gian và thể hiện khả năng và mẫu sử dụng của hệ thống đối với các nhà phát triển khác.

Ví dụ từ một miền khác sẽ là các thử nghiệm cho Hệ thống con người dùng tạo và xác thực thông tin đăng nhập vào trang web.

  • addsNewUser - trống dataset
  • throwsExceptionForDuplicateUsername - single-user dataset
  • correctPasswordPasses - cùng tập dữ liệu
  • throwsExceptionForIncorrectUsername - cùng tập dữ liệu
  • throwsExceptionForIncorrectPassword - cùng tập dữ liệu
  • throwsExceptionWhenNewUsernameExists - hai người dùng dataset

Cập nhật: Nếu bạn cần một tập dữ liệu rất lớn để thực hiện kiểm tra tích hợp hoặc hiệu suất, có thể bạn đang viết một chương trình để tạo một bộ sưu tập mua hàng ngẫu nhiên. Tôi nghi ngờ bất kỳ siêu thị hiện có nào sẵn sàng (hoặc có thể) để tham gia với các bộ dữ liệu thực sự của họ.

Điều đó đang được nói, trong khi làm việc như một nhà thầu cho một nhà cung cấp bảo hiểm y tế cách đây nhiều năm (trước HIPAA), tôi đã được cung cấp một tập dữ liệu mẫu để làm việc. Nó chứa thông tin bệnh nhân thực sự bao gồm SSN và lịch sử y tế bí mật. :(

+0

tôi đã làm tất cả các kiểm tra đơn vị, và cũng đã thử nghiệm trên bộ dữ liệu nhỏ, bây giờ tôi cần một lượng lớn dữ liệu để xác minh nó – blackhole

+0

@blackhole - Theo cập nhật của tôi ăn, tôi nghi ngờ bạn sẽ cần phải xây dựng nó cho mình. –

Các vấn đề liên quan