2008-08-19 88 views
22

Tôi biết một số trình tạo dữ liệu thử nghiệm ở đó, nhưng hầu hết dường như chỉ điền vào cơ sở dữ liệu tên và địa chỉ [cảm thấy tự do để sửa tôi].Tạo dữ liệu thử nghiệm trong cơ sở dữ liệu

Chúng tôi có ứng dụng được tích hợp và chuẩn hóa lớn - ví dụ: hóa đơn có số phần được liên kết với các bảng lưu trữ, số khách hàng được liên kết với các bảng khách hàng, thay đổi nhật ký được liên kết với thông tin kiểm toán, vv rõ ràng là khó điền vào một cách ngẫu nhiên. Hiện tại chúng tôi đã làm hỏng dữ liệu thực tế về cuộc sống để có được dữ liệu thử nghiệm (nhưng không phải là rất tốt).

Bạn sử dụng công cụ nào để tạo khối lượng lớn dữ liệu để kiểm tra?

Trả lời

7

Nơi tôi làm việc, chúng tôi sử dụng RedGate Data Generator để tạo dữ liệu thử nghiệm.

Vì chúng tôi làm việc trong lĩnh vực ngân hàng. Khi chúng tôi phải làm việc với dữ liệu đề cử (số thẻ tín dụng, ID người, số điện thoại), chúng tôi đã phát triển một ứng dụng có thể mặt nạ các trường cơ sở dữ liệu này để chúng tôi có thể làm việc với chúng dưới dạng dữ liệu thực.

Tôi có thể nói với Redgate bạn có thể nhận được gần với dữ liệu thực của bạn trông như thế nào trên máy chủ sản xuất vì bạn có thể tùy chỉnh mọi trường của mọi bảng trong BD của mình.

1

Các sản phẩm Red Gate là tốt ... nhưng không hoàn hảo.

Tôi thấy rằng tôi đã làm tốt hơn khi tôi đã viết các công cụ của riêng mình để tạo dữ liệu. Tôi sử dụng nó khi tôi muốn tạo khách hàng nói ... nhưng nó không tuyệt vời nếu bạn muốn mô phỏng sự ngẫu nhiên mà khách hàng có thể tham gia như tạo đơn đặt hàng ... một số có một mục có nhiều mục.

Các công cụ trong nước sẽ cung cấp dữ liệu 'thực tế' nhất mà tôi nghĩ.

+0

Công cụ tạo dữ liệu thử nghiệm của chúng tôi, "Trình tạo dữ liệu nâng cao" tạo dữ liệu thực tế: tên công ty, họ và tên, địa chỉ e-mail, tên phố, tên thành phố và nhiều hơn thế nữa. Xem http://www.upscene.com/go/?go=adg –

3

Bạn có thể tạo các gói dữ liệu bằng VSTS Database Edition (với các công cụ Power 2008 mới nhất).

Nó bao gồm một hệ dữ liệu wizard cho phép tự động thế hệ dữ liệu bằng cách trỏ đến một cơ sở dữ liệu hiện có để bạn có được một cái gì đó là thực tế nhưng chứa dữ liệu hoàn toàn khác nhau

2

Tôi vừa hoàn thành một dự án tạo 3,500,000+ dòng bồi thường bảo hiểm sức khỏe. Do hạn chế của HIPPA và PHI, việc sử dụng dữ liệu thực tế thậm chí được quét là một PITA. Tôi đã sử dụng một công cụ gọi là Datatect cho điều này (http://www.datatect.com/).

Một số trong những điều tôi thích về công cụ này:

  1. Sử dụng ODBC để bạn có thể tạo dữ liệu vào bất kỳ nguồn dữ liệu ODBC. Tôi đã sử dụng nó cho cơ sở dữ liệu Oracle, SQL và MS Access, tệp phẳng và bảng tính Excel.
  2. Có thể mở rộng qua VBScript. Bạn có thể viết móc tại các phần khác nhau của luồng công việc tạo dữ liệu để mở rộng khả năng của công cụ. Tôi đã sử dụng tính năng này để "đồng bộ hóa" các cột phụ thuộc trong cơ sở dữ liệu và để kiểm soát việc phân phối tần số các giá trị để phù hợp với tần số được quan sát thực tế.
  3. Nhận thức liên quan. Khi điền các cột khóa ngoài, hãy kéo các khóa hợp lệ từ bảng cha.
3

Tôi đã tạo trình tạo dữ liệu của riêng mình tạo dữ liệu ngẫu nhiên phù hợp với cụm từ thông dụng. Ý tưởng cơ bản là sử dụng các quy tắc xác thực hai lần.Trước tiên, bạn sử dụng chúng để tạo ra dữ liệu ngẫu nhiên hợp lệ và sau đó bạn sử dụng chúng để xác thực đầu vào mới trong sản xuất. Tôi đã viết một tiện ích vì nó có vẻ giống như một dự án học tập tốt đẹp. Nó có sẵn tại googlecode.

Các vấn đề liên quan