2010-07-22 27 views
8

Tôi mới sử dụng kho dữ liệu. Trước tiên, tôi không chính xác hơn bản sao của Bộ công cụ Datawarehouse đang trên đường đến hộp thư của tôi (thư ốc: P). Nhưng tôi đã nghiên cứu tất cả những thứ này với những gì tôi tìm thấy trên mạng.Thiết kế kho dữ liệu với nhiều hơn một bảng thực tế

Những gì tôi không tìm thấy trên mạng, tuy nhiên, là những việc cần làm khi bạn có vẻ có nhiều hơn một thực tế trong DW. Trong trường hợp của tôi (insurrance), tôi có hoàn tiền xảy ra trên cơ sở không thường xuyên. Một khách hàng có thể không có trong 3 tháng và sau đó mười trong cùng một tháng. Mặt khác, tôi có "phí thuê bao" (không chắc chắn cụm từ tiếng Anh chính xác là gì, nhưng bạn nhận được điểm), điều đó xảy ra mỗi tháng hoặc mỗi ba tháng. Điều đó dường như giống như hai sự kiện khác biệt với tôi.

Đó cũng là loại được kết hợp lỏng lẻo bởi một số thứ nguyên, như khách hàng hoặc "sản phẩm bảo hiểm". Bây giờ là hai kho khác biệt này, mà tôi phải tạo ra hai báo cáo khác nhau và sau đó kết nối các báo cáo bên ngoài DW? Hoặc là có một cách để thiết kế này để phù hợp với một DW gốc duy nhất. Hay tôi nên kết hợp hai sự kiện này trong một? Tôi có lẽ sẽ mất chi tiết về tiền hoàn lại sau đó.

Một số blog tôi đọc nói rằng DW luôn có một bảng thực tế. Những người khác đề cập đến bước thiết kế các bảng thực tế với một S là gì, nhưng không có hướng dẫn rõ ràng nếu có một liên kết giữa chúng hoặc chúng chỉ là các thành phần riêng biệt của một dự án DW.

Có ai biết một số tham chiếu về phần chính xác của thiết kế DW không?

Trả lời

7

Đưa câu hỏi của bạn về phía sau.

Kho dữ liệu có thể có nhiều hơn một bảng thực tế. Tuy nhiên, bạn muốn giảm thiểu sự tham gia giữa các bảng thực tế. Bạn có thể sao chép thông tin thực tế trong các bảng thực tế khác nhau.

Trong số các đối tượng bạn đã đề cập:

Hoàn lại tiền là một thực tế. Dấu thời gian là thứ nguyên của thực tế hoàn tiền.

Phí đăng ký là một thực tế. Dấu thời gian là thứ nguyên của thực tế phí đăng ký.

Khoản tiền hoàn lại có thể xảy ra nhiều lần. Tôi đoán rằng mỗi khách hàng có một khoản phí đăng ký. Vì vậy, nó xuất hiện chúng tôi có hai bảng thực tế cho đến nay, khách hàng và hoàn trả khách hàng.

Nếu bạn biết rằng chỉ có thể có tối đa 3 khoản tiền hoàn lại (ví dụ), thì bạn sẽ loại bỏ bảng thực tế hoàn phí của khách hàng và đặt 3 cột tiền hoàn lại trong bảng khách hàng.

Bạn cũng đề cập đến bảo hiểm. Khách hàng có thể có nhiều chính sách. Vì vậy, chúng tôi có một bảng thực tế thứ ba.

Kho dữ liệu thường được thiết kế bằng cách sử dụng star schema. Lược đồ sao về cơ bản là một bảng thực tế được kết nối với một hoặc nhiều bảng thứ nguyên. Có thể bạn sẽ có nhiều hơn một ngôi sao trong kho dữ liệu, vì chúng tôi đã xác định 3 bảng thực tế.

14

Bạn có thể có bao nhiêu bảng thực tế tùy thích. Trong ví dụ của bạn, bạn có thể có một cái gì đó như:

fact_ins_transaction

dimProduct danh sách một số sản phẩm - thuê bao là một trong những. dimTransactionType sẽ liệt kê các giao dịch tốt (mua, hoàn thuế, định kỳ cước thuê bao ...)

Bây giờ giả sử bạn quan tâm đến báo cáo thuê bao đơn giản, bạn có thể thêm một factSubscription như thế này:

fact_ins_subscription

13

Tôi nhận thấy rằng tôi đang trả lời một bài đăng cũ, nhưng tôi không hài lòng với một trong các câu trả lời được cung cấp. Tôi cảm thấy không trả lời câu hỏi.

Giản đồ có thể có một hoặc nhiều sự kiện, nhưng những sự kiện này không được liên kết bởi bất kỳ mối quan hệ chính nào. Cách tốt nhất là không tham gia các bảng thực tế trong một truy vấn đơn lẻ vì bạn sẽ truy vấn cơ sở dữ liệu đã được chuẩn hóa/giao dịch. Do tính chất của nhiều người tham gia, vv - kết quả sẽ không chính xác nếu được thử.

Câu trả lời bạn đang tìm kiếm là bạn cần "khoan sâu" về cơ bản có nghĩa là bạn đang truy vấn từng bảng thực tế (lược đồ) một cách riêng biệt và hợp nhất các kết quả. Điều này có thể xảy ra bằng cách sử dụng SQl hoặc tốt hơn thông qua một công cụ báo cáo/phân tích mà bạn có thể tham chiếu kho dữ liệu. Thay vì sao chép các câu trả lời về cách làm việc này, tôi sẽ chỉ đạo tất cả mọi người đến hai bài báo rất tốt:

Three ways to drill across by Chris Adamson

Should of the Warehouse - Drilling Across by Ralph Kimball

+0

Trong khi các liên kết được tài liệu tham khảo tuyệt vời. Tôi không hiểu ý nghĩa của tác giả khi nói "Nhớ lại rằng sự kiện lấy từ nhiều bảng thực tế đòi hỏi phải xây dựng các truy vấn cẩn thận. Không thích hợp để nối hai bảng thực tế với nhau, cũng không liên kết chúng thông qua các thứ nguyên được chia sẻ. -Số sự thật, đếm ba lần, hoặc tệ hơn. " Có thể – bigdatamann

Các vấn đề liên quan