Tôi đang xây dựng kho dữ liệu đầu tiên của mình trong SQL 2008/SSIS và tôi đang tìm kiếm một số phương pháp hay nhất xung quanh việc tải các bảng thực tế.SQL/SSIS DataWareHouse Tải bảng thực tế, thực tiễn tốt nhất?
Hiện tại trong DW của tôi, tôi có khoảng 20 Kích thước (Văn phòng, Nhân viên, Sản phẩm, Khách hàng, v.v.) thuộc loại SCD Loại 1. Trong cấu trúc dw của tôi, có một vài điều tôi đã áp dụng:
- Không Nulls (thay thế bằng trống cho văn bản hoặc 0 cho số trong dàn)
- thành viên chủ chốt chưa biết dân cư ở mỗi chiều (SK ID 0)
- UPSERT cho Loại SCD 1 tải từ sân khấu để bàn sản xuất
- SELECT DISTINCT để tải của tôi về kích thước
trong dự án bốc SSIS Fact của tôi, phương pháp hiện tại tôi đã cho kích thước tải là có nhiều lần tra cứu (20+) cho mỗi DIM, sau đó điền bảng FACT với dữ liệu.
Đối tra cứu của tôi, tôi thiết lập:
- Full cache
- Bỏ qua thất bại cho "không có bài phù hợp với"
- Transformation Xuất phát với "ISNULL (surrogate_idkey) 0: surrogate_idkey" cho mỗi SK để nếu tra cứu thất bại họ sẽ mặc định SK ID 0 (thành viên không xác định).
- Một số tra cứu không gian của tôi có nhiều hơn một doanh nghiệp chủ chốt
Đây có phải là phương pháp tốt nhất? Hình ảnh được đính kèm để trợ giúp với mô tả của tôi ở trên.
Cảm ơn Banton, hiện tại chúng tôi đang tải (đầy đủ bãi) bản ghi 4m chứa khoảng 200 cột; và khoảng 2k hàng hồ sơ mới mỗi ngày; giai đoạn tải khá nhanh. Cảm ơn vì bạn đã phản hồi. – exxoid
[Vui lòng THEO D ,I, SỬ DỤNG VÀ CHIA SẺ sáng kiến dành cho trang web BI chuyên dụng.] (Http://area51.stackexchange.com/proposals/70503/business-intelligence?referrer=EPHSm8-3avvaMxLjdRIeNg2). Lần đầu tiên tôi đưa ra câu hỏi này trong [Meta khi không có đề xuất trang web BI.] (Http://meta.stackexchange.com/q/232414/201662) – bonCodigo