Tôi đang thiết lập đường ống trong Nhà máy dữ liệu Azure, với mục đích lấy tệp phẳng từ bộ nhớ và tải chúng vào bảng trong Azure SQL DB.Tìm hiểu thời gian bắt đầu và kết thúc trong đường ống nhà máy dữ liệu Azure
Mẫu cho đường ống này chỉ định rằng tôi cần thời gian bắt đầu và kết thúc, trong đó the tutorial nói để đặt thành 1 ngày.
Tôi đang cố gắng hiểu điều này. Nếu nó là một công việc CRON trong Linux hoặc nhiệm vụ theo lịch trình trong Windows Server, thì tôi chỉ đơn giản nói với nó khi bắt đầu (tức là hàng ngày lúc 6 giờ sáng) và sẽ mất nhiều thời gian để hoàn thành.
Điều này dẫn tôi đến một số câu hỏi liên quan:
- Tại sao tôi cần phải chỉ định thời gian kết thúc?
- Nếu tôi không biết phải mất bao lâu để chạy?
- Nếu tôi đặt quá xa trong tương lai, tôi có gặp rủi ro về đường dẫn dữ liệu không hoàn thành đúng lúc không?
- Nếu tôi đặt quá sớm, đường dẫn có bị ngắt không?
- Tại sao nó cứng mã hoá như một ngày thay vì một tần số (tức là nó nói để sử dụng định dạng này - "2014-10-14T16: 32: 41Z")
tôi thấy a prior question mà tỏ một chút ánh sáng về cách làm tần số thay vì ngày được mã hóa cứng, nhưng câu hỏi của tôi ở trên vẫn chưa được giải đáp bởi giải pháp.
Xin chào @Sonia, có ý tưởng nào về cách thay đổi múi giờ trong nhà máy dữ liệu không? Nó hiện đang dựa trên UTC. – Ariox66
Tôi nghĩ rằng điều quan trọng bị thiếu ở đây là: khi bạn xác định thời gian bắt đầu và kết thúc và lịch trình, nó tạo trước một danh sách lớn các 'timeslices'. Vì vậy, nếu bạn có lịch trình hàng ngày trong 3 năm, nó sẽ tạo ra 3 mục nhập X 365 lần. Bạn có thể đi và làm việc với những thời gian cụ thể đó. Nếu bạn muốn chạy một công việc với một 'tham số timeslice' trong quá khứ bạn tìm thấy nó timeslice và chạy nó. Nếu bạn muốn chạy một trong tương lai để kiểm tra nó ... may mắn tôi không thể làm điều này để làm việc (mặc dù tôi vẫn đang học) –