Tôi đã thực sự đấu tranh để biến SQL Server thành một cái gì đó, thẳng thắn, nó sẽ không bao giờ. Tôi cần một công cụ cơ sở dữ liệu cho công việc phân tích của tôi. DB cần phải nhanh chóng và KHÔNG cần tất cả việc ghi nhật ký và chi phí khác được tìm thấy trong các cơ sở dữ liệu điển hình (SQL Server, Oracle, DB2, v.v.)Các cửa hàng cột: So sánh các cơ sở dữ liệu dựa trên cột
Hôm qua tôi đã nghe Michael Stonebraker speak at the Money:Tech conference và tôi cứ nghĩ, "Tôi không Thật là điên rồ. Có cách nào tốt hơn! " Ông nói về việc sử dụng column stores thay vì cơ sở dữ liệu định hướng hàng. Tôi đã đi đến trang Wikipedia cho column stores và tôi thấy một vài dự án nguồn mở (mà tôi thích) và một vài dự án thương mại/nguồn mở (mà tôi không hiểu đầy đủ).
Câu hỏi của tôi là: Trong môi trường phân tích được áp dụng, cách khác nhau của cột dựa trên DB khác nhau? Làm thế nào tôi nên suy nghĩ về họ? Bất cứ ai cũng có kinh nghiệm thực tế với nhiều hệ thống dựa trên cột? Tôi có thể tận dụng trải nghiệm SQL của mình với các DB này không hay tôi có phải học một ngôn ngữ mới không?
Tôi cuối cùng sẽ lấy dữ liệu vào R để phân tích.
EDIT: Tôi đã được yêu cầu làm rõ một số chính xác những gì tôi đang cố gắng thực hiện. Vì vậy, đây là một ví dụ về những gì tôi muốn làm: Tạo một bảng có 4 triệu hàng và 20 cột (5 mờ, 15 sự kiện). Tạo 5 bảng tổng hợp tính tối đa, phút và trung bình cho mỗi sự kiện. Tham gia 5 tập hợp đó trở lại bảng bắt đầu. Bây giờ tính toán độ lệch phần trăm từ trung bình, độ lệch phần trăm của min và độ lệch phần trăm từ mức tối đa cho mỗi hàng và thêm nó vào bảng gốc. Dữ liệu bảng này không nhận được hàng mới mỗi ngày, nó được thay thế hoàn toàn và quá trình được lặp lại. Trời cấm nếu quá trình này phải được dừng lại. Và các bản ghi ... ohhhhh các bản ghi! :)
Công cụ ETL dễ sử dụng nhất cho LucidDB là gì? Ấm đun nước? –
JD, cuối cùng bạn đã thử dùng LucidDB từ R chưa? Liệu cách RJDBC làm việc liên tục với LucidDB? Quan tâm để biết kinh nghiệm của bạn. –
Tôi đã viết so sánh các cơ sở dữ liệu định hướng cột khác nhau tại đây: http://www.timestored.com/time-series-data/column-oriented-databases –