Tôi không yêu cầu ý kiến mà về các tài liệu.Thủ tục được lưu trữ hoặc mã số
Chúng tôi có rất nhiều tệp dữ liệu (XML, CSV, Plantext, v.v ...) và cần xử lý chúng, dữ liệu khai thác chúng.
Người cơ sở dữ liệu khách hàng tiềm năng đề xuất sử dụng quy trình được lưu trữ để thực hiện tác vụ. Về cơ bản, chúng tôi có một bảng dàn dựng nơi tệp được đăng theo thứ tự và được lưu vào một cột hoặc cột XML. Sau đó, từ đó ông đề xuất để tiếp tục sử dụng thủ tục lưu trữ để xử lý các tập tin.
Tôi là nhà phát triển ứng dụng có nền tảng db, phát triển ứng dụng nhiều hơn và tôi có thể thiên vị, nhưng việc sử dụng logic này trong DB có vẻ như một ý tưởng tồi và tôi không thể tìm thấy bất kỳ tài liệu nào để chứng minh hoặc không chấp thuận những gì tôi gọi là đặt một chiếc xe trên một đường ray xe lửa để kéo một tải trọng của hàng hóa. Vì vậy, các câu hỏi của tôi là: DB (Oracle, DB2, MySQL, SqlServer) hoạt động tốt như thế nào khi chúng ta nói về tìm kiếm biểu thức chính quy, tìm kiếm và thay thế dữ liệu trong một clob, dom traversal, đệ quy? So với một ngôn ngữ lập trình như Java, PHP, hoặc C# trên cùng một vấn đề.
Sửa
Vì vậy, những gì tôi đang tìm tài liệu về phân tích so sánh/thời gian chạy của một ngôn ngữ lập trình cụ thể so sánh với một DBMS, đặc biệt là cho tìm kiếm chuỗi và thay thế, tìm kiếm biểu hiện thường xuyên và thay thế. XML Dom traversal. Sử dụng bộ nhớ trên các cuộc gọi phương thức đệ quy. Và cụ thể là họ mở rộng như thế nào khi gặp phải 10 - 100 GB dữ liệu.
SP: s rất phù hợp cho việc lựa chọn và tập hợp. Họ dễ dàng trở thành một mớ hỗn độn không thể duy trì khi xử lý khác (chuỗi, phân tích cú pháp, toán học, vv) có liên quan. Hiệu suất thực sự là một vấn đề? – adrianm
Bảo trì không phải là một trong những mối quan tâm của tôi bởi vì nếu chúng tôi đã làm theo các tuyến đường của việc sử dụng SP, sau đó tôi không duy trì hệ thống, DBA là. Nhưng tôi không muốn đứng yên khi tôi thấy điều gì đó ngu xuẩn đang được thực hiện, vì vậy chỉ tranh luận với tôi hợp lệ với anh ấy là tôi có thể làm điều này tốt hơn và hiệu quả hơn vì biến bảo trì đã được lấy ra khỏi phương trình của tôi. – Churk
"khai thác dữ liệu" là một thuật ngữ quá tải. Nó có thể có nghĩa là bất cứ điều gì từ tính toán trung bình đến phương pháp thống kê phức tạp của $ O (n^3) $ hoặc thời gian chạy tồi tệ hơn. Xin hãy chính xác hơn. Bởi vì một số điều rõ ràng sẽ được dễ dàng để làm bằng cách sử dụng thủ tục được lưu trữ. Những người khác sẽ là một nỗi đau để làm theo cách này! –