Có lẽ mẫu số chung là "giải quyết vấn đề".
Ngoài ra, tôi nghi ngờ tôi nghi ngờ tôi có thể cung cấp bất kỳ cái nhìn sâu sắc, nhưng tôi ít nhất có thể cung cấp một câu trả lời hạn chế từ kinh nghiệm cá nhân.
Vấn đề này phát sinh đối với chúng tôi khi thuê - tức là, chúng tôi thuê một lập trình viên và dạy họ thống kê hay chúng tôi thuê người thống kê và dạy họ lập trình? Lý tưởng nhất là chúng ta có thể tìm thấy một người thông thạo cả hai môn, và quả thực, đó là mạng thứ ba mà chúng ta bỏ, nhưng hiếm khi thành công.
Đây là một ví dụ. Sự khác biệt ổn định nhất giữa hai hoạt động này (phần mềm dev & phân tích thống kê) có lẽ là kết quả đầu ra tương ứng của chúng, hoặc phân phối dự án. Ví dụ, trong nhóm của tôi, một người nào đó đang tiến hành phân tích thống kê về kết quả của các thí nghiệm giai đoạn và giai đoạn thử nghiệm của chúng tôi (ví dụ: từ kết quả t-test, cho dù sự khác biệt là đáng kể hay liệu thử nghiệm có nên tiếp tục) hay không. Phân tích đó sẽ được gửi đến bộ phận tiếp thị mà họ sẽ sử dụng để sửa đổi các trang web bao gồm Trang web với quan điểm hướng tới cải thiện chuyển đổi.Nhiệm vụ thứ hai liên quan đến việc trừu tượng hóa và tự động hóa một phần các phân tích đó để kết quả có thể được xử lý trong thời gian gần thực.
Đối với nhiệm vụ đầu tiên, chúng tôi sẽ chỉ định một thống kê; cho người thứ hai, một lập trình viên. Vấn đề kinh doanh mà chúng ta đang cố gắng giải quyết là giống nhau cho cả hai nhiệm vụ, nhưng đầu tiên, mấu chốt là thống kê, thứ hai, các vấn đề thống kê đã được giải quyết phần lớn và mấu chốt là nhiệm vụ lập trình lõi (I/O).
Cũng chú ý đến sự phát triển của các công cụ liên quan đến hai hoạt động đã phát triển như thế nào để phân biệt giữa hai phần mềm (phân tích phần mềm &): các ngôn ngữ phát triển chủ đạo đang được sử dụng như các công cụ phân tích theo tên miền , đồng thời, các khung công tác tiếp tục được phát triển, cho phép các nhà phát triển không xây dựng nhanh các ứng dụng có trọng lượng, nhiệm vụ theo định hướng trong DSL. Ví dụ, python, một ngôn ngữ phát triển mục đích chung có R bindings (RPy2) cùng với trình thông dịch tương tác nguyên gốc (IDLE), tạo điều kiện thuận lợi cho việc sử dụng Python trong phân tích thống kê, đồng thời, có một xu hướng rõ ràng trong phát triển gói R hướng tới phát triển ứng dụng (web): R Ràng buộc cho Qt, gWidgetsWWW và RApache - là tất cả các gói R hướng đến khách hàng hoặc phát triển ứng dụng web và bản phát hành ban đầu của tôi là (tôi nghĩ) trong 18 tháng qua . Bên cạnh đó, vì ít nhất là quý cuối cùng của năm ngoái, tôi đã nhận thấy tần suất tăng tốc của các bài đăng trên blog, bản trình bày, v.v. về chủ đề phát triển ứng dụng web trong R.
Cuối cùng, tôi tự hỏi nếu câu hỏi của bạn có lẽ là bằng chứng về sự phổ biến ngày càng tăng của R. Đây là ý tôi. Một thập kỷ trước, khi chủ lao động của tôi mua một giấy phép trang web, tôi bắt đầu học và sử dụng một trong những sản phẩm máy tính thống kê chính (không có điểm nào ở đây để nói cái nào, nó bắt đầu bằng chữ "S"). tôi thấy nó không tự nhiên và không linh hoạt. Không giống như Perl (mà tôi đang sử dụng vào thời điểm đó) công cụ này không phải là một phần mở rộng của bộ não của tôi (mà không phải là một thuộc tính tùy chọn của một công cụ phân tích, với tôi nó là nhiều hơn hoặc ít hơn định nghĩa của một). Tương tác với hệ thống này giống như sử dụng máy bán hàng tự động - tôi đã chọn một số chức năng thống kê mà tôi muốn và sau đó đợi "đầu ra", thường là một bộ biểu đồ và bảng đầy màu sắc, có tác động cao. Gần như luôn luôn mặc dù những gì tôi muốn là để sửa đổi đầu vào của tôi hoặc sử dụng đầu ra đó cho bước phân tích tiếp theo. Điều đó dường như yêu cầu một chuyến đi riêng biệt đến máy bán hàng tự động. Thực tế là công cụ này đã được nhận thức theo ngữ cảnh - tức là, nó biết thống kê - trong khi Perl không, không bù đắp cho sự tương tác khó xử. Phân tích thống kê được thực hiện theo cách này sẽ không bao giờ bị lẫn lộn với phát triển phần mềm. (Một lần nữa, đây chỉ là một bản tóm tắt kinh nghiệm của riêng tôi, tôi không tuyên bố nó có thể được trừu tượng hóa. Nó cũng không phải là một đại dịch chống lại bất kỳ (hoặc tất cả) các nền tảng phân tích dữ liệu thương mại - hàng triệu người sử dụng chúng và chúng kiếm được hàng tỷ những người tạo ra chúng, vì vậy chúng ta hãy giả sử đó là những hạn chế của riêng tôi gây ra sự thất bại trong việc liên kết.)
Tôi chưa bao giờ nghe nói đến R cho đến khoảng 18 tháng trước, và tôi chỉ phát hiện ra nó trong khi quét PyPI (Giao diện Web) tới kho lưu trữ gói bên ngoài của Python) cho các thư viện thống kê cho python. Có tôi đi qua RPy, mà dường như rực rỡ nhưng yêu cầu một phụ thuộc được gọi là "R" (RPy tất nhiên thực sự chỉ là một tập hợp các ràng buộc Python để R).
Có lẽ R kháng cáo cho người lập trình và không lập trình bình đẳng, vẫn còn cho một lập trình viên/nhà phân tích, đây là một ơn trời. Nó đánh vào mọi thứ trong danh sách mong muốn của tôi cho một nền tảng phân tích dữ liệu: một công cụ dựa trên một ngôn ngữ lập trình tổng quát đầy đủ tính năng (trong trường hợp này là hậu duệ đã được chứng minh), một mô hình chức năng cơ bản, trình thông dịch tương tác tích hợp, dữ liệu gốc các loại được xây dựng từ đầu để phân tích dữ liệu và kiến thức về miền được đưa vào. Phân tích dữ liệu trở nên giống mã hóa hơn. Cuộc sống là tốt.
cho một điều, tôi không thể tưởng tượng một nhà phân tích thống kê băng keo! :) – RYFN
Là một nhà thống kê, tôi có thể ...: D –
Chính xác thì ý của bạn là gì khi bạn nói "điều này nghe có vẻ giống như xây dựng một phân tích thống kê"?Nếu bạn đang đề cập đến giai đoạn thì mỗi "ngành công nghiệp" đi qua nhiều hay ít tương tự (ý tưởng, phân tích, nguyên mẫu, thiết kế, phát triển, thị trường, vv) giai đoạn. –