Có vẻ như bạn đang hỏi hai câu hỏi riêng biệt. Một câu hỏi liên quan đến quy trình làm việc và các mối quan tâm khác bằng cách sử dụng ESS. Khi tôi sử dụng StatET và Eclipse, tôi sẽ chỉ chia sẻ kinh nghiệm của mình về khía cạnh luồng công việc của câu hỏi của bạn.
Như với Vincent Tôi cũng làm theo một cái gì đó giống như việc đặt ra bởi Josh Reich đây (xem thêm ý kiến hữu ích của Hadley): Workflow for statistical analysis and report writing
Mặc dù nó có thể khác nhau giữa các dự án, tôi có xu hướng để có một vài chính R file
- import.R: đây nhập khẩu tập tin dữ liệu và thực hiện bất kỳ làm sạch cần thiết và thao tác
- analyse.R: này tạo ra sản lượng mà tôi cần cho bất kỳ báo cáo cuối cùng
- chính.R: Điều này gọi là import.R và phân tích.R
Mục đích là nhập.R. và phân tích.R để thể hiện quy trình hoàn chỉnh và cuối cùng để tạo kết quả cuối cùng của bất kỳ phân tích nào.
Trong điều khoản của một cấu trúc thư mục cho một dự án phân tích, tôi sẽ thường xuyên cũng có các thư mục sau
- dữ liệu: để lưu trữ bất kỳ tập tin dữ liệu thô
- meta: để lưu trữ meta dữ liệu, chẳng hạn như các nhãn biến, hệ thống tính điểm để kiểm tra, ghi lại thông tin, v.v.
- đầu ra: để lưu trữ bất kỳ đồ họa, bảng hoặc văn bản nào được tạo bởi phân tích của tôi mà tôi có thể muốn để kết hợp vào một chương trình bên ngoài
- temp: Khi khám phá dữ liệu và phân tích động não, tôi muốn nhập mã vào tệp thay vì sử dụng bảng điều khiển. Tôi có xu hướng nhãn các temp1.R, temp2.R, temp3.R. Tôi lưu trữ chúng trong một thư mục tạm thời. Bằng cách đó tôi có một hồ sơ vĩnh viễn dễ dàng truy cập. Nếu các phân tích trở thành cuối cùng chúng được kết hợp vào một trong các tệp R chính (ví dụ: import.R hoặc analysis.R)
- functions: Nếu tôi nghĩ rằng một chức năng sẽ cần thiết trong một vài dự án, tôi thường đặt nó một chức năng cho mỗi tập tin hoặc một tập hợp các chức năng liên quan trong một tập tin trong một thư mục được gọi là chức năng. Điều này làm cho nó tương đối dễ dàng để tái sử dụng các chức năng trên các dự án, khi các yêu cầu chính thức của phát triển gói là nhiều hơn cần thiết.
- thư viện: Nếu tôi muốn tạo một số chức năng chung mà tôi nghĩ rằng sẽ là dự án cụ thể, tôi sẽ đặt chúng trong thư mục này
- tiết kiệm: Một thư mục để lưu trữ bất kỳ lưu R đối tượng
StatET và Eclipse giúp dễ dàng tương tác với hệ thống tệp như vậy. Tất nhiên, với tất cả R gurus sử dụng ESS và Emacs, tôi chắc chắn nó cũng xử lý tương tác với hệ thống tập tin tốt.
Nguồn
2010-06-13 08:14:32
Xem thêm http://stats.stackexchange.com/questions/10987 và http://stats.stackexchange.com/questions/2910 – naught101