Tôi có một tập dữ liệu với khoảng 2 triệu hàng, vì vậy mà không đọc toàn bộ tập dữ liệu tôi muốn đọc một tập hợp con của tập dữ liệu. Tập dữ liệu của tôi chứa cột ngày tháng trong đó vì vậy tôi chỉ muốn đọc tập dữ liệu giữa phạm vi ngày mà không đọc toàn bộ tập dữ liệu vì sẽ mất nhiều thời gian và lãng phí bộ nhớ. vậy làm thế nào để thực hiện nó có thể bất cứ ai hướng dẫn tôi về điều này?Làm thế nào để đọc một tập con của tập dữ liệu lớn trong R?
Trả lời
Sử dụng skip=
tham số trong read.table
read.table("file.txt",skip= ,nrows=)
Cả skip=
và nrows=
mất với số lượng chỉ số hàng vì vậy chỉ cần thêm chúng sau =.
nrows=
xác định mức độ sâu khi bạn nhập tệp.
Tôi khuyên bạn nên đọc https://stat.ethz.ch/R-manual/R-devel/library/utils/html/read.table.html nếu bạn chưa làm như vậy.
Ngoài ra, xin vui lòng xem một trong những câu hỏi của tôi:
R - Reading lines from a .txt-file after a specific line
Nó, phần nào, chạm vào cùng một chủ đề.
Cách thể khác có thể được sử dụng trong grep()
skip=
read.table(...,skip=grep("2005-12-31", readLines("File.txt")),nrows=365)
gì dòng này không là nó bỏ qua cho đến khi nó tìm thấy dòng miêu tả trong grep()
và đọc các dòng sau đó. Các nrow=
sẽ ngừng đọc sau khi nó đã đọc 365 dòng (theo cách này bạn đã đọc một năm ngày cung cấp một dòng bằng một ngày).
Điều này có vẻ phức tạp, nhưng đó là cách duy nhất tôi biết cách giải quyết vấn đề này.
nhưng làm cách nào nó có thể hoạt động trong ngày? –
nếu tôi không biết ngày bắt đầu trong tệp làm cách nào tôi có thể đếm số hàng cần bỏ qua? –
Bạn có thể chỉ định một chút không? Bạn đang đọc loại tệp nào? Tiêu chí lựa chọn liên quan đến ngày bắt đầu đọc là gì? Ý tôi là, bạn phải có một số ý tưởng về những ngày bạn muốn nhập? Hay tôi đang thiếu thứ gì đó ở đây. –
- 1. Trích xuất tập con của khung dữ liệu trong R
- 2. Lỗi trong đọc trong tập dữ liệu vào R
- 3. tập con() của một vector trong R
- 4. Làm cách nào để biết khi nào tập dữ liệu của tôi trong R sẽ quá lớn?
- 5. R Làm thế nào để thay đổi một tập con của các hàng
- 6. làm thế nào để chuyển đổi tập tin xml vào một khung dữ liệu trong R
- 7. Làm thế nào để đọc dữ liệu từ một tập tin trong Lua
- 8. Tôi làm cách nào để đọc tập dữ liệu SAS?
- 9. Làm thế nào để xuất tập con phù hợp của cơ sở dữ liệu
- 10. Mẫu ngẫu nhiên của các hàng từ tập hợp con của một khung dữ liệu R
- 11. Làm thế nào để trích xuất một tập con của một bộ tuple trong một bộ dữ liệu mới?
- 12. Làm thế nào để tính toán tương quan của hai biến trong một tập dữ liệu khổng lồ trong R?
- 13. Tập dữ liệu lớn trên Sigma.js
- 14. Tải một số tập dữ liệu lớn trong Highcharts
- 15. Kết hợp không gian của các tập dữ liệu lớn
- 16. geom_smooth trên một tập hợp con của dữ liệu
- 17. Làm thế nào để lặp qua một tập dữ liệu lớn trong python mà không nhận được một MemoryError?
- 18. Gói khuyến nghị để xử lý tập dữ liệu rất lớn và học máy trong R
- 19. Highcharts tập hợp dữ liệu lớn nhóm
- 20. thực hiện PCA trên tập dữ liệu rất lớn trong R
- 21. Làm thế nào để chuyển một tập hợp con của tập hợp sang phương thức C#?
- 22. R tập hợp dữ liệu phân loại
- 23. xử lý tập dữ liệu đầu vào trong R Shiny
- 24. Làm cách nào để thêm tiêu đề vào tập dữ liệu trong R?
- 25. R: lặp qua khung dữ liệu giải nén tập hợp con của dữ liệu tùy thuộc vào ngày
- 26. R: nhập nhiều tập hợp dữ liệu
- 27. Làm thế nào để gán giá trị cho một tập con của một tensor trong tensorflow?
- 28. Làm thế nào để tạo một báo cáo khác nhau cho mỗi tập hợp con của một khung dữ liệu với đánh dấu R?
- 29. làm thế nào để đọc đạn từ tập tin RTF
- 30. Làm thế nào để đọc cuối của một tập tin kịch bản như một tập tin dữ liệu (Perl hoặc bất kỳ ngôn ngữ khác)
Đọc toàn bộ tập dữ liệu với 'fread' từ gói dữ liệu.table hoặc sử dụng gói sqldf. Xem thêm: http://stackoverflow.com/q/1727772/1412059 – Roland