2013-03-13 27 views
5

Tôi đang cố gắng sử dụng fread để đọc một sự liên kết gen vào một data.table trong R. Đây là một bản chụp của các tập tin liên kết:đọc sợi (+, -) cột với fread, data.table gói

USI-EAS28:1:100:1786:674#0/1 + 1_maternal 68326824  CTCAATTATACTGAAAGAAACACAATATATCATA IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIII 0 
USI-EAS28:1:100:1786:940#0/1 + 16_maternal 11407541 CTATTAGTGACCTGCTGTGGGACCTTGGGATGGT IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIII 0 
USI-EAS28:1:100:1786:705#0/1 + 1_maternal 63849584 CTGAGGGTTTGTGTCAGGAAGGGGTGTGGAATTG IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIII 0 0:T>C 
USI-EAS28:1:100:1786:1168#0/1 - 5_maternal 31381649 GCATCATTCATGAAACAATTTTCAAGAGAGGAAA IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIII 0 
USI-EAS28:1:100:1787:582#0/1 + 10_maternal 54587781 CTACAATAATAATAGGGGACTAAAACACCCCACT IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIII 0 
USI-EAS28:1:100:1787:62#0/1 + 10_maternal 70390747  CTATTTGCTACTGAATTGTTAATTTTAAAACAGT IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIII 0 
USI-EAS28:1:100:1788:573#0/1 - 7_maternal 92583837  CACTGTCAACATTAGACAGACCAATGAGACAAAG IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIII 0 
USI-EAS28:1:100:1788:854#0/1 + 7_maternal 129611206 GTTTGTTTTTTTTTTTGAGATGGAGTCTCATTTT IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIII 0 32:C>T 
USI-EAS28:1:100:1788:185#0/1 - 13_maternal 23694307 CAAACAAACTCAAAATGGACTATCGACTGAAAAA IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIII 0 
USI-EAS28:1:100:1788:1339#0/1 - 13_maternal 33699510 TTAACTCTAGTTTTTAGGGATTGCAAATTAGACG IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIII 0 0:A>G 

Cột thứ hai báo cáo chuỗi mà bản đồ được sắp xếp theo (+ là chuyển tiếp, - là ngược lại). Thật không may fread đang cố gắng đọc cột này thành một số nguyên, gán giá trị luôn luôn cho 0. Cột này nên được đọc như một ký tự, hoặc thậm chí là một boolean, cho rằng vấn đề. Cố gắng chơi với các đối số sepsep2 không giúp ích gì.

Trả lời

3

Cảm ơn bạn đã báo cáo. Bây giờ cố định trong v1.8.9 cam kết 849. +- hiện được đọc là ký tự, kiểm tra được thêm vào.

Btw, chúng tôi cũng có ý định thêm colClasses để bạn có thể ghi đè loại cột fread phát hiện. Danh sách nổi bật cần làm liên quan đến fread nằm ở đầu tệp nguồn tại đây:
https://r-forge.r-project.org/scm/viewvc.php/pkg/src/fread.c?view=markup&root=datatable

+0

Cảm ơn bạn, Matthew. Thực ra colClasses là thứ đầu tiên xuất hiện trong tâm trí bạn, nhưng như bạn đã biết, nó chỉ hoạt động như một đối số để đọc được. mong đợi nó cũng là một cuộc tranh luận để fread! –

+0

@AlvaroGonzalez Xin chào. Không cần đến 'colClasses'. Nếu không có chữ số nào sau ký tự '+' hoặc '-', nó sẽ đọc nó dưới dạng' ký tự'. Có sẵn từ [R-Forge repo] (https://r-forge.r-project.org/R/?group_id=240) thường trong vòng vài giờ (khi nó nói rev 849 và trạng thái: hiện tại). –

+0

Nó chạy rất nhanh, @MatthewDowle. Cảm ơn bạn rất nhiều. –

Các vấn đề liên quan