Tôi có một tệp văn bản rất dài mà tôi đang cố gắng xử lý bằng cách sử dụng Python.Python cho rằng tệp văn bản 3000 dòng là một dòng dài?
Tuy nhiên, đoạn mã sau:
for line in open('textbase.txt', 'r'):
print 'hello world'
chỉ sản xuất đầu ra sau đây:
hello world
Nó như thể Python cho rằng tập tin là chỉ có một dòng dài, mặc dù nó là nhiều ngàn dòng dài, khi được xem trong trình soạn thảo văn bản. Kiểm tra nó trên dòng lệnh bằng cách sử dụng tập tin lệnh cho:
$ file textbase.txt
textbase.txt: Big-endian UTF-16 Unicode English text, with CR line terminators
Có điều gì sai? Tôi có cần phải thay đổi các dòng terminator không?
OS gì là bạn không? –
@OP, tệp textbase.txt đến từ đâu? các cửa sổ? hãy thử làm một dos2unix trên tập tin và xem nó là giải quyết vấn đề – ghostdog74
@ jldupont: Tôi nghĩ AP257 dự kiến sẽ in ra "hello world" cho mỗi dòng của tập tin đầu vào, giống như mã nói :-) – paxdiablo