Ứng dụng trên máy tính của tôi cần đọc trong một tệp văn bản. Tôi có vài cái và một cái không hoạt động; chương trình không đọc nó và nói với tôi rằng có một nhân vật xấu trong đó đâu đó. Suy đoán đầu tiên của tôi là có một nhân vật không phải ascii ở đâu đó, nhưng tôi không biết làm thế nào để tìm ra nó. Perl hoặc bất kỳ regex chung nào sẽ tốt đẹp. Bất kỳ ý tưởng?tài liệu tìm kiếm cho non ascii
Trả lời
Bạn có thể sử dụng [^\x20-\x7E]
để khớp với một ký tự không phải ASCII.
ví dụ: grep -P '[^\x20-\x7E]' suspicious_file
Tôi đã gặp vấn đề khi sử dụng, vì nó cũng sẽ xác định tất cả các ký tự cuối dòng trong tệp của tôi. Kết hợp câu trả lời của bạn với Ruakh mặc dù đã làm việc như một sự quyến rũ: [^ \ t \ n \ r \ x20- \ x7E] – JMM
Trong trường hợp của tôi, [câu trả lời từ câu hỏi khác] (http://stackoverflow.com/a/ 882437/873282) là tốt hơn: '[\ xE0- \ xFF]' – koppor
perl -wne 'printf "byte %02X in line $.\n", ord $& while s/[^\t\n\x20-\x7E]//;'
sẽ tìm mọi ký tự không phải là ký tự ASCII, tab, dấu cách hoặc dòng mới.
Nếu báo cáo 0D
s (vận chuyển trả về) trong tệp O.K., sau đó thay đổi \t\n
thành \t\n\r
.
Nếu chỉ báo cáo 0D
trong các tệp không tốt, bạn có thể sửa các tệp đó bằng cách chạy dos2unix
trên chúng.
Chỉ cần một phụ lục, người ta nên chạy đầu vào như là đối số cuối cùng không được liệt kê. –
Như vậy, cảm ơn bạn! Tôi đã phải thay đổi nó một chút cho một giao diện điều khiển DOS: 'perl -wne" printf qq (byte% 02X trong dòng $. \ N), ord $ và trong khi s/[^ \ t \ n \ x20- \ x7E]//; "
Nếu bạn sử dụng tabulators trong mã nguồn của bạn là tốt, cố gắng mô hình này:
[^\x08-\x7E]
trình cũng trong Notepad ++
- 1. Làm cách nào để tìm kiếm trong Vim, sử dụng cụm từ thông dụng cho các chữ cái (cả ascii và non ascii)?
- 2. Tìm kiếm tài liệu trên các từ một phần
- 3. Tìm kiếm tài nguyên cho mã ICD-9
- 4. Non const vế trái tài liệu tham khảo
- 5. Tìm kiếm trình cắm thêm dữ liệu tốt cho jQuery
- 6. Tìm Tài liệu cho các Plugin TiddlyWiki
- 7. Tìm kiếm ví dụ hoặc tài liệu cho lib python wikidump
- 8. tìm kiếm solr cho các tài liệu mà một trường không tồn tại
- 9. Sharepoint Tìm kiếm tài sản trọng số
- 10. Fluent nhibernate auto increment non key (Id) tài sản
- 11. Tìm kiếm heuristic tốt cho tìm kiếm A *
- 12. Tìm kiếm dữ liệu Thesaurus
- 13. Tìm kiếm cơ sở dữ liệu cục bộ cho D2009 +
- 14. công cụ tìm kiếm nhẹ cho asp.net
- 15. Yêu cầu @DocumentId cho Tìm kiếm Hibernate?
- 16. pymongo tìm() vs MongoDB find(), pymongo tìm() cung cấp cho ít dữ liệu về tài liệu
- 17. Tìm kiếm Jira cho nhãn! =
- 18. Nơi tìm tài liệu cho Selenium WebDriver trong Ruby
- 19. Tôi có thể tìm tài liệu cho BlueZ ở đâu?
- 20. Tài liệu F # có cách tìm kiếm các chức năng theo loại của chúng không?
- 21. Tìm kiếm đàn hồi: Sắp xếp theo các giá trị của tài liệu lồng nhau '
- 22. Làm thế nào để lập trình tìm kiếm một tài liệu PDF trong C#
- 23. Tìm kiếm được lọc tìm kiếm cho các trường đối tượng phụ
- 24. Cách tìm kiếm và thay thế trong tài liệu ODT Open Office?
- 25. Tìm kiếm SharePoint không lập chỉ mục nội dung của thư viện tài liệu
- 26. Tìm tài liệu theo mảng DBRefs
- 27. Định cấu hình SOLR để tìm tài liệu nếu số nhiều được sử dụng trong tài liệu và số ít trong văn bản tìm kiếm?
- 28. MongoDB Tìm kiếm theo tên thuộc tính cho bất kỳ Tài liệu nào có thuộc tính đó
- 29. Làm cách nào để lưu trữ điểm định vị lat-lon trong tài liệu cho tìm kiếm GAE?
- 30. Tài liệu cho dữ liệu?
cậu thử làm gì cho đến nay? – nmagerko
Tôi tin rằng bạn có thể tìm thấy câu trả lời [ở đây] (http://stackoverflow.com/questions/881931/how-can-i-find-extended-ascii-characters-in-a-file-using-perl)? – Neilos
Tôi chấp nhận cà phê toán học bởi vì nó cực kỳ hiệu quả trong Notepad ++ –