2010-09-24 31 views

Trả lời

11

Gnu sed sẽ có thể xử lý unicode. Hãy thử

$ echo 'Some StrAngÉ LeTTeRs 123' | sed -e 's/./\L\0/g' 
some strangé letters 123 
+0

giải pháp của bạn không làm việc cho nhân vật Thổ Nhĩ Kỳ I. Nó phải được chuyển thành ı thay vì tôi https://en.wikipedia.org/wiki/Dotted_and_dotless_I – zwlayer

2

Nếu bạn có thể sử dụng Python sau đó mã như vậy có thể giúp bạn:

import sys 
import codecs 

utf8input = codecs.getreader("utf-8")(sys.stdin) 
utf8output = codecs.getwriter("utf-8")(sys.stdout) 

utf8output.write(utf8input.read().lower()) 

Trên máy tính Windows của tôi (xin lỗi :) Tôi có thể sử dụng nó như là bộ lọc:

cat big.txt | python tolowerutf8.py > lower.txt3 
+0

Cảm ơn - cũng là một giải pháp tốt. – lzap

+2

Điều đó chắc chắn có nhiều mã so với 'in lc'C'-lSD '. – tchrist

Các vấn đề liên quan