Vấn đề với giải pháp đơn giản nhất gsub(/\s+/, ' ')
là nó là rất chậm, vì nó thay thế tất cả các không gian, ngay cả khi nó là duy nhất. Nhưng thường có 1 khoảng cách giữa các từ và chúng ta chỉ nên sửa khi có 2 hoặc nhiều khoảng trắng trong chuỗi.
Better giải pháp là gsub(/[\r\n\t]/, ' ').gsub(/ {2,}/, ' ')
- đầu tiên thoát khỏi khoảng trắng đặc biệt và sau đó bóp không gian bình thường
def method1(s) s.gsub!(/\s+/, ' '); s end
def method2(s) s.gsub!(/[\r\n\t]/, ' '); s.gsub!(/ {2,}/, ' '); s end
Benchmark.bm do |x|
n = 100_000
x.report('method1') { n.times { method1("Lorem ipsum\n\n dolor \t\t\tsit amet, consectetur\n \n\t\n adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum.") } }
x.report('method2') { n.times { method2("Lorem ipsum\n\n dolor \t\t\tsit amet, consectetur\n \n\t\n adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum.") } }
end;1
# user system total real
# method1 4.090000 0.010000 4.100000 ( 4.124844)
# method2 1.590000 0.010000 1.600000 ( 1.611443)
Nguồn
2016-02-16 15:41:45
Đây là câu trả lời đúng và một tên đẹp, tôi có thể thêm . :) –