Tôi muốn vá một số dữ liệu văn bản được trích xuất từ các trang web. mẫu:Làm thế nào để đáp lại trong biểu thức chính quy Ruby (regex) với gsub khi tôi sử dụng nhóm?
t="First sentence. Second sentence.Third sentence."
Không có dấu cách sau điểm ở cuối câu thứ hai. Điều này cho tôi biết câu thứ 3 nằm trong một dòng riêng biệt (sau thẻ br) trong tài liệu gốc.
Tôi muốn sử dụng regexp này để chèn ký tự "\ n" vào vị trí thích hợp và sửa văn bản của tôi. regex của tôi:
t2=t.gsub(/([.\!?])([A-Z1-9])/,$1+"\n"+$2)
Nhưng tiếc là nó không hoạt động: "NoMethodError: Phương pháp xác định` +' cho nil: NilClass" Làm thế nào tôi có thể đúng backreference đến nhóm phù hợp? Thật dễ dàng trong Microsoft Word, tôi chỉ phải sử dụng \ 1 và \ 2 biểu tượng.
Tổng số được đánh số ('$ 1',' $ 2', ...) không được đặt khi đối số thứ hai được đánh giá, chúng được đặt bởi 'gsub' trước khi nó mang lại khối. Do đó, lời khuyên của sawa về thời điểm sử dụng ''\ 1'' và khi nào sử dụng' $ 1'. –