Tôi đã tìm thấy rất nhiều ví dụ để thay thế văn bản trong các tệp bằng regex. Tuy nhiên, tất cả đều có hai phiên bản:
1. Lặp lại tất cả các dòng trong tệp và áp dụng regex cho mỗi dòng đơn
2. Tải toàn bộ tệp.Tìm kiếm nhiều dòng regex trong toàn bộ tệp
No. 2 Không khả thi khi sử dụng tệp "của tôi" - chúng khoảng 2GiB ...
Đến số 1: Hiện tại đây là cách tiếp cận của tôi, tuy nhiên tôi tự hỏi ... Điều gì sẽ xảy ra nếu cần áp dụng một regex bao trùm nhiều hơn một dòng?
Có thể tải dữ liệu này vào RDBMS không? –
Tôi nghĩ bạn sẽ cần phải mô tả dữ liệu của bạn và regex tốt hơn để có được một đề xuất phong nha. –
ok. Làm rõ ít: Thường thì tôi cần sửa đổi các tệp csv lớn. (ví dụ: chuyển đổi col 3 và 5) Tôi đã thấy rằng, sử dụng regex và sed, tôi có thể áp dụng các sửa đổi cần thiết thật nhanh. Tuy nhiên tôi "phát triển" và kiểm tra regex của tôi bằng cách sử dụng The Regulator, mà sẽ dẫn đến "clr-regex" mà sau đó phải được dịch thành cú pháp sed. Để tránh điều này tôi đã viết một công cụ nhỏ (C#), cho phép tôi áp dụng "clr-regex" vào một tập tin. NGAY BÂY GIỜ: Sử dụng công cụ này, bạn không thể áp dụng regex trải rộng trên nhiều dòng - vì tôi đang thực hiện phương pháp được đề cập ở trên không. 1. Câu hỏi trên có phần giả định. – Nils