Có một số gói có sẵn để sử dụng cụm từ thông dụng trong Haskell (ví dụ: Text.Regex.Base, Text.Regex.Posix, v.v.). Hầu hết các gói Tôi đã nhìn thấy cho đến nay sử dụng một tập hợp con của Regex tôi biết, mà tôi muốn nói: Tôi đang sử dụng để chia một câu diễn tả bằng lời với Regex sau:Tách từ bằng các cụm từ thông dụng trong Haskell
\\w+
Gần như tất cả các gói trong Haskell tôi đã cố gắng để đến nay không hỗ trợ điều này (ít nhất là đề cập trước đó và Text.Regex.TDFA không). Tôi biết rằng với Posix việc sử dụng [[: word:] +] sẽ có tác dụng tương tự, nhưng tôi muốn sử dụng biến thể được đề cập ở trên.
Từ có hai câu hỏi:
- Có bất kỳ gói lưu trữ đó?
- Nếu thực sự có, tại sao có cách sử dụng phổ biến khác?
- Lợi thế hoặc bất lợi là gì?
Bạn có yêu cầu cụm từ thông dụng để tách các từ không? Có một hàm 'words' thực hiện chính xác những gì bạn muốn. –
Cảm ơn, tôi không biết chức năng đó nhưng nó không làm những gì tôi muốn. Nếu có bất kỳ dấu chấm, dấu phẩy, vv trong một chuỗi, Regex sẽ bỏ qua chúng, nhưng 'từ' sẽ đính kèm chúng. Ví dụ: 'Prelude> words" Just a simple test. "' Sẽ cho kết quả '[" Just "," a "," simple "," test. "]' Tôi muốn nó không có dấu chấm. – beyeran