Đây là sự theo dõi và biến chứng cho câu hỏi này: Extracting contents of a string within parentheses.Sử dụng regex để trích xuất thông tin từ một chuỗi
Trong câu hỏi mà tôi đã có chuỗi sau -
"Will Farrell (Nick Hasley), Rebecca Hall (Samantha)"
Và tôi muốn để có được một danh sách các bản ghi trong các hình thức (actor, character)
-
[('Will Farrell', 'Nick Hasley'), ('Rebecca Hall', 'Samantha')]
Để khái quát vấn đề, tôi có một chuỗi phức tạp hơn một chút và tôi cần trích xuất cùng một thông tin. Chuỗi tôi có là -
"Will Ferrell (Nick Halsey), Rebecca Hall (Samantha), Glenn Howerton (Gary),
with Stephen Root and Laura Dern (Delilah)"
Tôi cần phải định dạng này như sau:
[('Will Farrell', 'Nick Hasley'), ('Rebecca Hall', 'Samantha'), ('Glenn Howerton', 'Gary'),
('Stephen Root',''), ('Lauren Dern', 'Delilah')]
Tôi biết tôi có thể thay thế các từ phụ (với, và, &, vv), nhưng có thể không tìm ra cách để thêm một mục trống - ''
- nếu không có tên ký tự cho diễn viên (trong trường hợp này là Stephen Root). Điều gì sẽ là cách tốt nhất để thực hiện việc này?
Cuối cùng, tôi cần đưa vào tài khoản nếu một diễn viên có nhiều vai trò và tạo một bộ tuple cho mỗi vai trò mà nam diễn viên có. Chuỗi thức tôi có là:
"Will Ferrell (Nick Halsey), Rebecca Hall (Samantha), Glenn Howerton (Gary, Brad), with
Stephen Root and Laura Dern (Delilah, Stacy)"
Và tôi cần phải xây dựng một danh sách các hàng như sau:
[('Will Farrell', 'Nick Hasley'), ('Rebecca Hall', 'Samantha'), ('Glenn Howerton', 'Gary'),
('Glenn Howerton', 'Brad'), ('Stephen Root',''), ('Lauren Dern', 'Delilah'), ('Lauren Dern', 'Stacy')]
Cảm ơn bạn.
@ Michael: cảm ơn bạn đã chỉnh sửa chính tả. – David542
Sử dụng regex có thực sự cần thiết không? – utdemir
Không, nó có thể là bất cứ điều gì. Bất cứ điều gì làm việc và là tốt nhất. – David542