Tôi đang cố gắng xóa một số Dữ liệu mà tôi có từ tệp excel. Tệp chứa 7400 hàng và 18 cột, bao gồm danh sách khách hàng có địa chỉ và dữ liệu khác của họ. Vấn đề mà tôi đang gặp phải là một số thành phố bị viết sai chính tả làm sai lệch thông tin và gây khó khăn cho việc xử lý tiếp theo.Pandas thay thế nhiều giá trị cùng một lúc
SURNAME | ADDRESS | CITY
0 Jenson | 252 Des Chênes | D.DO
1 Jean | 236 Gouin | DOLLARD
2 Denis | 993 Boul. Gouin | DOLLARD-DES-ORMEAUX
3 Bradford | 1690 Dollard #7 | DDO
4 Alisson | 115 Du Buisson | IL PERROT
5 Abdul | 9877 Boul. Gouin | Pierrefonds
6 O'Neil | 5 Du College | Ile Bizard
7 Bundy | 7345 Sherbrooke | ILLE Perot
8 Darcy | 8671 Anthony #2 | ILE Perrot
9 Adams | 845 Georges | Pierrefonds
Trong ví dụ trên D.DO, Dollard, DDO phải được viết Dollard-DES-Ormeaux và IL Perrot, Ille Perot, Ile Perrot phải được viết Ile-Perrot.
tôi đã có thể thay thế các giá trị sử dụng:
df["CITY"].replace(to_replace={"D.DO", "DOLLARD", "DDO"}, value="DOLLARD-DES-ORMEAUX", regex=True)
df["CITY"].replace(to_replace={"IL PERROT", "ILLE PEROT", "ILE PERROT"}, value="ILE-PERROT", regex=True)
Có một số cách kết hợp các hoạt động trên vào một? Tôi đã thử:
df["CITY"].replace({to_replace={"D.DO", "DOLLARD", "DDO"}, value="DOLLARD-DES-ORMEAUX", to_replace={"IL PERROT", "ILLE PEROT", "ILE PERROT"}, value="ILE-PERROT"}, regex=True)
nhưng tôi đã không có may mắn