Tôi có khung dữ liệu gấu trúc sau. vì lợi ích của sự đơn giản, cho phép giả định nó chỉ có hai cột: id
và search_term
tránh regex trong gấu trúc str.replace
id search_term
37651 inline switch
tôi làm:
train['search_term'] = train['search_term'].str.replace("in."," in. ")
mong rằng các số liệu trên là không bị ảnh hưởng, nhưng tôi nhận được để đổi lấy số liệu này :
id search_term
37651 in. in. switch
có nghĩa inl
được thay thế bằng in.
và ine
là replac ed bởi in.
, như thể tôi đang sử dụng cụm từ thông dụng, trong đó dấu chấm có nghĩa là bất kỳ ký tự nào.
Làm thế nào để xác định lại lệnh đầu tiên do đó, theo nghĩa đen, in.
được thay thế bằng in.
nhưng bất kỳ in
không theo sau bởi một dấu chấm là bị ảnh hưởng, như trong:
a = 'inline switch'
a = a.replace('in.','in. ')
a
>>> 'inline switch'
bạn là gì thực tế kết quả mong muốn? –
xin lỗi, tôi muốn thay thế 'dấu chấm' theo nghĩa đen. Tôi đã đăng câu trả lời dưới đây vì tôi đã tìm thấy một bài đăng tốt trên cụm từ thông dụng cho 'dấu chấm'. vấn đề là str.replace() trong một dataframe sử dụng regex –