Từ the documentation, phương pháp xoa bóp chỉ là cặp (regular expression, replacement function)
vì vậy tôi không nghĩ rằng đó thực sự là trường hợp sử dụng xoa bóp hoặc regexps.
ví dụ: để dọn dẹp comments bị thay đổi:
(re.compile('<!-([^-])'), lambda match: '<!--' + match.group(1))
Nếu bạn nhìn vào nguồn gốc của phương pháp trong BeautifulSoup.py bạn sẽ thấy rằng đây là chỉ cần chạy theo thứ tự so với đánh dấu:
for fix, m in self.markupMassage:
markup = fix.sub(m, markup)
Vì vậy, trong khi bạn có thể làm một số xử lý regexp của riêng bạn trước khi BeautifulSoup được nhìn thấy đánh dấu bạn có lẽ tốt hơn kết hợp bất kỳ dọn dẹp bổ sung cần thiết với xây dựng mặc định MARKUP_MASSAGE
như được hiển thị trong câu trả lời Oli's.