Tôi đang làm việc trên dự án cào web và đã gặp sự cố với tốc độ. Để cố gắng khắc phục, tôi muốn sử dụng lxml thay vì html.parser làm trình phân tích cú pháp của BeautifulSoup. Tôi đã có thể thực hiện điều này:Đặt lxml làm trình phân tích cú pháp BeautifulSoup mặc định
soup = bs4.BeautifulSoup(html, 'lxml')
nhưng tôi không muốn phải liên tục nhập 'lxml'
mỗi lần tôi gọi BeautifulSoup. Có cách nào tôi có thể đặt trình phân tích cú pháp nào sẽ sử dụng một lần ở đầu chương trình của tôi không?
'lxml' * được * mặc định trong 'bs4', giả sử bạn đã' lxml' cài đặt. Vì vậy, trừ khi bạn tình cờ làm việc với BeautifulSoup3 ... – roippi
Tôi đang sử dụng bs4, nhưng tôi không biết cách kiểm tra trình phân tích cú pháp nào tôi hiện đang sử dụng. Cảm ơn bạn! –