2009-11-03 42 views

Trả lời

10

Html2Text có vẻ là một lựa chọn tốt

+0

trang này hoạt động rất tốt –

+0

Trang web không còn truy cập được nữa kể từ Aaron, tác giả không còn nữa. –

+1

nhưng mã có thể được tìm thấy trên https://github.com/aaronsw/html2text –

4

Dưới đây là một thư viện python mà không phân tích cú pháp HTML:

BeautifulSoup là một tùy chọn.

+2

Để tiết kiệm cho những người khác một khoảng thời gian từ Google trở lại SO, dưới đây là phần Hỏi & Đáp mô tả rằng Beautiful Soup không thực sự được duy trì nữa: [WebScraping with BeautifulSoup hoặc LXML.HTML] (http://stackoverflow.com/questions/5493514/webscraping-with-beautifulsoup-or-lxml-html). – sage

+1

Súp đẹp dường như được duy trì ngay bây giờ tôi nghĩ. – contrebis

Các vấn đề liên quan