Tôi cần chuyển đổi văn bản đánh dấu thành định dạng văn bản thuần để hiển thị tóm tắt trong trang web của mình. Tôi muốn mã trong python.Python: Cách chuyển đổi văn bản được định dạng markdown thành văn bản
22
A
Trả lời
36
Module này sẽ giúp làm những gì bạn mô tả:
http://www.freewisdom.org/projects/python-markdown/Using_as_a_Module
Một khi bạn đã chuyển đổi các markdown sang HTML, bạn có thể sử dụng một phân tích cú pháp HTML để loại bỏ các văn bản đơn giản.
Mã của bạn có thể trông như thế này:
from BeautifulSoup import BeautifulSoup
from markdown import markdown
html = markdown(some_html_string)
text = ''.join(BeautifulSoup(html).findAll(text=True))
2
nhận xét và loại bỏ nó vì cuối cùng tôi nghĩ rằng tôi thấy chà ở đây: Nó có thể được dễ dàng hơn để chuyển đổi văn bản markdown của bạn sang HTML và loại bỏ HTML từ các văn bản . Tôi không biết bất cứ điều gì để loại bỏ markdown từ văn bản một cách hiệu quả nhưng có rất nhiều HTML để giải quyết văn bản đơn giản.
Các vấn đề liên quan
- 1. Chuyển đổi văn bản sang định dạng số trong Excel
- 2. Postgres: Chuyển đổi varchar thành văn bản
- 3. Chuyển văn bản thành JSON
- 4. Cách chuyển đổi reStructuredText thành văn bản thuần túy
- 5. Chuyển đổi bảng HTML thành văn bản
- 6. Hiển thị hoặc chuyển đổi Html thành văn bản 'được định dạng' (.NET)
- 7. Chuyển đổi âm thanh thành văn bản
- 8. Chuyển đổi tất cả các trang người dùng Linux thành văn bản/html hoặc markdown
- 9. Có công cụ nào để chuyển đổi đánh dấu thành văn bản Wiki ở định dạng khác không
- 10. Python chuyển đổi html sang văn bản và bắt chước định dạng
- 11. Chuyển đổi trường ngày thành văn bản trong Excel
- 12. Cách thay đổi Định dạng của Ô thành Văn bản bằng cách sử dụng VBA
- 13. Chuyển đổi JPEG ở định dạng văn bản từ nguồn thư email trở lại thành JPEG
- 14. định dạng chiều rộng văn bản vim
- 15. Chuyển đổi một phần văn bản thành số thập phân
- 16. Chuyển chuỗi văn bản thành Bitmap
- 17. Văn bản có dạng thức ở dạng xem văn bản
- 18. Làm cách nào để chuyển đổi văn bản được định dạng "Western (Mac OS Roman)" thành UTF-8 bằng PHP?
- 19. Định dạng danh sách văn bản thành các cột
- 20. chuyển đổi văn bản trường thành Danh sách (văn bản) drupal 7
- 21. Cách lấy văn bản chính xác từ Chỉnh sửa văn bản và đặt thành dạng xem văn bản trong android
- 22. Chuyển đổi URL LibreOffice Calc thành văn bản
- 23. Perforce: Giữ Perforce thay đổi định dạng tệp văn bản
- 24. Gửi văn bản được định dạng bằng UCMA 2.0
- 25. Chuyển đổi ID thư của Windows thành văn bản
- 26. cách thêm văn bản có định dạng vào văn bản chỉnh sửa?
- 27. Định dạng văn bản giữ chỗ
- 28. Định dạng văn bản WPF trong GridViewColumn
- 29. Chuyển đổi và văn bản trong angular.js
- 30. Chuyển đổi giọng nói thành văn bản trong iphone
Không phải python, nhưng bạn có thể chuyển nó vào pandoc: 'pandoc --to = plain' để lại một số định dạng (tiêu đề undelines), nhưng không nhiều. – naught101