Tôi muốn phát triển một ứng dụng trình đọc sách điện tử. Một số thư viện tốt có sẵn để phân tích các định dạng như .azw, .mobi, .pdf, v.v.Trình phân tích cú pháp điện tử (.azw, .mobi, epub)?
Trả lời
Như Ranhiru đã nói, here và here bạn có thể xem cách phân tích cú pháp tệp PDF. Tuy nhiên, Đối với .mobi
, không có thư viện, do đó, bạn sẽ phải tự phân tích cú pháp định dạng. Một đặc tả đầy đủ của định dạng có thể được đọc on the mobileread wiki.
Với .azw
tệp, nó khác: nếu sách điện tử Kindle không có DRM, thì định dạng của nó trùng với .mobi
, nghĩa là chúng hoàn toàn có thể hoán đổi cho nhau. Nếu không, nó rất khó để làm, vì bạn cũng sẽ phải tạo ra một PID Kindle và thực hiện de-DRM-ing của tập tin .azw
. Có hướng dẫn về cách thực hiện điều đó trên màn hình here. Tuy nhiên, nó là mạnh mẽ không được khuyến khích, vì nó phá vỡ toàn bộ điểm DRM và là bất hợp pháp khá nhiều ở khắp mọi nơi.
Đối với mobi không có hoàn thành tấm spec có sẵn, nhưng bạn nên trực tiếp nhảy vào định dạng PDB được mở rộng & sử dụng bởi MOBI
- 1. Trình phân tích cú pháp địa chỉ bưu điện Java
- 2. Kết hợp phân tích cú pháp phân tích cú pháp, phân tích cú pháp và phân tích cú pháp rừng
- 3. Trình tạo trình phân tích cú pháp và trình phân tích cú pháp cho Common Lisp
- 4. Phân tích html với trình phân tích cú pháp SAX
- 5. Sự khác biệt giữa trình phân tích cú pháp SAX XML, Kéo trình phân tích cú pháp & Trình phân tích cú pháp DOM trong android
- 6. Trình phân tích cú pháp email Java?
- 7. Chọn trình phân tích cú pháp Haskell
- 8. Trình phân tích cú pháp HTML
- 9. Trình phân tích cú pháp Wiki nào?
- 10. Cần trình phân tích cú pháp C++
- 11. Trình phân tích cú pháp SVG Python
- 12. Trình phân tích cú pháp phân tích cú pháp Haskell để gặp phải [...]
- 13. Tạo trình phân tích cú pháp Brainfuck, phương pháp phân tích cú pháp vòng lặp tốt nhất là gì?
- 14. Trình phân tích cú pháp phân tích cú pháp của scala có phân tích cú pháp các tệp nhị phân không?
- 15. Có trình phân tích cú pháp PDF cho PHP không?
- 16. PHP EDI X12 Phân tích cú pháp
- 17. libxml2 Phân tích cú pháp HTML
- 18. Phân tích cú pháp HTML trong perl
- 19. Phân tích cú pháp khối CDATA XML
- 20. Phân tích cú pháp xml bằng powershell
- 21. Tại sao không thể phân tích cú pháp C++ bằng trình phân tích cú pháp LR (1)?
- 22. Scala: Làm phẳng phân tích cú pháp (~) từ trình kết hợp bộ phân tích cú pháp thành Danh sách?
- 23. Máy tạo phân tích cú pháp và Ragel ... Làm cho trình phân tích cú pháp D của riêng tôi
- 24. Phân tích cú pháp đánh dấu wikimedia - các trình phân tích cú pháp dựa trên EBNF có phù hợp không?
- 25. xml.parsers.expat.ExpatError khi phân tích cú pháp XML
- 26. Phân tích cú pháp không phân tích cú pháp đúng cách ("href") trong IE
- 27. Phân tích cú pháp Ruby: phân tích cú pháp nhiều dòng
- 28. Không thể phân tích cú pháp html sử dụng lxml XPath phân tích cú pháp
- 29. Phân tích cú pháp dl với HtmlAgilityPack
- 30. Lỗi trình phân tích cú pháp Microsoft ASP.NET ReportViewer
Một số câu hỏi mà có thể hữu ích cho bạn. [This] (http://stackoverflow.com/questions/4665957/pdf-parsing-library-for-android) và [this] (http://stackoverflow.com/questions/4773576/are-there-any-free -pdf-parsing-libraries-that-work-in-android). –
cũng có, nhưng đó chỉ dành cho pdf. epub chỉ là một tập tin html nén để có thể được giải quyết tốt nhưng những người khác? – Richard
Trong khi tìm kiếm một thư viện có thể là giải pháp dễ nhất (không phán xét, tôi cũng sẽ tìm một giải pháp!), Nếu bạn không tìm được thư viện, hãy xem xét những tệp này thực sự là gì. Tại một số điểm, chúng là văn bản hoặc hình ảnh. Tìm hiểu điều gì phân biệt một định dạng với một định dạng khác. Ví dụ, Richard nói rằng epub được nén html. Vì vậy, giải nén nó và phân tích cú pháp html trong ứng dụng của bạn. Chắc chắn bạn có thể tìm thấy một thư viện phân tích cú pháp html. Có vẻ như nó sẽ hiệu quả hơn bạn mong đợi, nhưng nó sẽ là một bài tập tốt. Và hey, nếu bạn mã nó tốt, bạn có thể làm cho một thư viện ebook cho người khác sử dụng :) –