Tôi đã tìm kiếm một cách để nắm bắt văn bản có cấu trúc (các phần, đoạn văn, nhấn mạnh, danh sách, v.v.) trong JSON, nhưng tôi chưa tìm thấy bất kỳ nội dung nào. Bất kỳ đề xuất? (Markdown vượt qua tâm trí của tôi, nhưng có thể có điều gì đó tốt hơn ở đó.)Văn bản có cấu trúc trong JSON
Trả lời
HTML là một cách được thiết lập tốt để mô tả văn bản có cấu trúc, theo định dạng thuần văn bản (!). Đánh dấu (như bạn đã đề cập) cũng sẽ hoạt động.
Quan điểm của tôi là đặt cược tốt nhất của bạn có thể sẽ sử dụng một số loại đánh dấu văn bản thuần túy như các lựa chọn đó và đặt văn bản của bạn trong một biến chuỗi JSON đơn. Tùy thuộc vào ứng dụng của bạn, nó có thể có ý nghĩa để có một mảng các phần, chứa một mảng các đoạn, có chứa một mảng các phần bình thường/đậm/danh sách, v.v. Tuy nhiên, trong trường hợp chung tôi nghĩ rằng các khối cũ tốt đánh dấu sẽ trớ trêu thay sẽ sạch hơn và dễ mở rộng hơn, do dễ dàng truyền chúng đi xung quanh và các thư viện được phát triển tốt để phân tích cú pháp toàn diện nếu/khi được yêu cầu.
Làm thế nào về một cái gì đó như thế này:
[ { "heading": "Foobar Example" },
{ "paragraph":
[
"This is normal text, followed by... ",
{ "bold": "some bold text" },
"etc."
]
}
]
Đó là:
sử dụng một chuỗi cho văn bản đơn giản không có định dạng hoặc khác mark-up;
sử dụng mảng bất cứ khi nào bạn muốn biểu thị chuỗi thứ tự các yếu tố văn bản nhất định;
sử dụng đối tượng trong đó khóa cho biết đánh dấu và giá trị thành phần văn bản mà định dạng được áp dụng.
Ngoài ra còn có vẻ là một đặc điểm kỹ thuật có thể thực hiện điều này Markdown Syntax for Object Notation (MSON)
Không chắc chắn nếu bạn cho nó có giá trị những rắc rối của việc thực hiện spec, nhưng nó có vẻ là một lựa chọn.
- 1. Xuất hiện văn bản không có cấu trúc trong NLTK
- 2. Văn bản chưa được cấu trúc cho dữ liệu có cấu trúc
- 3. Cấu trúc dữ liệu cho trình soạn thảo văn bản
- 4. bán cấu trúc C++ vào một tệp văn bản
- 5. Phân tích cú pháp tệp văn bản có cấu trúc bằng Python (pyparsing)
- 6. Đơn giản hóa cấu trúc JSON
- 7. Chuyển đổi cấu trúc Go thành JSON
- 8. Phân tích cú pháp dữ liệu văn bản có cấu trúc trong PHP
- 9. Lập chỉ mục có cấu trúc và không có cấu trúc - Lucene và Hbase
- 10. Sóng Google - cấu trúc cơ bản
- 11. Có phiên bản memcpy tiêu chuẩn, có cấu trúc không?
- 12. Chuyển văn bản thành JSON
- 13. Tạo cấu trúc JSON đơn giản sử dụng jackson
- 14. Cấu trúc có biến mẫu trong C++
- 15. Hình ảnh văn bản được cấu trúc lại (Nhân sư) trong tiêu đề?
- 16. Làm cách nào để nhúng HTML trong tệp văn bản được cấu trúc lại?
- 17. Cách nhận xét một chuỗi trong văn bản được cấu trúc lại?
- 18. Bản đồ của cấu trúc vs mảng của cấu trúc trong Go
- 19. Ví dụ làm việc về hình ảnh nổi trong văn bản được tái cấu trúc
- 20. Có thể tạo cấu trúc cho cấu trúc khác không?
- 21. Cách đăng cấu trúc dữ liệu như json vào bình?
- 22. unmarshal một mảng JSON của cấu trúc không đồng nhất
- 23. Cấu trúc JSON cho Danh sách các đối tượng
- 24. Cấu trúc bản đồ có an toàn không?
- 25. D3 - cách xử lý cấu trúc dữ liệu JSON?
- 26. Hướng dẫn Cấu trúc Bản đồ
- 27. Cấu trúc của tôi không marshalling vào json
- 28. Cú pháp để tạo tài liệu cấu trúc JSON
- 29. NHibernate và Bản đồ cấu trúc
- 30. Các cấu trúc có trong phần .pdata
Tại sao điều này lại có được sự giảm giá? Tùy thuộc vào trường hợp sử dụng của người hỏi, đây có thể là một giải pháp tuyệt vời. (Có lẽ anh ta đang lưu trữ một tài liệu toàn văn bản trong JSON, như một phần của kho dữ liệu, hoặc một cái gì đó.) –