2009-10-17 30 views
5

Giả sử tôi đưa ra một số cách siêu duper để thể hiện một số dữ liệu mà tôi cho rằng sẽ hữu ích cho những người khác biết và sử dụng. Giả sử tôi có một 'spec' trong một số hình thức, ngay cả khi nó có thể không phải là một hoàn toàn chính thức: tức là, tôi biết làm thế nào định dạng tập tin này sẽ làm việc đã.Nếu tôi muốn xác định định dạng tệp, tôi sẽ làm như thế nào?

Làm cách nào để tôi phát hành thông số này để nhận các nhận xét và phản hồi dựa trên nó? Làm thế nào tôi có thể làm cho nó 'chuẩn hóa' ở một dạng nào đó?

+0

Trình bày dữ liệu dưới dạng nào? Loại dữ liệu nào? Bạn đang nói về nén? – Nifle

+0

Nhị phân. Dữ liệu được mã hóa. Không nhất thiết, mặc dù có lẽ tại một số điểm. –

+1

Xuất bản RFC. – Artelius

Trả lời

3

Chỉ định định dạng tệp rất khó. Nếu dữ liệu bạn muốn lưu trữ là tầm thường, nó có xu hướng tầm thường. Nói chung tuy nhiên, điều này là khó xảy ra. Bạn có thể sử dụng cấu trúc và từ khóa RFC, nhưng tôi luôn tìm thấy một fileformat trong văn xuôi một nhiệm vụ chậm, khó khăn và nhàm chán, cũng bởi vì việc đọc nó cũng tương tự như vậy.

Đề xuất của tôi, nếu bạn muốn theo cách này, là tập trung vào các khối thông tin. Hầu hết các difficuly là dành cho các thực thể là tùy chọn, và chỉ hiện diện nếu một điều kiện khác xảy ra, vì vậy hãy thử khai thác điều này khi phân vùng dữ liệu của bạn.

Thông số kỹ thuật tốt nhất, IMHO, là mã thực với một bộ kiểm tra uberperfect.

Để chuẩn hóa, nếu đủ người sử dụng, nó sẽ trở thành tiêu chuẩn không thực tế. bạn không cần một con dấu chính thức cho nó, mặc dù khi định dạng được sử dụng đủ, bạn có thể hưởng lợi từ một loại mime chính thức.

Để nói về điều đó, tốt, điều đó phụ thuộc. Tôi thấy hữu ích khi nói về các thực thể "hướng đối tượng" và cả về các mối quan hệ. Sơ đồ giống như cơ sở dữ liệu rất hữu ích về mặt này.

Cuối cùng, hãy thử tìm một giải pháp thay thế đã được chuẩn hóa trước, hoặc ít nhất là cố gắng không xử lý các bit thô. Có rất nhiều định dạng thùng chứa hoàn hảo ngoài kia giúp bạn giải phóng nhiều tác vụ gây phiền nhiễu. Lựa chọn vùng chứa phụ thuộc vào loại định dạng tệp thực tế (ví dụ: nếu bạn cần mã hóa, xen kẽ, giao dịch, v.v.).

+0

+1 cho: mã thực với một thử nghiệm uberperfect. – Nifle

+0

Trong trường hợp cụ thể này, đây là "Định dạng vùng chứa khác". Như tôi đã nói trong một bình luận cho câu hỏi của tôi, điều này liên quan đến mã hóa và tôi đủ thông minh để biết tôi không đủ thông minh cho điều đó. Theo tôi biết, không có gì tồn tại như những gì tôi đang đề xuất. –

1

Có một vài cách tôi muốn nói về nó, tôi nghĩ vậy.

Trước tiên, hãy xác định xem có cơ quan tiêu chuẩn nào (như W3C hoặc IEEE) có thể liên quan đến định dạng tệp của bạn hay không. Nếu có, hãy ném nó cho họ. Tôi không có ý tưởng làm thế nào tiếp nhận họ sẽ được mặc dù.

Thứ hai, một tiêu chuẩn là vô dụng nếu không ai sử dụng nó. Nhận được một số động lực đằng sau nó. Viết một bài đăng trên blog, twitter và tạo một trang web về nó. Liên kết trên programming.reddit.com và slashdot. Mô tả nó cho bạn bè và đồng nghiệp của bạn. Đăng nó ở đây trên SO, và yêu cầu thông tin phản hồi.

HTH.

Các vấn đề liên quan