2012-04-25 32 views
5

Tôi sử dụng Jena và TDB để lưu trữ RDF, và tôi muốn làm một số suy luận về nó.Nhưng dữ liệu RDF là lớn, và lý do cú của Jena phải tải tất cả dữ liệu vào bộ nhớ. Vì vậy, tôi muốn tìm một lý do có thể lý do mà không cần tải tất cả dữ liệu vào bộ nhớ, có bất kỳ cái nào không?Có bất kỳ lý do cú miễn phí nào có thể lý do mà không tải tất cả dữ liệu vào bộ nhớ không?

+0

lớn như thế nào là dữ liệu của bạn? Chỉ tò mò ... – castagna

+0

Khoảng 0,1 tỷ bộ ba –

Trả lời

2

Nếu bạn chuẩn bị nhận một tập hợp con của OWL, có những việc bạn có thể làm trong thời gian xử lý luồng mà không tải tất cả dữ liệu RDF của bạn vào bộ nhớ và sẽ thực hiện tất cả các bộ ba phỏng đoán.

Ví dụ, có một cái nhìn tại lệnh suy luận Riot:

Source code ở đây:

Đó là tầm thường để có suy luận Riot và chạy nó song song với một cái gì đó giống như MapReduce, ví dụ là ở đây:

Một cách tiếp cận khác nhau trong đó sử dụng MapReduce để áp dụng các Các quy tắc RDFS và OWL ter Horst và thực hiện tất cả các câu lệnh có nguồn gốc ở đây:

Có lẽ, bạn có thể xem các phần của OWL mà bạn quan tâm và kiểm tra xem bạn có thể làm điều đó trong thời trang trực tuyến hay không. Nếu có, bạn có thể suy luận của RIOT và mở rộng nó, thêm các phần của OWL mà bạn quan tâm. Đó sẽ là một đóng góp tốt đẹp cho Apache Jena (liên lạc lại với danh sách gửi thư jena-dev nếu bạn muốn làm điều đó) .

WebPIE là một dự án thông minh và thú vị, nhưng bạn có thể thấy, phức tạp hơn một chút và đó là một dự án nghiên cứu (với tất cả điều này ngụ ý từ quan điểm hỗ trợ và bảo trì lâu dài). Tuy nhiên, nếu nó là OWL ter Horst bạn muốn/cần, WebPIE sẽ làm. Bạn thậm chí có thể đặt nỗ lực, chia sẻ WebPIE và đóng góp nó vào một dự án nguồn mở, nếu những người khác quan tâm đến việc sử dụng nó.

Bạn có thể quan tâm để nhìn cũng tại Ymris (nhưng điều này hiện đang ngủ ... zzzzz):

+0

Cảm ơn câu trả lời của bạn! –

3

Không thực sự. DL lý luận là khó tính toán ở quy mô thậm chí thấp. Với lô hàng dữ liệu, điều đó sẽ không hoạt động với các phương pháp hiện có. Làm nó trên lưu trữ thứ cấp vẫn là một vấn đề nghiên cứu mở afaik.

Tuy nhiên, các cấu hình khác nhau của OWL tồn tại để giải quyết vấn đề này. Tất cả chúng đều có tính phức tạp tính toán khác nhau, tất cả đều dễ dàng hơn so với DL khiến cho chúng dễ hiểu hơn về lý luận ở quy mô lớn. Đặc biệt, QL được thiết kế cho lý do thời gian truy vấn mà trong kinh nghiệm của tôi có xu hướng có một bộ nhớ rất nhỏ và RL có thể được thực hiện với một lý do quy tắc tiêu chuẩn.

Vì vậy, nếu bạn không cần sử dụng DL, thì tôi sẽ đi với một công cụ hỗ trợ một trong các cấu hình và bạn sẽ nhận được số dặm khá tốt trong số đó.

Để tham khảo, bạn có thể tìm thấy điều này document về sự phức tạp phức tạp của các phương ngữ OWL khác nhau thú vị.

+0

Trên thực tế, dữ liệu RDF là skos, tôi không biết liệu nó có thể được lý luận bởi QL –

Các vấn đề liên quan