2012-10-07 12 views
5

Tôi đã tải xuống một loạt dữ liệu từ Thiên nhiên dưới dạng tệp N-Quads, .nq. Chúng chứa các đồ thị RDF, phải không? Làm cách nào để truy cập dữ liệu này và làm thế nào tôi có thể dịch các đồ thị RDF thành một định dạng dễ sử dụng hơn (tốt nhất là Boost hoặc igraph cho R/C++/Python)?Đồ thị N-Quad - làm cách nào để sử dụng chúng?

Trả lời

2

Các công việc điển hình là một cái gì đó như thế này:

  1. Nhập N-Quads đổ vào một cửa hàng ba SPARQL có khả năng như OpenLink Virtuoso hoặc Apache Fuseki
  2. truy vấn Write SPARQL đó trích xuất các dữ liệu bạn cần
  3. Chuyển đổi kết quả SPARQL, mà bạn có thể nhận được trong một XML đơn giản hoặc JSON (hoặc CSV, tùy thuộc vào các cửa hàng) định dạng, vào bất cứ định dạng mà bạn cần

Ngoài ra, gửi các truy vấn SPARQL trực tiếp từ các ứng dụng của bạn và làm với dữ liệu bất cứ điều gì cần phải được thực hiện. Có các thư viện máy khách SPARQL cho hầu hết các ngôn ngữ, nhưng ngay cả khi bạn không có một ngôn ngữ, nó là một vấn đề khá đơn giản trong việc% -encoding truy vấn và xây dựng một URL truy vấn.

+0

OK, cảm ơn. Có một số hướng dẫn mà bạn biết rằng tôi có thể thử? Ngoài ra, là chiến lược chung (trừu tượng) để chạy qua tài liệu văn bản n-quads và thêm các liên kết vào biểu đồ đầu ra dựa trên cú pháp đối tượng-vị ngữ-chủ đề? – jclancy

+0

Nói chung, có. Nhưng N-Quads có một lĩnh vực thứ tư cho mỗi "ba", được gọi là "đồ thị". Các tệp N-Quad khác nhau sẽ sử dụng cho các mục đích khác nhau, thường là đặt tên cho một ngữ cảnh hoặc nguồn cho ba cụ thể. Đây có thể là một ý tưởng tốt để tìm hiểu xem trường thứ tư được sử dụng trong tệp nào, bằng cách kiểm tra tệp hoặc tìm kiếm tài liệu từ nhà xuất bản. Tùy thuộc vào những gì bạn muốn sử dụng dữ liệu cho, trường thứ tư có thể hoặc có thể không quan trọng. – cygri

Các vấn đề liên quan