2010-08-18 37 views
23

Thông báo gần đây của Google về số Google Prediction API có vẻ rất thú vị. Nó có thể hữu ích cho một dự án sắp tới, và có lẽ sẽ làm một công việc tốt hơn so với một số mã tùy chỉnh mà tôi đã cân nhắc.Giải pháp thay thế mở cho API dự đoán của Google

Tuy nhiên, có một số nhà cung cấp bị khóa. Google giữ lại mô hình được đào tạo, và sau đó có thể chọn để vượt quá tôi cho nó. Nó xảy ra với tôi rằng có lẽ có nguồn tương đương mã nguồn mở, nếu tôi sẵn sàng tổ chức đào tạo bản thân mình (tôi) và sống mà không có khả năng của họ để ném phần cứng tại vấn đề tại một thời điểm thông báo.

Lần cuối cùng tôi xem mã đào tạo máy tính của bên thứ ba là nhiều năm trước và có rất nhiều chi tiết cần được xem xét và tùy chỉnh cẩn thận cho dự án của bạn. Google dường như đã ẩn những quyết định đó và chăm sóc chúng cho bạn. Với tôi, điều này vẫn không thể phân biệt được với ma thuật, nhưng tôi muốn biết liệu người khác có thể làm điều tương tự không.

Vì vậy, câu hỏi của tôi là:

gì thay thế cho Google Prediction API tồn tại đó:

  • Phân loại dữ liệu với máy học có giám sát,
  • có thể dễ dàng cấu hình (hoặc không cần cấu hình) cho các loại và quy mô khác nhau của tập dữ liệu?
  • được mã nguồn mở và tự lưu trữ (hoặc ít nhất, cung cấp cho bạn với một hoàng gia sử dụng miễn phí mô hình của bạn, mà không có một sự phụ thuộc vào một bên thứ ba)

Trả lời

15
+0

Trông giống như một giải pháp tốt. Vẫn còn những ngày đầu (bằng cách nhập học riêng của họ, v0.3). Họ đang giải quyết một loạt các vấn đề hơn là chỉ phân loại. – Oddthinking

+0

Có, nhưng có vẻ đầy hứa hẹn vì chúng được nhắm mục tiêu để xử lý dữ liệu quy mô lớn. – tszming

1

Tôi không chắc chắn nếu nó có liên quan, nhưng directededge vỉa được làm chính xác điều đó :)

+0

Họ dường như đang cung cấp một dịch vụ, như Google. Nó không phải là tự lưu trữ, vì vậy đây không phải là một câu trả lời. – Oddthinking

+0

Không có prob ^^ vì vậy bạn đã thử mahout trên hệ thống của bạn? – tUrG0n

+1

Dự án đã được đưa vào ổ ghi. Có thể trong một hoặc hai năm nữa - có thể là khi Mahout đạt tới 1.0! !:-) – Oddthinking

3

đã được tìm kiếm gần đây tại các công cụ như google dự đoán API, một trong những người đầu tiên tôi đã đưa vào là Weka máy học tập công cụ mà có thể được giá trị kiểm tra ra cho bất cứ ai tìm kiếm.

11

PredictionIO là một máy chủ học máy nguồn mở cho các nhà phát triển phần mềm để tạo các tính năng tiên đoán, chẳng hạn như cá nhân hóa, đề xuất và khám phá nội dung.

+2

Tuyệt vời. Nó được xây dựng trên thư viện Apache Mahout (ít nhất là cho các thuật toán mặc định.) Dường như không hỗ trợ phân loại chung, chỉ là dự đoán ưu tiên người dùng. – Oddthinking

+0

Trông khá tốt. Tôi bị mắc kẹt khi cài đặt các phụ thuộc của nó: / –

1

Có dịch vụ sử dụng miễn phí tốt Yandex Predictor với hạn mức yêu cầu 100000/ngày. Nó chỉ hoạt động cho văn bản, hỗ trợ nhiều ngôn ngữ và sửa lỗi chính tả.

Bạn cần nhận khóa API miễn phí, sau đó bạn có thể sử dụng API RESTful đơn giản. Api hỗ trợ JSON, XML và JSONP làm đầu ra.

Rất tiếc, tôi không thể tìm thấy tài liệu bằng tiếng Anh. Bạn có thể sử dụng Google Dịch.

Tôi có thể dịch tài liệu nếu có nhu cầu.

Các vấn đề liên quan