2011-01-16 34 views

Trả lời

20

Nếu bạn đang tìm kiếm một trường hợp thực tế kiểm tra một trong đó automatically assigns priority to bugs này.

Tôi cũng đã tạo một vài dự án thử nghiệm để có được cảm giác về cách tôi có thể sử dụng nó trong sản xuất.

Một trong số chúng suggests tags cho câu hỏi Stackoverflow. Mô hình này được đào tạo với các câu hỏi (từ bãi chứa dữ liệu) chỉ có 1 thẻ. Điều này giúp nó nhận ra các chi tiết cụ thể của một thẻ cụ thể. Mã và văn xuôi được chia thành các tính năng riêng biệt, vì một trong số chúng có thể có tác động lớn hơn đến kết quả. Khi đưa ra một câu hỏi, nó trả về 10 đề xuất thẻ hàng đầu; các thẻ thực tế được bao gồm để so sánh.

Cấu trúc là một tập tin CSV:

"tag","code blocks(200 chars)","body text(200 chars)" 

Một số nhân vật đã được lọc ra khỏi code gây ra lỗi đào tạo: []^|~. Không chắc chắn cái nào trong số đó gây ra vấn đề.

Nếu bạn muốn xem một câu hỏi nhất định được thêm vào danh sách kiểm tra, hãy cho tôi biết. Rõ ràng, các câu hỏi có mã dự đoán tốt hơn.

Dự án khác dự đoán movie ratings dựa trên dữ liệu IMDB và đạo diễn/diễn viên. Không giống như từ khóa suggester, cái này là trực tiếp, do đó bạn có thể thử nghiệm với các kết hợp khác nhau để xem những gì nó sẽ dự đoán.

Cấu trúc ở đây là:

rating,"directorId","actorId actorId actorId" 

Cả hai đều chạy trên Google App Engine để python là back-end. Tôi không sử dụng một API cụ thể; chỉ cần theo dõi một số của Nick Johnson là example code.

+0

Tuyệt vời! Chính xác những gì tôi muốn xem! – user94154

+4

Rất tiếc, các liên kết trong câu trả lời không còn trực tuyến nữa. Bất cứ ai cũng có một số ví dụ cập nhật? –

3

Tôi chưa sử dụng API này. Nhưng website lists các usecases dưới đây của họ

  • hệ thống Khuyến nghị (mã demo)
  • phát hiện Spam (mã demo)
  • phân tích tình cảm của khách hàng
  • Upsell phân tích cơ hội
  • quyết định nhắn tuyến
  • Diagnostics
  • Phân loại tài liệu và email
  • xác định hoạt động đáng ngờ
  • phân tích Churn
  • xác định ngôn ngữ
+0

Cảm ơn bạn đã trả lời nhưng tôi quan tâm đến những gì người không phải là nhân viên của Google đã sử dụng nó/cách họ đã thực hiện (nghĩa là ngôn ngữ/thư viện, cách họ xử lý thu thập dữ liệu, cách họ cấu trúc dữ liệu v.v.). – user94154

Các vấn đề liên quan