2010-08-09 28 views
7

Tôi hiện đang viết một thuật toán trong Ruby dựa trên mã khả năng đọc arc90 để trích xuất một bài viết từ một trang web.Bất cứ điều gì tốt hơn so với giả kim thuật giả để trích xuất từ ​​khóa?

Bây giờ tôi có bài viết này, tôi muốn trích xuất từ ​​khóa và thông tin cụ thể từ nó (tên, tác giả, vv)

tôi nghe Alchemy là một viên ngọc ruby ​​lớn để làm điều này mặc dù nó chiếm nhiều tài nguyên . Có bất kỳ đá quý tốt hơn tôi có thể sử dụng cho điều này?

+0

tôi nghĩ từ khóa 'giả kim thuật' đề cập đến dự án giả kim thuật của Adobe chứ không phải Ruby Gem. Xem faq: http://stackoverflow.com/tags/alchemy/info – paleozogt

Trả lời

2

Có một số OpenCalais gem cung cấp khả năng tương tự. Ngoài việc trích xuất đối tượng, nó cũng có thể phát hiện các sự kiện và quan hệ giữa các thực thể. Nó không nhẹ, mặc dù tôi không thể nói nó tốt hơn hay tệ hơn Alchemy vì tôi chưa sử dụng đá quý Alchemy. Hi vọng điêu nay co ich.

+0

Tôi đã đi và viết đá quý của riêng tôi cho OpenCalais: https://github.com/RedFred7/dover_to_calais – RedFred

9

nhanh, leightweight và dễ dàng sử dụng đá quý để chiết xuất từ ​​khóa từ nội dung dài hơn:

https://rubygems.org/gems/highscore

tôi sử dụng nó trong sản xuất, hoạt động như một nét duyên dáng.

Câu hỏi là cũ hơn một chút, nhưng tôi sẽ để ở đây cho những người khác sẽ đến từ google để xem câu hỏi này.

Các vấn đề liên quan