Như tiêu đề đã nói, tôi có một số thao tác thao tác DOM. Ví dụ: tôi muốn: - tìm tất cả phần tử H1 có màu xanh dương. - tìm tất cả văn bản có kích thước 12px. - vv ..Cách thao tác DOM với Ruby on Rails
Làm thế nào tôi có thể làm điều đó với Rails?
Cảm ơn bạn .. :)
Cập nhật
tôi đã và đang làm một số nghiên cứu về giải nén nội dung trang web dựa trên này paper->http://www.springerlink.com/index/A65708XMUR9KN9EA.pdf
Bản tóm tắt của các bước là:
- nhận url web mà tôi muốn trích xuất (trang web đơn)
- lấy một số yếu tố từ trang web dựa trên một số nguyên tắc thị giác (Ví dụ: lấy tất cả H1 có màu xanh)
- quá trình các yếu tố với thuật toán của tôi
- lưu kết quả vào cơ sở dữ liệu của tôi.
-sorry cho Anh xấu của tôi
Ông có thể mở rộng vào những gì bạn đang cố gắng để đạt được (những gì bạn đang làm) để tôi có thể đưa ra lời khuyên cụ thể hơn cho vấn đề của bạn? Cảm ơn. –
Dựa trên cập nhật của bạn, tôi khuyên bạn nên thay đổi câu hỏi của bạn thành một cái gì đó như: "Cách phân tích cú pháp tài liệu HTML dựa trên tiêu chí trực quan với Ruby" –