Có thư viện mã nguồn mở nào có thể được sử dụng để tìm kiếm Deep Web không?Có thư viện mã nguồn mở nào có thể được sử dụng để tìm kiếm Web sâu không?
Trả lời
có một Giao thức sáng kiến lưu trữ mở để thu thập siêu dữ liệu sử dụng xml trên html. bạn có thể tìm thấy nó tại: http://www.openarchives.org/Register/BrowseSites
Ngoài ra Web sâu (còn gọi là Deepnet, Web ẩn, web tối hoặc Web ẩn) đề cập đến nội dung World Wide Web không phải là một phần của Web bề mặt, được lập chỉ mục công cụ tìm kiếm chuẩn.
Công cụ tìm kiếm thương mại đã bắt đầu khám phá các phương pháp thay thế để thu thập dữ liệu trang web sâu. Giao thức Sơ đồ trang web (do Google phát triển lần đầu) và mod oai là các cơ chế cho phép các công cụ tìm kiếm và các bên quan tâm khác khám phá các tài nguyên Web sâu trên các máy chủ Web cụ thể. Cả hai cơ chế đều cho phép các máy chủ Web quảng cáo các URL có thể truy cập được trên chúng, do đó cho phép khám phá tự động các tài nguyên không được liên kết trực tiếp với Web bề mặt. Hệ thống lướt web sâu của Google tính toán trước các lần gửi cho mỗi biểu mẫu HTML và thêm các trang HTML kết quả vào chỉ mục công cụ tìm kiếm của Google. Các kết quả nổi lên chiếm một nghìn truy vấn mỗi giây đến nội dung Web sâu. Trong hệ thống này, trước tính toán đệ trình được thực hiện sử dụng ba thuật toán:
(1) lựa chọn các giá trị đầu vào cho đầu vào tìm kiếm văn bản chấp nhận từ khóa,
(2) xác định đầu vào mà chỉ chấp nhận giá trị của một cụ thể loại (ví dụ: ngày) và
(3) chọn một số lượng nhỏ kết hợp đầu vào tạo URL phù hợp để đưa vào chỉ mục tìm kiếm trên web.
Web sâu và web tối là * không * cùng một điều. – ray
Nếu Google không thể lập chỉ mục bất kỳ trang nào trong số các trang này, điều gì khiến bạn nghĩ thư viện nguồn mở có thể thực hiện? :)
Điều đó nói rằng, có một số liên kết trong bài viết của bạn liên quan đến việc thu thập dữ liệu trang web sâu có thể là nơi tốt để bắt đầu điều tra. Dưới đây là một số người khác:
- Deep Web Research có rất nhiều tài liệu tham khảo hữu ích.
- deepwebtech.com tuyên bố có công cụ tìm kiếm web sâu, mặc dù hiện tại nó đang ngừng hoạt động.
Trọng tâm của Google không phải là Deep Web - Tôi không đặt câu hỏi về khả năng tiềm năng mà là tập thể dục cho mục đích. Web sâu là một nguồn tài nguyên khá lớn cho các thông tin bất hợp pháp, liên quan đến đạn dược và các chủ đề khác không phù hợp để Google lập chỉ mục, bất kể mức độ "tìm kiếm an toàn" chúng sẽ được phân loại là thuộc về. Bởi "nguồn mở", tôi có nghĩa là các sáng kiến kho lưu trữ thay vì hack-ish, có thể truy vấn thông qua một số loại API. – luvieere
Munitions, thông tin bất hợp pháp ... chính xác thì bạn đang cố gắng làm gì ở đây? –
- 1. Các ứng dụng/thư viện Java mã nguồn mở lớn
- 2. Tìm kiếm một thư viện C++ cơ sở dữ liệu flatfile/xml mã nguồn mở
- 3. phân lớp thư viện mã nguồn mở
- 4. Làm thế nào để thư viện mã nguồn mở như jquery.com kiếm tiền
- 5. Thư viện C# nguồn mở nào có thể đọc/ghi mã QR vi?
- 6. Tìm kiếm thư viện tạo mã java
- 7. Làm thế nào để bạn tìm kiếm thông qua thư viện mã nguồn của riêng bạn?
- 8. Có nguồn mở mã nguồn mở không?
- 9. Minecraft có sử dụng bất kỳ thư viện Java nguồn mở nào ngoài JDK không?
- 10. Có thư viện cử chỉ nguồn mở trong Android không?
- 11. Lặn sâu vào mã nguồn mở
- 12. Thư viện thành phần JavaFX 2.0 mã nguồn mở
- 13. Có thư viện java mã nguồn mở để giao tiếp với máy quét hình ảnh không?
- 14. Có thư viện mã nguồn mở Java để phân tích các tệp Excel 2007 không?
- 15. Có thư viện mã nguồn mở OCR hoặc sdk (miễn phí) cho Android và iOS không?
- 16. Có một số ứng dụng web mã nguồn mở sử dụng AngularJS không?
- 17. Có thư viện C nguồn mở nào có cấu trúc dữ liệu chung không?
- 18. Có thư viện các thành phần iPhone có thể tái sử dụng trên web không?
- 19. Mã nguồn của Thư viện PThread?
- 20. Thư viện nhận dạng video mã nguồn mở trong C#
- 21. Kindle có thể được sử dụng như một công cụ đọc mã nguồn như thế nào?
- 22. Mã nguồn mở CoverFlow thư viện cho iPhone
- 23. Thư viện từ điển nguồn mở
- 24. Thư viện POP/SMTP có nguồn mở Cocoa/Cocoa-Touch?
- 25. Bạn đang tìm kiếm một hàm nguồn mở/Thư viện đi du lịch nguồn mở trong c/C++?
- 26. Java Swing: Thư viện biểu đồ Gantt mã nguồn mở
- 27. Có công cụ dòng lệnh hoặc thư viện nào để hiển thị các trang web sử dụng JavaScript không?
- 28. Có thư viện bộ nhớ tạm thời phân cấp nguồn mở nào không?
- 29. Tôi có thể sử dụng Terracotta để mở rộng ứng dụng chuyên sâu RAM không?
- 30. Tôi có thể tìm mã nguồn Flex ở đâu?
Bạn có quan tâm nhiều hơn đến dữ liệu hoặc api để thu thập dữ liệu không? – Steve
Tôi quan tâm đến API. – luvieere
Câu hỏi rất thú vị (+1), nhưng tôi e rằng bạn sẽ chỉ phải viết nó một mình (tôi hy vọng bạn có thể chứng minh tôi sai, mặc dù). – Phil