Tôi đang xem xét việc tạo trình thu thập dữ liệu web/nhện nhưng tôi cần một người nào đó chỉ cho tôi đúng hướng để bắt đầu.Làm cho trình thu thập dữ liệu web/spider
Về cơ bản, con nhện của tôi sẽ tìm kiếm các tệp âm thanh và lập chỉ mục chúng.
Tôi chỉ tự hỏi nếu có ai có ý tưởng về cách tôi nên làm điều đó. Tôi đã nghe nói rằng việc thực hiện nó trong PHP sẽ rất chậm. Tôi biết vb.net để có thể có ích?
Tôi đã suy nghĩ về việc sử dụng tìm kiếm loại tệp của Google để nhận liên kết thu thập thông tin. Đó sẽ là tốt?
Cảm ơn, bất kỳ ý tưởng làm thế nào tôi có thể chèn dữ liệu vào mẫu cơ sở dữ liệu của tôi một ứng dụng vb máy tính để bàn? –
Phụ thuộc vào hương vị của cơ sở dữ liệu. Có không gian tên 'System.Data.SqlClient' cho SQL Server. Đối với bất cứ điều gì khác, bạn sẽ cần phải nhìn vào không gian tên 'System.Data.OleDb'. Tốt hơn là sử dụng ứng dụng bảng điều khiển VB nếu bạn muốn điều này chạy tự động –
Liên quan đến phân tích cú pháp HTML với regex .... http: //stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml -self-contained-tags Có lẽ là câu trả lời SO tốt nhất từng có. – rfusca