Tôi muốn tạo trình thu thập thông tin web dựa trên Java cho một thử nghiệm. Tôi nghe nói rằng làm cho một Web Crawler trong Java là con đường để đi nếu đây là lần đầu tiên của bạn. Tuy nhiên, tôi có hai câu hỏi quan trọng.Thư viện trình thu thập thông tin web Java
Làm cách nào để chương trình 'truy cập' hoặc 'kết nối' với các trang web? Xin vui lòng cho một lời giải thích ngắn gọn. (Tôi hiểu các khái niệm cơ bản về các lớp trừu tượng từ phần cứng đến phần mềm, ở đây tôi quan tâm đến việc trừu tượng hóa Java)
Tôi nên sử dụng thư viện nào? Tôi cho rằng tôi cần một thư viện để kết nối với các trang web, một thư viện cho giao thức HTTP/HTTPS và một thư viện để phân tích cú pháp HTML.
Vì vậy, điều này lấy thông tin từ một trang, hoặc đơn giản là đi đến trang? Tôi đang cố gắng viết trình thu thập thông tin sẽ lấy dữ liệu nhập của người dùng, truy cập maps.google.com, cắm địa chỉ và lấy thời gian tuyến đường và chiều dài tuyến đường và đưa nó trở lại chương trình. Điều này có thể không? – Ungeheuer
@Adrian có một cái nhìn tại google maps api: https://developers.google.com/maps/documentation/distance-matrix/start –