Tôi đang cố gắng để cạo một website nhưng tôi không nhận được một số yếu tố, bởi vì các yếu tố này được tạo động.Làm cách nào để tôi có thể xóa các trang có nội dung động bằng cách sử dụng node.js?
Tôi sử dụng cổ vũ trong node.js và Mã của tôi ở bên dưới.
var request = require('request');
var cheerio = require('cheerio');
var url = "http://www.bdtong.co.kr/index.php?c_category=C02";
request(url, function (err, res, html) {
var $ = cheerio.load(html);
$('.listMain > li').each(function() {
console.log($(this).find('a').attr('href'));
});
});
Mã này trả về phản hồi trống, vì khi trang được tải, <ul id="store_list" class="listMain">
bị trống.
Nội dung chưa được thêm vào.
Làm cách nào để có được các phần tử này bằng cách sử dụng node.js? Làm thế nào tôi có thể cạo trang bằng nội dung động?
sử dụng phantom.js một trình duyệt không có đầu, trình duyệt sẽ tải và hiển thị trang. bạn có thể truy cập các yếu tố khác nhau trên trang bằng cách sử dụng API javascript của nó. – Safi
Cảm ơn Safi! Nhưng bạn có thể cho tôi một đoạn mã hoặc một số tham chiếu với trường hợp này không? – JayD