tôi nhận được một chuỗi html sử dụng curl:str_get_html không tải một chuỗi html hợp lệ
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
$html_string = curl_exec($ch);
Khi tôi echo
nó tôi thấy một html hoàn toàn tốt như tôi yêu cầu cho các nhu cầu phân tích của tôi. Nhưng, khi cố gắng gửi chuỗi này đến phương thức HTML DOM PARSER
str_get_html($html_string)
, nó sẽ không tải lên (trả về false từ lời gọi phương thức).
Tôi đã cố gắng lưu tệp để mở và mở bằng file_get_html
trên tệp nhưng điều tương tự cũng xảy ra.
Điều gì có thể là nguyên nhân của việc này? Như tôi đã nói, html trông hoàn toàn ổn khi tôi lặp lại nó.
Cảm ơn rất nhiều.
Mã chính nó:
$html = file_get_html("http://www.bgu.co.il/tremp.aspx");
$v = $html->find('input[id=__VIEWSTATE]');
$viewState = $v[0]->attr['value'];
$e = $html->find('input=[id=__EVENTVALIDATION]');
$event = $e[0]->attr['value'];
$html->clear();
unset($html);
$body = " A_STRING_THAT_CONTAINS_SOME_DATA "
$ch = curl_init("http://www.bgu.co.il/tremp.aspx");
curl_setopt($ch, CURLOPT_POSTFIELDS, $body);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
$html_string = curl_exec($ch);
$file_handle = fopen("file.txt", "w");
fwrite($file_handle, $html_string);
fclose($file_handle);
curl_close($ch);
$html = str_get_html($html_string);
Nếu bạn đăng mã, chúng tôi có thể giúp bạn. –
Nó hoạt động tốt cho tôi. – pguardiario