2013-07-30 36 views
5

tôi cần phải loại bỏ tệp html lớn (ví dụ: - http://www.indianrail.gov.in/mail_express_trn_list.html) bằng cách sử dụng đơn giản html dom. tôi bắt đầu với một kịch bản đơn giản ..đơn giản html dom tháo dỡ tệp html lớn

<?php 
require "simple_html_dom.php"; 
echo file_get_html('http://www.indianrail.gov.in/mail_express_trn_list.html')->plaintext; 
?> 

trong đó cho thấy không có gì, chỉ là một trang trống với thông báo lỗi trong Apache error.log tập tin

PHP Notice: Trying to get property of non-object in /var/www/index.php on line 3 
PHP Notice: Trying to get property of non-object in /var/www/index.php on line 3 

cùng một lúc tất cả các trang khác (ví dụ: - http://www.indianrail.gov.in/special_trn_list.html) hoạt động tốt với cùng một tập lệnh. cần trợ giúp về điều này

Cảm ơn bạn trước.

+0

Bạn đã thử sử dụng 'file_get_contents' thay vì' file_get_html'? http://php.net/manual/en/function.file-get-contents.php –

+0

tôi có thể tái tạo vấn đề, tôi sẽ đào sâu hơn và cho bạn biết – DevZer0

+0

@Fred tôi đã thử, nhưng lỗi tương tự .. – krizna

Trả lời

12

Sự cố có vẻ là MAX_FILE_SIZE được xác định trong simple_html_dom.

bạn có thể điều chỉnh bằng cách chỉnh sửa define('MAX_FILE_SIZE', 600000); dòng trong tệp simple_html_dom.php.

+0

tôi đã thử xác định ('MAX_FILE_SIZE', 6000000000000000000); .. nhưng không có may mắn .. vẫn còn lỗi tương tự .. nhờ – krizna

+4

xác định một số thực tế, tôi đặt nó để 12600000 – DevZer0

+0

nó đường nối làm việc, nhưng tôi nhận được lỗi khác nhau ngay bây giờ .. thoát tín hiệu Phân đoạn lỗi (11) – krizna

Các vấn đề liên quan