Cách tốt nhất để viết ứng dụng duyệt web có thể duy trì là gì?

Tôi đã viết một kịch bản perl một thời gian trước đây đã đăng nhập vào ngân hàng trực tuyến của tôi và gửi email cho tôi số dư của tôi và một tuyên bố nhỏ mỗi ngày. Tôi thấy nó rất hữu ích cho việc theo dõi tài chính của tôi. Vấn đề duy nhất là tôi đã viết nó chỉ bằng cách sử dụng perl và curl và nó khá phức tạp và khó duy trì. Sau một vài trường hợp ngân hàng của tôi thay đổi trang web của họ, tôi đã chán ngấy việc gỡ lỗi để giữ cho nó cập nhật.Cách tốt nhất để viết ứng dụng duyệt web có thể duy trì là gì?

Vậy cách tốt nhất để viết chương trình như vậy theo cách dễ bảo trì như thế nào? Tôi muốn viết một phiên bản tốt đẹp được thiết kế trong cả hai Perl hoặc Java mà sẽ dễ dàng cập nhật khi các ngân hàng chắc chắn fiddle với trang web của họ.

Nguồn

2009-11-09 Benj

Trong Perl, một cái gì đó như WWW::Mechanize có thể đã làm cho tập lệnh của bạn đơn giản và mạnh mẽ hơn, bởi vì nó có thể tìm thấy biểu mẫu HTML trong các câu trả lời trước đó từ trang web. Bạn có thể điền vào các biểu mẫu này để chuẩn bị yêu cầu mới. Ví dụ:

my $mech = WWW::Mechanize->new(); 
$mech->get($url); 
$mech->submit_form(
    form_number => 1, 
    fields  => { password => $password }, 
); 
die unless ($mech->success);

Nguồn

2009-11-09 11:57:35

Hmm, chỉ cần tìm thấy

Finance::Bank::Natwest

Đó là một module perl đặc biệt cho ngân hàng của tôi! Không mong đợi nó khá dễ dàng.

Nguồn

2009-11-09 11:20:05 Benj

Hmm, không giống như rằng kịch bản perl làm việc nữa thật đáng buồn. Cập nhật lần cuối 2003! – Benj

Ồ. Nó đã cũ rồi. Nhưng mặc dù nó rõ ràng đã không được duy trì, nó vẫn có thể được duy trì? – innaM

Có, nó trông khá tốt bằng văn bản. Tôi đã gửi email cho tác giả để hỏi anh ta liệu anh ấy có sử dụng nó một cách cá nhân hay không. – Benj

Nếu tôi cung cấp cho bạn một lời khuyên, nó sẽ là sử dụng XPath cho tất cả các nhu cầu cạo của bạn. Tránh các regex.

Nguồn

2009-11-09 11:37:06 Geo

+1 chắc chắn một cái gì đó với một trình phân tích cú pháp HTML gốc sẽ tốt hơn nhiều trong thời gian dài. – bobince

Có, giải pháp trước đây của tôi là regexp nặng, tôi chắc chắn sẽ tránh rằng thời gian này nếu có thể. – Benj

Trừ khi HTML là rất đặc biệt hoặc bạn đang sử dụng 'HTML :: TreeBuilder :: XPath', điều này nhất định là bực bội. –

Một sự kết hợp của WWW::Mechanize và Web::Scraper là hai công cụ mà làm cho tôi hiệu quả nhất. Có một bài viết hay về sự kết hợp đó tại catalyzed.org

Nguồn

2009-11-09 12:17:34 singingfish

+1 cho Web :: Scraper. Tôi đã tìm thấy nó khó để cài đặt, nhưng tôi đã có thể thay thế các kịch bản cạo lớn với khoảng 3 dòng Web :: Scraper. –

Rất nhiều ngân hàng xuất bản dữ liệu ở định dạng chuẩn, thường được sử dụng bởi gói tài chính cá nhân như MS Money hoặc Quicken để tải xuống thông tin giao dịch. Bạn có thể tìm kiếm móc đó và tải xuống bằng cách sử dụng cùng một API và sau đó phân tích cú pháp dữ liệu ở cuối của bạn (ví dụ: phân tích cú pháp tài liệu Excel với Spreadsheet::ParseExcel và Quicken tài liệu với Finance::QIF).

Chỉnh sửa (trả lời nhận xét): Bạn đã cân nhắc việc liên hệ với ngân hàng của mình chưa và hỏi họ cách bạn có thể đăng nhập vào tài khoản theo cách lập trình để tải xuống dữ liệu tài chính? Nhiều/hầu hết các ngân hàng có một API cho điều này (mà Quicken vv sử dụng, như mô tả ở trên).

Nguồn

2009-11-09 17:54:05 Ether

Xin cảm ơn vì câu trả lời, nhưng nó không thực sự phân tích cú pháp dữ liệu ngân hàng mà tôi đang theo dõi, nó đăng nhập và tự động xoay quanh môi trường ngân hàng mà tôi muốn. – Benj

Có một hiện cập nhật của Ruby thực hiện ở đây:

http://github.com/warm/NatWoogle

Nguồn

2009-12-14 22:40:32 anonymous

Sử dụng perl và gói web :: scraper: link text

Nguồn

2010-05-10 13:20:00 juFo

Cách tốt nhất để viết ứng dụng duyệt web có thể duy trì là gì?

Trả lời

Các vấn đề liên quan