Tôi đang sử dụng gói Agility để phân tích cú pháp HTML, theo câu hỏi này What is the best way to parse html in C#? và tôi nhận được kết quả tuyệt vời :) Sự cố xảy ra khi tôi truy cập vào một số trang web. ví dụ như tôi đang ở Tây Ban Nha, tôi nhận được kết quả cho khu vực Tây Ban Nha và tôi muốn thay đổi như thể tôi đã ở Anh, làm thế nào nó có thể được thực hiện? Tôi có nghĩa là nó là cái gì tôi phải thay đổi trong tác nhân người dùng? (Tôi sử dụng như một tác nhân người dùng “Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv: xxx) Gecko/20041107 Firefox/xx)”Cài đặt Gói nhanh cho HTML
5
A
Trả lời
9
Bạn có thể sử dụng phương pháp WebClient.DownloadString
cho phép bạn đặt tiêu đề yêu cầu HTTP để tải xuống nội dung của trang web và sau đó đưa nó vào gói nhanh nhẹn HTML.
UserAgent không phải là điều kiểm soát ngôn ngữ. Đó là tiêu đề Accept-Language
. Vì vậy, ví dụ:
using (var client = new WebClient())
{
client.Headers[HttpRequestHeader.AcceptLanguage] = "es-ES";
client.Headers[HttpRequestHeader.UserAgent] = "some user agent if you wish";
string html = client.DownloadString("http://example.com");
// feed the HTML to HTML Agility Pack
var doc = new HtmlDocument();
doc.LoadHtml(html);
// now do the parsing
}
Nhưng nếu trang web sử dụng nhận dạng dựa trên IP để gửi nội dung bằng các ngôn ngữ khác nhau, bạn không thể thay đổi điều đó.
1
tìm kiếm dựa trên vị trí hoặc các trang thường được thực hiện qua ip hoặc khi bạn đăng ký, bạn cho trang web biết bạn đang ở đâu. bạn có thể muốn xem xét một proxy anon trong quốc gia mà bạn muốn trông giống như bạn đang ở.
Các vấn đề liên quan
- 1. Gói nhanh nhẹn C# Html (SelectSingleNode)
- 2. Cài đặt gói cho ứng dụng iPhone
- 3. js grunt cài đặt gói
- 4. Python pip - cài đặt tài liệu cho các gói?
- 5. TextMate - Cách cài đặt gói?
- 6. Cài đặt bsddb gói - python
- 7. Cách ngăn cài đặt gói cài đặt dưới dạng .egg
- 8. Số lượng thống kê cài đặt cho các gói PyPI?
- 9. Lỗi: gói 'lsei' không được cài đặt cho 'arch = x64'
- 10. Gói nào tôi nên cài đặt cho 'pcre-devel'?
- 11. Cài đặt gói kernlab trong R
- 12. Chạy "gói cài đặt" không thành công và yêu cầu tôi chạy "gói cài đặt"
- 13. Cài đặt các gói lên R
- 14. Cài đặt Git HTML Help trên OSX
- 15. Gói cài đặt: Không thể tìm thấy gói 'WebActivator'
- 16. BỔ SUNG Gỡ cài đặt gói MSI
- 17. Cài đặt im lặng của gói MSI
- 18. Gói cài đặt trống trong Xcode 4.2
- 19. Gói cài đặt R toàn cầu
- 20. Cài đặt gói địa phương trên Meteor
- 21. Cài đặt các gói python trong nitrousio
- 22. không thể cài đặt gói Facebook 6.4.2
- 23. Cài đặt gói rCharts trên R 2.15.2
- 24. Gói WiX để cài đặt .NET
- 25. Lỗi Nokogiri khi chạy gói cài đặt
- 26. Sự khác biệt giữa gói và gói cài đặt
- 27. gói cài đặt pip từ url
- 28. Cài đặt gói octave trong ubuntu
- 29. gói PEAR cài đặt thất bại
- 30. Gói Python Cài đặt Ngoại tuyến
Tôi cũng đã sử dụng WebClient và trong nội dung html tôi có -> lang = "es", vì vậy câu hỏi là làm thế nào tôi có thể thay đổi sang tiếng anh? – jobormo
Tuyệt vời! đó là những gì tôi muốn, đừng lo lắng các trang web không sử dụng nhận dạng IP :) – jobormo