Regex không phải là một lựa chọn tốt cho phân tích các file HTML ..
HTML là không nghiêm ngặt cũng không phải là thường xuyên với định dạng của nó ..
sai Sử dụng htmlagilitypack
Tại sao sử dụng phân tích cú pháp?
xem xét regex..There của bạn là vô số trường hợp bạn có thể phá vỡ mã của bạn
- regex của bạn sẽ không hoạt động nếu có lồng nhau divs
- Một số divs không có một kết thúc thẻ! (trừ XHTML)
Bạn có thể sử dụng mã này để lấy nó bằng cách sử HtmlAgilityPack
HtmlDocument doc = new HtmlDocument();
doc.Load(yourStream);
var itemList = doc.DocumentNode.SelectNodes("//div[@id='thumbs']")//this xpath selects all div with thubs id
.Select(p => p.InnerText)
.ToList();
//itemList now contain all the div tags content having its id as thumbs
Nhiều off topic nhưng nghe có vẻ giống như một ứng cử viên cho HTML Agility Pack – Sayse