Tôi muốn tìm kiếm ©
trong tài liệu HTML và về cơ bản nhận được thực thể bản quyền được quy cho.chọn phần tử văn bản HTML với regex?
Dòng quyền tác giả xuất hiện một vài cách khác nhau:
<p class="bg-copy">© 2011 The New York Times Company</p>
hoặc
<a href="http://www.nytimes.com/ref/membercenter/help/copyright.html">
© 2011</a>
<a href="http://www.nytco.com/">The New York Times Company</a>
hoặc
<br>Published since 1996<br>Copyright © CounterPunch<br>
All rights reserved.<br>
Tôi muốn bỏ qua ngày và thẻ can thiệp và chỉ nhận được "Công ty Thời báo New York" hoặc "Counterpunch".
Tôi đã không thể tìm thấy nhiều về việc sử dụng regex với JavaScript hoặc JQuery, mặc dù tôi có ấn tượng rằng nó có thể dẫn đến đau đầu lớn. Nếu có cách tiếp cận tốt hơn, hãy cho tôi biết.
Không sử dụng regex, thay vì sử dụng cây DOM để tìm thấy những gì bạn đang tìm kiếm. Một số liên kết: http://www.howtocreate.co.uk/tutorials/javascript/dombasics – FailedDev
Thông thường, phản hồi bạn nhận được là - vui lòng không sử dụng regex để phân tích cú pháp JS. Sử dụng trình phân tích cú pháp JS. Câu hỏi là - bạn có thể? – ZenMaster
@FailedDev gần như đã tạo ra nó ... – ZenMaster