Tôi có html (ngắt dòng được đánh dấu bằng \ n) như sau:Cách tìm thẻ có văn bản cụ thể bằng Beautiful Soup?
...
<tr>
<td class="pos">\n
"Some text:"\n
<br>\n
<strong>some value</strong>\n
</td>
</tr>
<tr>
<td class="pos">\n
"Fixed text:"\n
<br>\n
<strong>text I am looking for</strong>\n
</td>
</tr>
<tr>
<td class="pos">\n
"Some other text:"\n
<br>\n
<strong>some other value</strong>\n
</td>
</tr>
...
Làm thế nào để tìm văn bản Tôi đang tìm kiếm? Mã bên dưới trả về giá trị được tìm thấy đầu tiên, vì vậy tôi cần lọc theo Văn bản cố định bằng cách nào đó.
result = soup.find('td', {'class' :'pos'}).find('strong').text
Upd. Nếu tôi sử dụng đoạn mã sau:
title = soup.find('td', text = re.compile(ur'Fixed text:(.*)', re.DOTALL), attrs = {'class': 'pos'})
self.response.out.write(str(title.string).decode('utf8'))
sau đó nó sẽ trả về chỉ cố định văn bản:.
Bạn cần sử dụng 'findAll'. – JBernardo