2012-07-23 37 views
6

Ai đó có thể hướng dẫn tôi cách lấy giá trị của thẻ bằng cách sử dụng BeautifulSoup không? Tôi đọc tài liệu nhưng có một thời gian khó điều hướng qua nó. Ví dụ, nếu tôi có:Kéo giá trị thẻ bằng cách sử dụng BeautifulSoup

<span title="Funstuff" class="thisClass">Fun Text</span> 

Làm thế nào tôi chỉ cần kéo "Funstuff" busing BeautifulSoup/Python?

Chỉnh sửa: Tôi đang sử dụng phiên bản 3.2.1

+0

Đây có phải là BeautifulSoup 3 hoặc BeautifulSoup 4 không? –

+0

của nó 3.2.1 ..10char – user1463925

Trả lời

6

Bạn cần có một cái gì đó để xác định các yếu tố bạn đang tìm kiếm, và thật khó để nói đó là gì trong câu hỏi này.

Ví dụ, cả hai sẽ in ra 'Funstuff' trong BeautifulSoup 3. Một tìm kiếm cho một yếu tố span và nhận được tiêu đề, một cái nhìn cho nhịp với các lớp nhất định. Nhiều cách hợp lệ khác để có được đến thời điểm này là có thể.

import BeautifulSoup 
soup = BeautifulSoup.BeautifulSoup('<html><body><span title="Funstuff" class="thisClass">Fun Text</span></body></html>') 
print soup.html.body.span['title'] 
print soup.find('span', {"class": "thisClass"})['title'] 
+0

Câu hỏi: tuyên bố nhập khẩu của tôi cho BeautifulSoup là: từ BeautifulSoup nhập khẩu BeautifulSoup, CData Tuy nhiên, các mã trên dường như chỉ hoạt động khi tôi: nhập khẩu BeautifulSoup Bất cứ ý tưởng tại sao? – user1463925

+0

Đó chỉ là Python. Nếu bạn đang nhập khẩu tương đối ('từ BeautifulSoup nhập BeautifulSoup'), hãy thay đổi dòng từ' soup = BeautifulSoup.BeautifulSoup (... 'thành' soup = BeautifulSoup (... ' Xem http: // docs. python.org/tutorial/modules.html để biết thêm. –

1

Một thẻ trẻ em có sẵn thông qua .contents http://www.crummy.com/software/BeautifulSoup/bs4/doc/#contents-and-children Trong trường hợp của bạn, bạn có thể tìm thấy thẻ được sử dụng lớp CSS của nó để trích xuất nội dung

from bs4 import BeautifulSoup 
soup=BeautifulSoup('<span title="Funstuff" class="thisClass">Fun Text</span>') 
soup.select('.thisClass')[0].contents[0] 

http://www.crummy.com/software/BeautifulSoup/bs4/doc/#css-selectors có tất cả các chi tiết nevessary

Các vấn đề liên quan