Tôi đang cố gắng để xóa dữ liệu bảng thành tệp CSV. Thật không may, tôi đã nhấn một khối đường và đoạn mã sau chỉ lặp lại TD từ TR đầu tiên cho tất cả các TRs tiếp theo.Python beautifulsoup lặp lại trên bảng
import urllib.request
from bs4 import BeautifulSoup
f = open('out.txt','w')
url = "http://www.international.gc.ca/about-a_propos/atip-aiprp/reports-rapports/2012/02-atip_aiprp.aspx"
page = urllib.request.urlopen(url)
soup = BeautifulSoup(page)
soup.unicode
table1 = soup.find("table", border=1)
table2 = soup.find('tbody')
table3 = soup.find_all('tr')
for td in table3:
rn = soup.find_all("td")[0].get_text()
sr = soup.find_all("td")[1].get_text()
d = soup.find_all("td")[2].get_text()
n = soup.find_all("td")[3].get_text()
print(rn + "," + sr + "," + d + ",", file=f)
Đây là tập lệnh Python đầu tiên của tôi nên mọi trợ giúp sẽ được đánh giá cao! Tôi đã xem xét các câu trả lời câu hỏi khác nhưng không thể tìm ra những gì tôi đang làm sai ở đây.