2015-01-29 22 views
5

Tôi có kịch bản một dòng đơn giản này:Sử dụng hàng đầu tiên làm tên cột? Gấu trúc read_html

from pandas import read_html 

print read_html('http://money.cnn.com/data/hotstocks/', flavor = 'bs4') 

Những công trình, tiền phạt, nhưng các tên cột bị thiếu, họ đang được xác định là 1, 2, 3. Có một cách dễ dàng để nói với gấu trúc sử dụng hàng đầu tiên làm tên cột? Tôi biết tôi chỉ có thể lưu trữ tên như một danh sách và đặt chúng, và sau đó bỏ qua hàng đầu tiên, nhưng tôi tự hỏi nếu có một cách dễ dàng hơn/tốt hơn.

Hiện nay nó in:

      0  1  2   3 
0     Company Price Change % Change 
1    AAPL Apple Inc 115.31 +6.17 +5.65% 
2 BAC Bank of America Corp 15.20 -0.43 -2.75% 
3   YHOO Yahoo! Inc 46.46 -1.53 -3.19% 
4  MSFT Microsoft Corp 41.19 -1.47 -3.45% 
5   FB Facebook Inc 76.24 +0.46 +0.61% 
6  GE General Electric Co 23.84 -0.54 -2.21% 
7     T AT&T Inc 32.68 -0.13 -0.40% 
8   F Ford Motor Co 14.46 -0.24 -1.63% 
9   INTC Intel Corp 33.78 -0.41 -1.20% 
10 CSCO Cisco Systems Inc 26.80 -0.09 -0.35% 

Trả lời

8

'read_html` mất một tham số tiêu đề. Bạn có thể vượt qua một chỉ số hàng:

read_html('http://money.cnn.com/data/hotstocks/', header =0, flavor = 'bs4') 

Worth lưu ý bối cảnh này trong các tài liệu:

Ví dụ, bạn có thể cần phải tự gán tên cột nếu các tên cột được chuyển đổi thành NaN khi bạn vượt qua đối số tiêu đề = 0

http://pandas.pydata.org/pandas-docs/stable/generated/pandas.io.html.read_html.html

Các vấn đề liên quan