Tôi đang cố gắng kiểm tra xem một giá trị nhất định có được chứa trong cột python hay không. Tôi đang sử dụng df.date.isin(['07311954'])
, mà tôi không nghi ngờ là một công cụ tốt. Vấn đề là tôi có hơn 350 nghìn hàng và đầu ra sẽ không hiển thị tất cả chúng để tôi có thể xem liệu giá trị có thực sự được chứa hay không. Nói một cách đơn giản, tôi chỉ muốn biết (Y/N) có hay không một giá trị cụ thể được chứa trong một cột. Mã của tôi sau:Kiểm tra xem giá trị nhất định có được chứa trong cột dataframe trong gấu trúc
import numpy as np
import pandas as pd
import glob
df = (pd.read_csv('/home/jayaramdas/anaconda3/Thesis/FEC_data/itpas2_data/itpas214.txt',\
sep='|', header=None, low_memory=False, names=['1', '2', '3', '4', '5', '6', '7', \
'8', '9', '10', '11', '12', '13', 'date', '15', '16', '17', '18', '19', '20', \
'21', '22']))
df.date.isin(['07311954'])
Tôi nghĩ bạn, tôi đã chạy mã được đề xuất của bạn và tôi vẫn nhận được danh sách rất dài và không đầy đủ. –
Tôi chỉ chạy nó, tôi đã có một số lỗi cú pháp trước đó nên dừng lại để nghỉ ngơi. Khi tôi chạy mã ở trên nó chỉ ra ngày 1954; nhưng khi tôi chạy mã trên cùng một tập dữ liệu sau khi đã thực hiện (http: // stackoverflow.com/questions/35939558/using-timegrouper-1m-to-group-and-sum-by-cột-is-messing-up-my-date-index-p/35957110 # 35957110) nó trả về 'Empty DataFrame Cột: [cmte_id, trans_typ, entity_typ, state, date, amount, fec_id, cand_id] Chỉ mục: [] ' –
Jezrael, tôi sẽ xem lại các tệp dữ liệu và xem có bao nhiêu tệp có thị trường cột ngày với ngày đó là "ngoài phạm vi". Về mặt lý thuyết, tất cả các ngày của tôi phải từ năm 2007 đến năm 2014. Có cách nào để sử dụng mã mà bạn đã đăng ở trên nhưng in tất cả các giá trị với 4 chữ số cuối trong khoảng từ năm 2007 đến 2014? Tôi cũng muốn xóa tất cả các hàng xảy ra như vậy, nhưng trước tiên tôi cần định vị chúng để tôi có thể thông báo nguồn dữ liệu của lỗi trong dữ liệu. Nếu bạn có thể giúp tôi với điều đó nó sẽ là tuyệt vời! –