Tôi có một khung dữ liệu có tên khóa học cho mỗi năm. Tôi cần phải tìm thời gian trong tháng bắt đầu từ năm 2016.Tăng số lần điền lùi sau 12 tháng
from io import StringIO
import pandas as pd
u_cols = ['page_id','web_id']
audit_trail = StringIO('''
year_id | web_id
2012|efg
2013|abc
2014| xyz
2015| pqr
2016| mnp
''')
df11 = pd.read_csv(audit_trail, sep="|", names = u_cols )
Làm thế nào để thêm tháng trong một cột mới bắt đầu từ cao nhất (ví dụ dưới như bfill?)
Trận chung kết dữ liệu-frame sẽ xem xét như thế này ...
u_cols = ['page_id','web_id' , 'months']
audit_trail = StringIO('''
year_id | web_id | months
2012|efg | 60
2013|abc | 48
2014| xyz | 36
2015| pqr | 24
2016| mnp | 12
''')
df12 = pd.read_csv(audit_trail, sep="|", names = u_cols )
Một số các câu trả lời không xem xét rằng có thể có nhiều khóa học. Cập nhật dữ liệu mẫu ...
from io import StringIO
import pandas as pd
u_cols = ['course_name','page_id','web_id']
audit_trail = StringIO('''
course_name| year_id | web_id
a|2012|efg
a|2013|abc
a|2014| xyz
a|2015| pqr
a|2016| mnp
b|2014| xyz
b|2015| pqr
b|2016| mnp
''')
df11 = pd.read_csv(audit_trail, sep="|", names = u_cols )
Nice! Tôi quên về 'biến đổi 'không cần chỉ mục. – piRSquared