Tôi có một dataframe gấu trúc Tôi nạp qua read_csv mà tôi đang cố gắng để đẩy đến một cơ sở dữ liệu thông qua to_sql khi tôi cố gắnggấu trúc to_sql cho unicode decode lỗi
df.to_sql("assessmentinfo_pivot", util.ENGINE)
tôi nhận lại một unicodeDecodeError:
UnicodeEncodeError: 'ascii' codec can't encode characters in position 83-84: ordinal not in range(128)
không có tùy chọn mã hóa cho to_sql để xác định utf-8 cho to_sql và Engine đã được tạo ra với mã hóa thiết lập để utf-8
ENGINE = create_engine("mssql+pymssql://" +
config.get_local('CEDS_USERNAME') + ':' +
config.get_local('CEDS_PASSWORD') + '@' +
config.get_local('CEDS_SERVER') + '/' +
config.get_local('CEDS_DATABASE'),
encoding="utf-8")
Bất kỳ thông tin chi tiết về gấu trúc nào về việc làm việc này đúng cách? hầu hết tìm kiếm của tôi đều dẫn tôi đến những người có lỗi tương tự với to_csv, điều này chỉ được giải quyết bằng cách thêm mã hóa = "utf-8" nhưng tiếc là không phải là một tùy chọn ở đây.
tôi đã cố gắng gọt file xuống nhưng nó vẫn mang lại cho lỗi ngay cả khi lột xuống chỉ tiêu đề: http://pastebin.com/F362xGyP
Bạn có thể cung cấp ví dụ sao chép không? (một số dữ liệu ví dụ và mã tái tạo lỗi) – joris
Lỗi xảy ra chỉ với các tiêu đề mà tôi đã đặt trong một pastebin ở trên. các cột có một số tên dài do một số trục được thực hiện cho bảng nguồn – lathomas64
Có một số ký tự đặc biệt ³ từ một số tên nguồn dữ liệu tiếng Tây Ban Nha kết thúc ở đây khi cố gắng tạo bảng tổng hợp. Tôi muốn có thể xử lý điều này trong cuộc gọi to_sql như trái ngược với việc phải tách các ký tự khỏi các tiêu đề. – lathomas64