Hãy xem xét đoạn mã sautách hiệu quả dữ liệu bằng Python
one, two = sales.random_split(0.5, seed=0)
set_1, set_2 = one.random_split(0.5, seed=0)
set_3, set_4 = two.random_split(0.5, seed=0)
Những gì tôi đang cố gắng để trong mã này là để chia ngẫu nhiên dữ liệu của tôi trong Sales
Sframe (tương tự như Pandas DataFrame) vào khoảng 4 phần bằng nhau.
Cách Pythonic/Efficient để đạt được điều này là gì?
Bạn có thể làm rõ lý do tại sao điều này không phải là Pythonic hoặc hiệu quả như được viết? Một vấn đề tôi có thể thấy là tạo ra một số nếp gấp không phải là sức mạnh của hai lần, nhưng điều đó nghe có vẻ khác với những gì bạn đang yêu cầu. – papayawarrior