熊猫的随机分类和抽样
1.随机重排序
使用take()随机排序
如:
df.take([54]) #采取索引为54的数据
可以借助np.random.permutation()函数随机排序
permutation()函数是指产生0~n-1的所有整数的随机排列
、
如:对索引为0~10的数据进行随机排序
df.take(np.random.permutation(10))
(部分)
2.随机抽样:
当dataframe样本数据足够多时,对数据进行随机采样。
方法一:
使用np.random.randint()配合take()函数进行随机抽样
方法二:
使用sample(n)函数
n:是采样个数。
格式:df.sample(n)
你可能想看: