numpy.random.choice()函数详解

处理数据时我们经常需要从数组中随机抽取元素,这时候我们可以考虑使用np.random.choice()函数

语法格式

numpy.random.choice(a, size=None, replace=True, p=None)

参数说明

a:如果a是一维数组,就表示从这个一维数组中随机采样;如果a是整数,就表示从0到a-1这个序列中随机采样

size: 从a中选取size个数(采样结果的数量,以概率p随机选取大小为size的数据)

replace:布尔值,表示是否重用元素,即抽取出来的数据是否放回原数组中,默认为True(抽取出来的数据有重复)

p:一个一维数组,其与数组a相对应,表示取数组a中每个元素的概率,默认p=None表示选取的每个元素的概率相同

1.参数a

如果参数a=5,表示在[0, 5)中随机输出一个随机数

import numpy as np
np.random.choice(5)  # 3

如果参数a = [‘Guangzhou’, ‘Beijing’, ‘Shanghai’, ‘Shenzhen’],表示在[‘Guangzhou’, ‘Beijing’, ‘Shanghai’, ‘Shenzhen’]中随机输出一个随机数

import numpy as np
a = ['Guangzhou', 'Beijing', 'Shanghai', 'Shenzhen']
np.random.choice(a)  # 'Shenzhen'

2.参数size

在[0, 5)内输出3个数字并组成一维数组(ndarray)

import numpy as np
np.random.choice(5, 3)  # array([3, 2, 3])

在[‘Guangzhou’, ‘Beijing’, ‘Shanghai’, ‘Shenzhen’]内输出3个值并组成一维数组(ndarry)

import numpy as np
a = ['Guangzhou', 'Beijing', 'Shanghai', 'Shenzhen']
# array(['Shanghai', 'Shenzhen', 'Shanghai'], dtype='<U9')
np.random.choice(a, size=3)

3.参数replace

replace=False表示非放回采样(不会出现重复的元素) 

import numpy as np
# array([4, 0, 3])
np.random.choice(a=5, size=3, replace=False, p=None)

replace=True表示放回采样(会出现重复的元素) 

import numpy as np
# array([1, 0, 0])
np.random.choice(a=5, size=3, replace=True, p=None)

4.参数p

参数p实际是个数组,数组元素的个数应该与指定的参数a相同,用来规定选取a中每个元素的概率,默认概率相同,我们可以使用参数p来按概率生成随机数

例子1

import numpy as np
# array([3, 4, 3], dtype=int64)
np.random.choice(5, 3, p=[0.1, 0.2, 0.3, 0.1, 0.3])

上述代码表示分别以p=[0.1, 0.2, 0.3, 0.1, 0.3]的概率从[0,1,2,3,4]这四个数中选取3个数 

例子2 

每天参加体育锻炼的时间是多少?

A.没时间锻炼

B.10-20分钟

C.20-40分钟

D.50分钟以上

假设有100人填上述选择题,该题共有4个选项(ABCD),我们如何按概率控制这100个人选择A的概率是0.3,B的概率是0.3,C的概率0.3,D的概率是0.1?

import numpy
lists = []
for i in range(1, 101):
    r = numpy.random.choice(a=numpy.arange(1,5), p=[0.3, 0.3, 0.3, 0.1])
    lists.append(r)
A = 0
B = 0
C = 0
D = 0
'''
数字1代表A
数字2代表B
数字3代表C
数字4代表D
'''
for i in lists:
    if i == 1:
        A = A + 1
    elif i == 2:
        B = B + 1
    elif i == 3:
        C = C + 1
    elif i == 4:
        D = D + 1
print("A选项个数:", A)
print("B选项个数:", B)
print("C选项个数:", C)
print("D选项个数:", D)

结果如下所示

A选项个数: 27
B选项个数: 26
C选项个数: 36
D选项个数: 11

到此这篇关于numpy.random.choice()函数的文章就介绍到这了,更多相关numpy.random.choice()函数内容请搜索aitechtogether.com以前的文章或继续浏览下面的相关文章希望大家以后多多支持aitechtogether.com!

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
青葱年少的头像青葱年少普通用户
上一篇 2023年5月24日
下一篇 2023年5月24日

相关推荐