站点图标 AI技术聚合

PyTorch常用函数详解(附代码示例)

PyTorch常用函数详解(附代码示例)

欢迎关注收藏,持续更新OWO

1.torch.matmul()

全称为Matrix multiply,可将矩/矩、向/向、矩/向相乘(实际操作对象为tensor)。

(1)输入二维和一维时,为矩阵向量乘法,在维度不匹配时,可自动将向量转置,且计算后会重新转置回去:

行向量(即一维tensor)乘矩阵

矩阵乘以行向量(实际过程是先转置计算,再将计算后的结果转置回来)

矩阵乘列向量(属于二维tensor)(底层原理上实际为矩阵与2×1矩阵)

列向量乘矩阵(实际为两矩阵相乘,所以matmul()不会将其转置)

(2)输入都是二维时,为矩阵乘法,和tensor.mm()用法相同

平庸的矩阵乘法

注意尺寸匹配

(3)当输入有多维时,把多出的一维作为batch提取出来,其他部分作矩阵乘法

下面是一些更复杂的例子:

当两者都是三维时:

将tensor2的第0维1 broadcast 成2提出来,后两维作矩阵乘法即可

我们来看一个更复杂的

首先把tensor1的第0维2作为batch提取出来,则tensor1和tensor2都可看作三维。再把tensor1的1 broadcast成5,将共同的5继续提取出来,然后tensor1剩下(3, 4),tensor2剩下(4, 2),作矩阵乘法得(3, 2)

文章出处登录后可见!

已经登录?立即刷新
退出移动版