欢迎关注收藏,持续更新OWO
1.torch.matmul()
全称为Matrix multiply,可将矩/矩、向/向、矩/向相乘(实际操作对象为tensor)。
(1)输入二维和一维时,为矩阵向量乘法,在维度不匹配时,可自动将向量转置,且计算后会重新转置回去:
行向量(即一维tensor)乘矩阵
矩阵乘以行向量(实际过程是先转置计算,再将计算后的结果转置回来)
矩阵乘列向量(属于二维tensor)(底层原理上实际为矩阵与2×1矩阵)
列向量乘矩阵(实际为两矩阵相乘,所以matmul()不会将其转置)
(2)输入都是二维时,为矩阵乘法,和tensor.mm()用法相同
平庸的矩阵乘法
注意尺寸匹配
(3)当输入有多维时,把多出的一维作为batch提取出来,其他部分作矩阵乘法
下面是一些更复杂的例子:
当两者都是三维时:
将tensor2的第0维1 broadcast 成2提出来,后两维作矩阵乘法即可
我们来看一个更复杂的
首先把tensor1的第0维2作为batch提取出来,则tensor1和tensor2都可看作三维。再把tensor1的1 broadcast成5,将共同的5继续提取出来,然后tensor1剩下(3, 4),tensor2剩下(4, 2),作矩阵乘法得(3, 2)
文章出处登录后可见!
已经登录?立即刷新