nn.Linear的基本定义
nn.Linear定义一个神经网络的线性层,方法签名如下:
torch.nn.Linear(in_features, # 输入的神经元个数
out_features, # 输出神经元个数
bias=True # 是否包含偏置
)
Linear其实就是对输入 执行了一个线性变换,即:
其中是模型要学习的参数, 的维度为 , 是o维的向量偏置, 为输入向量的行数(例如,你想一次输入10个样本,即batch_size为10,则 ), 为输入神经元的个数(例如你的样本特征数为5,则 ), 为输出神经元的个数。
使用演示:
from torch import nn
import torch
model = nn.Linear(2, 1) # 输入特征数为2,输出特征数为1
input = torch.Tensor([1, 2]) # 给一个样本,该样本有2个特征(这两个特征的值分别为1和2)
output = model(input)
output
tensor([-1.4166], grad_fn=<AddBackward0>)
我们的输入为[1,2]
,输出了[-1.4166]
。可以查看模型参数验证一下上述的式子:
# 查看模型参数
for param in model.parameters():
print(param)
Parameter containing:
tensor([[ 0.1098, -0.5404]], requires_grad=True)
Parameter containing:
tensor([-0.4456], requires_grad=True)
可以看到,模型有3个参数,分别为两个权重和一个偏执。计算可得:
实战
假设我们的一次输入三个样本A,B,C(即batch_size为3),每个样本的特征数量为5:
A: [0.1,0.2,0.3,0.3,0.3]
B: [0.4,0.5,0.6,0.6,0.6]
C: [0.7,0.8,0.9,0.9,0.9]
则我们的输入向量 为:
X = torch.Tensor([
[0.1,0.2,0.3,0.3,0.3],
[0.4,0.5,0.6,0.6,0.6],
[0.7,0.8,0.9,0.9,0.9],
])
X
tensor([[0.1000, 0.2000, 0.3000, 0.3000, 0.3000],
[0.4000, 0.5000, 0.6000, 0.6000, 0.6000],
[0.7000, 0.8000, 0.9000, 0.9000, 0.9000]])
定义线性层,我们的输入特征为5,所以in_feature=5
,我们想让下一层的神经元个数为10,所以out_feature=10
,则模型参数为:
model = nn.Linear(in_features=5, out_features=10, bias=True)
经过线性层,其实就是做了一件事,即:
具体表示则为:
其中 就表示第个样本, 表示所有输入神经元到第个输出神经元的权重。
注意:这里图有点问题,应该是
因为有三个样本,所以相当于依次进行了三次 ,然后再将三个 叠在一起
经过线性层后,我们最终的到了维的矩阵,即 输入3个样本,每个样本维度为5,输出为3个样本,将每个样本扩展成了10维
model(X).size()
torch.Size([3, 10])
参考资料
nn.Linear官方文档:https://pytorch.org/docs/stable/generated/torch.nn.Linear.html
文章出处登录后可见!
已经登录?立即刷新