有时候我们在模型中需要定义一些常量参数,比如自定义高斯模糊核的weight。我们希望在主函数中使用 .cuda() 将模型转到 gpu 上时,能够自动将常量参数也转到 gpu 上,但又不希望模型更新这些常量参数。为了达到这个目的,有两种实现方法:
- 使用
nn.Parameter(xxx, requires_grad=False)
class MyModel(nn.Module):
def __init__():
super(MyModel, self).__init__()
kernel = torch.rand(5, 5) # 假设 kernel 为定义的常量参数
self.weight = nn.Parameter(kernel, requires_grad=False)
- 使用
self.register_buffer('name', xxx)
, 后续可用self.name
来访问定义的常量参数
class MyModel(nn.Module):
def __init__():
super(MyModel, self).__init__()
kernel = torch.rand(5, 5) # 假设 kernel 为定义的常量参数
self.register_buffer('weight', kernel)
文章出处登录后可见!
已经登录?立即刷新