PyTorch面试精华


1 PyTorch全局设置

    1.1  全局设置当前设备

    1.2  全局设置浮点精度

    1.3  设置控制台输出格式

2 向量与梯度之核心

    2.1  Tensor的组成与存储

    2.2  Tensor的grad属性

    2.3  Tensor内存布局的调整

    2.4  Tensor的叠加

    2.5  禁用梯度计算

    2.6  向量的保存和加载

    2.7  梯度消失与梯度爆炸

3 神经网络基础

    3.1  线性网络的参数以及初始化

    3.2  PyTorch计算图

    3.3  查看网络权重参数

    3.4  保存模型

    3.5  Adam相关面试题

    3.6  ReLu与非线性的理解

    3.7  Train模式和Eval模式

    3.8  线性网络

    3.9  双线性网络

    3.10  惰性线性层

    3.11  参数向量

    3.12  叶子节点

    3.13  自动求导与链式求导

    3.14  Dropout机制

    3.15  detach原理

    3.16  半精度训练

    3.17  Xavier初始化

    3.18  通道的深刻理解

    3.19  1x1卷积的作用

    3.20  注意力机制

如何查看网络权重参数呢?

创建时间:2024-09-03 | 更新时间:2024-09-03 | 阅读次数:1029 次

问1:如何查看网络权重参数呢?

答:利用model.named_parameters()函数查可以查看网络权重参数。代码如下所示。

首先,我们要定义一个神经网络,如下所示:

class MyModel(nn.Module):
    def __init__(self):
        super().__init__()
        self.nn1 = nn.Linear(2, 3)
        self.nn2 = nn.Linear(3, 6)

    def forward(self, x):
        x = F.relu(self.nn1(x))
        return F.relu(self.nn2(x))

接着,我们可以通过model.named_parameters()函数查看一下这个网络内部的权重的名称和内部参数是什么。

model = MyModel()
for name, param in model.named_parameters():
    print(name)
    print("-" * 24)
    print(param)
    print("=" * 24)

结果如下所示:

nn1.weight
------------------------
Parameter containing:
tensor([[ 0.4568,  0.2095],
        [-0.6798,  0.1150],
        [-0.6007, -0.0654]], requires_grad=True)
========================
nn1.bias
------------------------
Parameter containing:
tensor([-0.2651,  0.1305,  0.4654], requires_grad=True)
========================
nn2.weight
------------------------
Parameter containing:
tensor([[-0.1951, -0.1204,  0.1378],
        [-0.1610, -0.4839, -0.0099],
        [ 0.3376, -0.1957,  0.5075],
        [-0.1851, -0.2538, -0.0336],
        [ 0.5438, -0.1405, -0.1241],
        [ 0.4294,  0.0081, -0.2110]], requires_grad=True)
========================
nn2.bias
------------------------
Parameter containing:
tensor([-0.5548,  0.1145,  0.1029, -0.2623, -0.0360, -0.0181],
       requires_grad=True)
========================

问2:named_parameters的数据结构是什么?

答:named_parameters()返回一个list列表,其内部元素为元组,每个元组打包了2个内容,分别是layer-name和layer-param。其中,layer-name用的字面量。

本教程共30节,当前为第13节!