工具使用说明与扩展性介绍
1.Pytorch有两种模型保存方法
1.1 保存整个神经网络的结构信息
-
该方法保存的模型通过torch.load('.pth'),直接初始化新的神经网络对象;
``#保存模型`
torch.save(model_object,'resnet.pth')*#加载模型*model=torch.load('resnet.pth')
1.1 保存整个神经网络的结构信息
-
该方法保存的方式:首先是导入对应的网络,再通过net.load_state_dict(torch.load(’.pth’))完成模型参数的加载;
*#将my_resnet模型存储为my_resnet.pth*torch.save(my_resnet.state_dict(),"my_resnet.pth")*#加载resnet,模型存放在my_resnet.pth* my_resnet.load_state_dict(torch.load("my_resnet.pth"))*#其中my_resnet是my_resnet.pth对应的网络结构;*
2.Pytorch载入只含模型参数pth文件
pth文件只保存网络中的参数,具有速度快,占空间少的优点,网上Pytorch实现的可供下载的预训练模型一般也是这种吗,加载并导出为onnx格式时还需要在继承 nn.Module 实现网络各Layer层,例如,下面的示例中使用Pytorch实现了一个Net。
import torch
import torch.nn as nn
import torch.nn.functional as F
class CivilNet(nn.Module):
def __init__(self):
super(CivilNet, self).__init__()
self.conv1 = nn.Conv2d(3, 6, 5)
self.pool = nn.MaxPool2d(2, 2)
self.conv2 = nn.Conv2d(6, 16, 5)
self.fc1 = nn.Linear(16 * 5 * 5, 120)
self.fc2 = nn.Linear(120, 84)
self.fc3 = nn.Linear(84, 10)
self.gemfield = "gemfield.org"
self.syszux = torch.zeros([1,1])
def forward(self, x):
x = self.pool(F.relu(self.conv1(x)))
x = self.pool(F.relu(self.conv2(x)))
x = x.view(-1, 16 * 5 * 5)
x = F.relu(self.fc1(x))
x = F.relu(self.fc2(x))
x = self.fc3(x)
return x
2.1 CivilNet模型的保存
如果我们要保存一个训练好的PyTorch模型的话,会使用下面的API:
cn = CivilNet()
......
torch.save(cn.state_dict(), "your_model_path.pth")
2.1 CivilNet模型的加载
而如果我们要load一个pth模型来进行前向的时候,会使用下面的API:
cn = CivilNet()
#参数反序列化为python dict
state_dict = torch.load("your_model_path.pth")
#加载训练好的参数
cn.load_state_dict(state_dict)
#变成测试模式,dropout和BN在训练和测试时不一样
#eval()会把模型中的每个module的self.training设置为False
cn = cn.cuda().eval()
3.pt2tf工具的使用简介
#1 建立虚拟环境 $ virtualenv .venv
#2 激活虚拟环境 $ source .venv/bin/activate
#3 安装依赖包 pipinstall−rrequirements.txtpipinstall−rrequirements.txt pip install -e onnx-tensorflow
#4 生成onnx模型 $ python pt2onnx.py
#5 生成pb模型 $ onnx-tf convert -i efficientnet-b3.onnx -o efficientnet-b3.pb
pth转pb文件的工具源码如下,开发者可以根据自己需要转换的模型进行改造,并将Pytorch中未内置而需自己实现的模型脚本上传到工程目录的models文件夹下
import torch
from efficientnet_pytorch import EfficientNet
# Specify which model to use
model_name = 'efficientnet-b3'
image_size = EfficientNet.get_image_size(model_name)
print('Image size: ', image_size)
# Load model
model = EfficientNet.from_pretrained(model_name)
model.set_swish(memory_efficient=False)
model.eval()
print('Model image size: ', model._global_params.image_size)
# Dummy input for ONNX
dummy_input = torch.randn(1, 3, 300, 300)
# Export with ONNX
torch.onnx.export(model, dummy_input, f"{model_name}.onnx", verbose=True)
- 第二行导入Pytorch中内置的网络模型EfficientNet(Pytorch内置模型中)
- 若内置模型未实现,我们在models文件夹中继承nn.Module类实现我们的网络模型,可以参考第二章中的CivilNet网络样例
- 通过模型脚本对象的from_pretrained接口来导入pth参数文件,加载模型与参数
- 调用Pytorch的onnx模块将网络模型导出为onnx模型
- 使用onnx-tensorflow模块将onnx模型转换为pb模型