129 lines
4.1 KiB
Markdown
129 lines
4.1 KiB
Markdown
## 工具使用说明与扩展性介绍
|
||
|
||
### 1.Pytorch有两种模型保存方法
|
||
|
||
##### 1.1 保存整个神经网络的结构信息
|
||
|
||
- 该方法保存的模型通过torch.load('.pth'),直接初始化新的神经网络对象;
|
||
|
||
``*#保存模型*`
|
||
|
||
`torch.save(model_object,'resnet.pth')`
|
||
|
||
`*#加载模型*`
|
||
|
||
`model=torch.load('resnet.pth')`
|
||
|
||
##### 1.1 保存整个神经网络的结构信息
|
||
|
||
- 该方法保存的方式:首先是导入对应的网络,再通过net.load_state_dict(torch.load(’.pth’))完成模型参数的加载;
|
||
|
||
`*#将my_resnet模型存储为my_resnet.pth*`
|
||
|
||
`torch.save(my_resnet.state_dict(),"my_resnet.pth")`
|
||
|
||
`*#加载resnet,模型存放在my_resnet.pth* my_resnet.load_state_dict(torch.load("my_resnet.pth"))`
|
||
|
||
`*#其中my_resnet是my_resnet.pth对应的网络结构;*`
|
||
|
||
### 2.Pytorch载入只含模型参数pth文件
|
||
|
||
pth文件只保存网络中的参数,具有速度快,占空间少的优点,网上Pytorch实现的可供下载的预训练模型一般也是这种吗,加载并导出为onnx格式时还需要在继承 nn.Module 实现网络各Layer层,例如,下面的示例中使用Pytorch实现了一个Net。
|
||
|
||
```
|
||
import torch
|
||
import torch.nn as nn
|
||
import torch.nn.functional as F
|
||
|
||
class CivilNet(nn.Module):
|
||
def __init__(self):
|
||
super(CivilNet, self).__init__()
|
||
self.conv1 = nn.Conv2d(3, 6, 5)
|
||
self.pool = nn.MaxPool2d(2, 2)
|
||
self.conv2 = nn.Conv2d(6, 16, 5)
|
||
self.fc1 = nn.Linear(16 * 5 * 5, 120)
|
||
self.fc2 = nn.Linear(120, 84)
|
||
self.fc3 = nn.Linear(84, 10)
|
||
self.gemfield = "gemfield.org"
|
||
self.syszux = torch.zeros([1,1])
|
||
|
||
def forward(self, x):
|
||
x = self.pool(F.relu(self.conv1(x)))
|
||
x = self.pool(F.relu(self.conv2(x)))
|
||
x = x.view(-1, 16 * 5 * 5)
|
||
x = F.relu(self.fc1(x))
|
||
x = F.relu(self.fc2(x))
|
||
x = self.fc3(x)
|
||
return x
|
||
```
|
||
|
||
##### 2.1 CivilNet模型的保存
|
||
|
||
如果我们要保存一个训练好的PyTorch模型的话,会使用下面的API:
|
||
|
||
```
|
||
cn = CivilNet()
|
||
......
|
||
torch.save(cn.state_dict(), "your_model_path.pth")
|
||
```
|
||
|
||
##### 2.1 CivilNet模型的加载
|
||
|
||
而如果我们要load一个pth模型来进行前向的时候,会使用下面的API:
|
||
|
||
```
|
||
cn = CivilNet()
|
||
|
||
#参数反序列化为python dict
|
||
state_dict = torch.load("your_model_path.pth")
|
||
#加载训练好的参数
|
||
cn.load_state_dict(state_dict)
|
||
|
||
#变成测试模式,dropout和BN在训练和测试时不一样
|
||
#eval()会把模型中的每个module的self.training设置为False
|
||
cn = cn.cuda().eval()
|
||
```
|
||
|
||
### 3.pt2tf工具的使用简介
|
||
|
||
#1 建立虚拟环境 $ virtualenv .venv
|
||
|
||
\#2 激活虚拟环境 $ source .venv/bin/activate
|
||
|
||
\#3 安装依赖包 pipinstall−rrequirements.txtpipinstall−rrequirements.txt pip install -e onnx-tensorflow
|
||
|
||
\#4 生成onnx模型 $ python pt2onnx.py
|
||
|
||
\#5 生成pb模型 $ onnx-tf convert -i efficientnet-b3.onnx -o efficientnet-b3.pb
|
||
|
||
pth转pb文件的工具源码如下,开发者可以根据自己需要转换的模型进行改造,并将Pytorch中未内置而需自己实现的模型脚本上传到工程目录的models文件夹下
|
||
|
||
```
|
||
import torch
|
||
from efficientnet_pytorch import EfficientNet
|
||
|
||
# Specify which model to use
|
||
model_name = 'efficientnet-b3'
|
||
image_size = EfficientNet.get_image_size(model_name)
|
||
print('Image size: ', image_size)
|
||
|
||
# Load model
|
||
model = EfficientNet.from_pretrained(model_name)
|
||
model.set_swish(memory_efficient=False)
|
||
model.eval()
|
||
print('Model image size: ', model._global_params.image_size)
|
||
|
||
# Dummy input for ONNX
|
||
dummy_input = torch.randn(1, 3, 300, 300)
|
||
|
||
# Export with ONNX
|
||
torch.onnx.export(model, dummy_input, f"{model_name}.onnx", verbose=True)
|
||
```
|
||
|
||
- 第二行导入Pytorch中内置的网络模型EfficientNet(Pytorch内置模型中)
|
||
- 若内置模型未实现,我们在models文件夹中继承nn.Module类实现我们的网络模型,可以参考第二章中的CivilNet网络样例
|
||
- 通过模型脚本对象的from_pretrained接口来导入pth参数文件,加载模型与参数
|
||
- 调用Pytorch的onnx模块将网络模型导出为onnx模型
|
||
- 使用onnx-tensorflow模块将onnx模型转换为pb模型
|
||
|