Files
ascend-tools/pt2tf
2020-09-23 16:07:27 +08:00
..
2020-09-23 09:09:49 +08:00
2020-09-23 16:07:27 +08:00
2020-09-23 16:07:27 +08:00
2020-09-23 09:09:49 +08:00

工具使用说明与扩展性介绍

1.Pytorch有两种模型保存方法

1.1 保存整个神经网络的结构信息
  • 该方法保存的模型通过torch.load('.pth'),直接初始化新的神经网络对象;

    ``#保存模型`

    torch.save(model_object,'resnet.pth')

    *#加载模型*

    model=torch.load('resnet.pth')

1.1 保存整个神经网络的结构信息
  • 该方法保存的方式:首先是导入对应的网络,再通过net.load_state_dict(torch.load(.pth))完成模型参数的加载;

    *#将my_resnet模型存储为my_resnet.pth*

    torch.save(my_resnet.state_dict(),"my_resnet.pth")

    *#加载resnet,模型存放在my_resnet.pth* my_resnet.load_state_dict(torch.load("my_resnet.pth"))

    *#其中my_resnet是my_resnet.pth对应的网络结构;*

2.Pytorch载入只含模型参数pth文件

pth文件只保存网络中的参数,具有速度快,占空间少的优点,网上Pytorch实现的可供下载的预训练模型一般也是这种吗,加载并导出为onnx格式时还需要在继承 nn.Module 实现网络各Layer层,例如,下面的示例中使用Pytorch实现了一个Net。

import torch
import torch.nn as nn
import torch.nn.functional as F

class CivilNet(nn.Module):
    def __init__(self):
        super(CivilNet, self).__init__()
        self.conv1 = nn.Conv2d(3, 6, 5)
        self.pool = nn.MaxPool2d(2, 2)
        self.conv2 = nn.Conv2d(6, 16, 5)
        self.fc1 = nn.Linear(16 * 5 * 5, 120)
        self.fc2 = nn.Linear(120, 84)
        self.fc3 = nn.Linear(84, 10)
        self.gemfield = "gemfield.org"
        self.syszux = torch.zeros([1,1])

    def forward(self, x):
        x = self.pool(F.relu(self.conv1(x)))
        x = self.pool(F.relu(self.conv2(x)))
        x = x.view(-1, 16 * 5 * 5)
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x
2.1 CivilNet模型的保存

如果我们要保存一个训练好的PyTorch模型的话,会使用下面的API:

cn = CivilNet()
......
torch.save(cn.state_dict(), "your_model_path.pth")
2.1 CivilNet模型的加载

而如果我们要load一个pth模型来进行前向的时候,会使用下面的API:

cn = CivilNet()

#参数反序列化为python dict
state_dict = torch.load("your_model_path.pth")
#加载训练好的参数
cn.load_state_dict(state_dict)

#变成测试模式,dropout和BN在训练和测试时不一样
#eval()会把模型中的每个module的self.training设置为False 
cn = cn.cuda().eval()

3.pt2tf工具的使用简介

#1 建立虚拟环境 $ virtualenv .venv

#2 激活虚拟环境 $ source .venv/bin/activate

#3 安装依赖包 pipinstallrrequirements.txtpipinstallrrequirements.txt pip install -e onnx-tensorflow

#4 生成onnx模型 $ python pt2onnx.py

#5 生成pb模型 $ onnx-tf convert -i efficientnet-b3.onnx -o efficientnet-b3.pb

pth转pb文件的工具源码如下,开发者可以根据自己需要转换的模型进行改造,并将Pytorch中未内置而需自己实现的模型脚本上传到工程目录的models文件夹下

import torch
from efficientnet_pytorch import EfficientNet

# Specify which model to use
model_name = 'efficientnet-b3'
image_size = EfficientNet.get_image_size(model_name)
print('Image size: ', image_size)

# Load model
model = EfficientNet.from_pretrained(model_name)
model.set_swish(memory_efficient=False)
model.eval()
print('Model image size: ', model._global_params.image_size)

# Dummy input for ONNX
dummy_input = torch.randn(1, 3, 300, 300)

# Export with ONNX
torch.onnx.export(model, dummy_input, f"{model_name}.onnx", verbose=True)
  • 第二行导入Pytorch中内置的网络模型EfficientNet(Pytorch内置模型中)
  • 若内置模型未实现,我们在models文件夹中继承nn.Module类实现我们的网络模型,可以参考第二章中的CivilNet网络样例
  • 通过模型脚本对象的from_pretrained接口来导入pth参数文件,加载模型与参数
  • 调用Pytorch的onnx模块将网络模型导出为onnx模型
  • 使用onnx-tensorflow模块将onnx模型转换为pb模型