模型工程落地赛指南

1. 背景

飞桨除了基本的模型训练和预测，还提供了支持多端多平台的高性能推理部署工具。希望通过模型工程落地赛指南，完成以下2个目标。

保证飞桨训推一体这样一个复杂系统工程的可靠性：软件环境、硬件版本复杂多变，通过训推一体链条基础链条，保证模型基础训练预测功能的可靠性。
保证飞桨训推一体功能完备性：作为产业级深度学习平台，PaddlePaddle希望模型可以被更多的开发者在实际的使用场景中使用。提供了训推一体的pipeline，方便用户查询部署支持情况：python、C++、lite、serving、各种硬件，进而可以选择合适的部署方案。

官网链接：飞桨训练推理部署导航

2. 系统框图

2.1 任务概览

工程落地赛包含以下2种方式。

合入官方套件：按照规范，将模型合入官方套件。
模型工程落地赛：需要完成下面3个任务中的若干项。
- 增加TIPC基础链条支持。
- PaddleServing服务化部署。
- 轻量化骨干网络验证。

对于每篇论文，需要根据特定要求的步骤完成要求的过程。

3. 模型合入官方套件

3.1 简介

将开发者经过整理且符合规范的代码合入到官方套件，可以进一步提升个人影响力以及代码文档的规范性，同时也可以增加官方套件的丰富性。

3.2 具体内容

按照官方套件的代码规范，将复现的论文适配到对应的套件中。各个repo的代码贡献指南以及参考PR如下所示。

官方套件

贡献代码指南

示例代码链接

3.3 验收方法

按照官方套件的代码贡献指南，提交代码，提供PR链接，由Paddle官方同学review，选手根据review意见进行修改与完善。代码合入后即认为验收通过。

4. 模型工程落地赛

4.1 增加TIPC基础链条支持

4.1.1 简介

飞桨除了基本的模型训练和预测，还提供了支持多端多平台的高性能推理部署工具。本文档以Arcface为例，展示了 PaddlePaddle 模型的飞桨训推一体认证 (Training and Inference Pipeline Certification(TIPC)) 信息和测试工具，方便用户查阅每种模型的训练推理部署打通情况，并可以进行一键测试。

4.1.2 具体内容

完成模型的模型动转静、Inference推理过程的文档与代码。参考链接：
- Linux GPU/CPU 推理功能开发文档
完成模型的训练推理测试开发过程，参考链接：
- Linux GPU/CPU 基础训练推理测试开发文档

4.1.3 验收方法

Linux GPU/CPU 基础训练推理开发文档中第3章和第4章的所有核验点满足要求。

4.2 Paddle Serving服务化部署

4.2.1 简介

Paddle Serving 旨在帮助深度学习开发者轻易部署在线预测服务。目标是：当用户使用 Paddle 训练了一个深度神经网络，就同时拥有了该模型的预测服务。

4.2.2 具体内容

完成基于该模型的Serving服务化部署，提供相应的说明文档。参考链接：
- Linux GPU/CPU 服务化部署功能开发文档
完成基于该模型的Serving服务化部署测试开发，并提供相应的文档。参考链接：
- Linux GPU/CPU 服务化部署测试开发文档

4.2.3 验收方法

Linux GPU/CPU 服务化部署开发文档中第2章和第3章的所有核验点满足要求。

4.3 模型轻量化骨干网络验证

4.3.1 简介

作为产业结合的深度学习框架，PaddlePaddle希望被更多用户在实际的场景中应用，但是大部分论文都是基于相对较大的骨干网络进行实验，如VGG、ResNet等，本部分希望通过更换骨干网络，让模型轻量化，方便实际部署过程。

4.3.2 具体内容

分别更换模型的骨干网络为MobileNetV1_x1_0，MobileNetV3_large_x1_0，MobileNetV3_small_x1_0，ShuffleNetV2_x1_0并进行训练，记录精度、训练结果模型，保存日志文件。
将更换骨干网络产出的4个模型接入TIPC基础训练推理测试链条，并将测试文档和测试脚本放置在test_tipc目录中。

4.3.3 轻量化网络选型和特征抽取选型

网络选型：本期工程落地赛中，选取的轻量化骨干网络在ImageNet1k验证集上的精度以及模型大小如下所示。

网络

ImageNet TOP1 ACC

模型大小

MobileNetV1_x1_0

0.7099

24MB

MobileNetV3_large_x1_0

0.7530

32MB

MobileNetV3_small_x1_0

0.6820

17MB

ShuffleNetV2_x1_0

0.6880

12MB

特征图抽取

对于检测，分割等CV任务，在backbone阶段一般输出3~4个特征图，分别在backbone输出shape为输入shape的1/4, 1/8, 1/16 和 1/32 处，在进行接入时，可以逐层打印网络的输出shape。如PaddleDetection里MobileNetV3_large_x1_0，当输入为 [1,3,640,640] 时，输出的shape如下。

idx: 2 shape [1, 16, 320, 320]
idx: 3 shape [1, 24, 160, 160]
idx: 4 shape [1, 24, 160, 160]
idx: 5 shape [1, 40, 80, 80]
idx: 6 shape [1, 40, 80, 80]
idx: 7 shape [1, 40, 80, 80]
idx: 8 shape [1, 80, 40, 40]
idx: 9 shape [1, 80, 40, 40]
idx: 10 shape [1, 80, 40, 40]
idx: 11 shape [1, 80, 40, 40]
idx: 12 shape [1, 112, 40, 40]
idx: 13 shape [1, 112, 40, 40]
idx: 14 shape [1, 160, 20, 20]
idx: 15 shape [1, 160, 20, 20]
idx: 16 shape [1, 160, 20, 20]

各个阶段特征图和idx对应关系如下，各个特征图大小对应的idx分别有很多个，通常取最后一个idx即为传入网络的idx，这里为[4, 7, 13, 16]。

特征图大小

对应的idx

1/4

[3,4]

1/8

[5,6,7]

1/16

[8,9,10,11,12,13]

1/32

[14,15,16]

示例代码：PaddleDetection CenterNet文档和配置

4.3.4 验收方法

更换骨干网络，填写上表中详细内容，提交训练代码、不同骨干网络下的训练日志以及结果表格。

骨干网络

模型指标

模型训练超参(有变化时需要说明)

原始论文

37.4

MobileNetV1_x1_0

28.2

batchsize=32

MobileNetV3_large_x1_0

27.1

batchsize=32

MobileNetV3_small_x1_0

17.0

batchsize=32

ShuffleNetV2_x1_0

23.8

batchsize=32

文件夹test_tipc目录中，参考基础训练推理测试开发文文档，为不同骨干网络对应的模型添加全流程测试代码与文档。

5. 模型工程落地赛注意事项与FAQ

5.1 通用问题

如果在任何阶段，报错信息提示为Paddle导致，可以给Paddle提ISSUE，获得研发同学高优支持。

5.2 模型合入官方套件

合入的过程中，如果有代码方面的问题，可以在对应模型套件的repo下面新建ISSUE，注明目前的具体问题，标题中补充【工程落地赛】。

5.3 TIPC基础链条预测

动转静遇到问题时的调试方法：动态图转静态图调试方法教程

5.4 Paddle Serving服务化部署

如果发送请求后没有结果返回或者提示输出解码报错，可能是因为：
- 启动服务和发送请求时不能设置代理，可以在启动服务前和发送请求前关闭代理，关闭代理的命令是：
```
unset https_proxy
unset http_proxy
```

5.5 轻量化骨干网络验证

该工程落地项主要是为验证CV任务中的骨干网络，下面一些任务不需要验证该项。
- NLP任务
- 图像分类任务
- 非模型训练任务（模型可视化等）
- 对抗攻击网络
- 更多...
骨干网络的实现与预训练模型可以从PaddleClas中获得，预训练模型的下载地址在骨干网络实现的文件中可以获得，以MobileNetV3_large_x1_0为例，预训练模型下载地址对应的内容为：链接，定义的时候，指定pretrained参数为True即可加载预训练模型。

PreviousImplementation NextImplementation

Last updated 3 years ago