You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
fanpt 34c5ad4044 paddleocr 10 months ago
..
configs paddleocr 10 months ago
docs paddleocr 10 months ago
results paddleocr 10 months ago
supplementary paddleocr 10 months ago
web paddleocr 10 months ago
benchmark_train.sh paddleocr 10 months ago
build_server.sh paddleocr 10 months ago
common_func.sh paddleocr 10 months ago
compare_results.py paddleocr 10 months ago
prepare.sh paddleocr 10 months ago
prepare_js.sh paddleocr 10 months ago
prepare_lite_cpp.sh paddleocr 10 months ago
readme.md paddleocr 10 months ago
test_inference_cpp.sh paddleocr 10 months ago
test_inference_js.sh paddleocr 10 months ago
test_inference_python.sh paddleocr 10 months ago
test_lite_arm_cpp.sh paddleocr 10 months ago
test_paddle2onnx.sh paddleocr 10 months ago
test_ptq_inference_python.sh paddleocr 10 months ago
test_serving_infer_cpp.sh paddleocr 10 months ago
test_serving_infer_python.sh paddleocr 10 months ago
test_train_inference_python.sh paddleocr 10 months ago
test_train_inference_python_npu.sh paddleocr 10 months ago
test_train_inference_python_xpu.sh paddleocr 10 months ago

readme.md

飞桨训推一体全流程TIPC

1. 简介

飞桨除了基本的模型训练和预测还提供了支持多端多平台的高性能推理部署工具。本文档提供了PaddleOCR中所有模型的飞桨训推一体全流程Training and Inference Pipeline Criterion(TIPC))信息和测试工具,方便用户查阅每种模型的训练推理部署打通情况,并可以进行一键测试。

2. 汇总信息

打通情况汇总如下,已填写的部分表示可以使用本工具进行一键测试,未填写的表示正在支持中。

字段说明:

  • 基础训练预测包括模型训练、Paddle Inference Python预测。
  • 更多训练方式:包括多机多卡、混合精度。
  • 模型压缩:包括裁剪、离线/在线量化、蒸馏。
  • 其他预测部署包括Paddle Inference C++预测、Paddle Serving部署、Paddle-Lite部署等。

更详细的mkldnn、Tensorrt等预测加速相关功能的支持情况可以查看各测试工具的更多教程

算法论文 模型名称 模型类型 基础
训练预测
更多
训练方式
模型压缩 其他预测部署
DB ch_ppocr_mobile_v2.0_det 检测 支持 多机多卡
混合精度
- Paddle Inference: C++
Paddle Serving: Python, C++
Paddle-Lite:
(1) ARM CPU(C++)
DB ch_ppocr_mobile_v2.0_det_FPGM 检测 支持 多机多卡
混合精度
FPGM裁剪 Paddle Inference: C++
Paddle Serving: Python, C++
Paddle-Lite:
(1) ARM CPU(C++)
DB ch_ppocr_mobile_v2.0_det_PACT 检测 支持 多机多卡
混合精度
PACT量化 Paddle Inference: C++
Paddle Serving: Python, C++
Paddle-Lite:
(1) ARM CPU(C++)
DB ch_ppocr_mobile_v2.0_det_KL 检测 支持 多机多卡
混合精度
离线量化 Paddle Inference: C++
Paddle Serving: Python, C++
Paddle-Lite:
(1) ARM CPU(C++)
DB ch_ppocr_server_v2.0_det 检测 支持 多机多卡
混合精度
- Paddle Inference: C++
Paddle Serving: Python, C++
DB ch_PP-OCRv2_det 检测 支持 多机多卡
混合精度
- Paddle Inference: C++
Paddle Serving: Python, C++
CRNN ch_ppocr_mobile_v2.0_rec 识别 支持 多机多卡
混合精度
- Paddle Inference: C++
Paddle Serving: Python, C++
Paddle-Lite:
(1) ARM CPU(C++)
CRNN ch_ppocr_server_v2.0_rec 识别 支持 多机多卡
混合精度
- Paddle Inference: C++
Paddle Serving: Python, C++
CRNN ch_PP-OCRv2_rec 识别 支持 多机多卡
混合精度
- Paddle Inference: C++
Paddle Serving: Python, C++
PP-OCR ch_ppocr_mobile_v2.0 检测+识别 支持 多机多卡
混合精度
- Paddle Inference: C++
Paddle Serving: Python, C++
Paddle-Lite:
(1) ARM CPU(C++)
PP-OCR ch_ppocr_server_v2.0 检测+识别 支持 多机多卡
混合精度
- Paddle Inference: C++
Paddle Serving: Python, C++
PP-OCRv2 ch_PP-OCRv2 检测+识别 支持 多机多卡
混合精度
- Paddle Inference: C++
Paddle Serving: Python, C++
DB det_mv3_db_v2.0 检测 支持 多机多卡
混合精度
- -
DB det_r50_vd_db_v2.0 检测 支持 多机多卡
混合精度
- -
EAST det_mv3_east_v2.0 检测 支持 多机多卡
混合精度
- -
EAST det_r50_vd_east_v2.0 检测 支持 多机多卡
混合精度
- -
PSENet det_mv3_pse_v2.0 检测 支持 多机多卡
混合精度
- -
PSENet det_r50_vd_pse_v2.0 检测 支持 多机多卡
混合精度
- -
SAST det_r50_vd_sast_totaltext_v2.0 检测 支持 多机多卡
混合精度
- -
Rosetta rec_mv3_none_none_ctc_v2.0 识别 支持 多机多卡
混合精度
- -
Rosetta rec_r34_vd_none_none_ctc_v2.0 识别 支持 多机多卡
混合精度
- -
CAN rec_d28_can 识别 支持 多机多卡
混合精度
- -
CRNN rec_mv3_none_bilstm_ctc_v2.0 识别 支持 多机多卡
混合精度
- -
CRNN rec_r34_vd_none_bilstm_ctc_v2.0 识别 支持 多机多卡
混合精度
- -
StarNet rec_mv3_tps_bilstm_ctc_v2.0 识别 支持 多机多卡
混合精度
- -
StarNet rec_r34_vd_tps_bilstm_ctc_v2.0 识别 支持 多机多卡
混合精度
- -
RARE rec_mv3_tps_bilstm_att_v2.0 识别 支持 多机多卡
混合精度
- -
RARE rec_r34_vd_tps_bilstm_att_v2.0 识别 支持 多机多卡
混合精度
- -
SRN rec_r50fpn_vd_none_srn 识别 支持 多机多卡
混合精度
- -
NRTR rec_mtb_nrtr 识别 支持 多机多卡
混合精度
- -
SAR rec_r31_sar 识别 支持 多机多卡
混合精度
- -
SPIN rec_r32_gaspin_bilstm_att 识别 支持 多机多卡
混合精度
- -
RobustScanner rec_r31_robustscanner 识别 支持 多机多卡
混合精度
- -
PGNet rec_r34_vd_none_none_ctc_v2.0 端到端 支持 多机多卡
混合精度
- -
TableMaster table_structure_tablemaster_train 表格识别 支持 多机多卡
混合精度
- -

3. 测试工具简介

目录介绍

test_tipc/
├── configs/  # 配置文件目录
    ├── ch_ppocr_mobile_v2.0_det    # ch_ppocr_mobile_v2.0_det模型的测试配置文件目录
        ├── train_infer_python.txt      # 测试Linux上python训练预测基础训练预测的配置文件
        ├── model_linux_gpu_normal_normal_infer_cpp_linux_gpu_cpu.txt     # 测试Linux上c++预测的配置文件
        ├── model_linux_gpu_normal_normal_infer_python_jetson.txt         # 测试Jetson上python预测的配置文件
        ├── train_linux_gpu_fleet_amp_infer_python_linux_gpu_cpu.txt      # 测试Linux上多机多卡、混合精度训练和python预测的配置文件
        ├── ...
    ├── ch_ppocr_server_v2.0_det               # ch_ppocr_server_v2.0_det模型的测试配置文件目录
        ├── ...
    ├── ch_ppocr_mobile_v2.0_rec               # ch_ppocr_mobile_v2.0_rec模型的测试配置文件目录
        ├── ...
    ├── ch_ppocr_server_v2.0_det               # ch_ppocr_server_v2.0_det模型的测试配置文件目录
        ├── ...
    ├── ...
├── results/   # 预先保存的预测结果,用于和实际预测结果进行精读比对
    ├── python_ppocr_det_mobile_results_fp32.txt           # 预存的mobile版ppocr检测模型python预测fp32精度的结果
    ├── python_ppocr_det_mobile_results_fp16.txt           # 预存的mobile版ppocr检测模型python预测fp16精度的结果
    ├── cpp_ppocr_det_mobile_results_fp32.txt       # 预存的mobile版ppocr检测模型c++预测的fp32精度的结果
    ├── cpp_ppocr_det_mobile_results_fp16.txt       # 预存的mobile版ppocr检测模型c++预测的fp16精度的结果
    ├── ...
├── prepare.sh                        # 完成test_*.sh运行所需要的数据和模型下载
├── test_train_inference_python.sh    # 测试python训练预测的主程序
├── test_inference_cpp.sh             # 测试c++预测的主程序
├── test_serving.sh                   # 测试serving部署预测的主程序
├── test_lite_arm_cpu_cpp.sh          # 测试lite在arm_cpu上部署的C++预测的主程序
├── compare_results.py                # 用于对比log中的预测结果与results中的预存结果精度误差是否在限定范围内
└── readme.md                         # 使用文档

测试流程概述

使用本工具,可以测试不同功能的支持情况,以及预测结果是否对齐,测试流程概括如下:

  1. 运行prepare.sh准备测试所需数据和模型
  2. 运行要测试的功能对应的测试脚本test_*.sh产出log由log可以看到不同配置是否运行成功
  3. compare_results.py对比log中的预测结果和预存在results目录下的结果判断预测精度是否符合预期在误差范围内

测试单项功能仅需两行命令,如需测试不同模型/功能,替换配置文件即可,命令格式如下:

# 功能:准备数据
# 格式bash + 运行脚本 + 参数1: 配置文件选择 + 参数2: 模式选择
bash test_tipc/prepare.sh  configs/[model_name]/[params_file_name]  [Mode]

# 功能:运行测试
# 格式bash + 运行脚本 + 参数1: 配置文件选择 + 参数2: 模式选择
bash test_tipc/test_train_inference_python.sh configs/[model_name]/[params_file_name]  [Mode]

例如,测试基本训练预测功能的lite_train_lite_infer模式,运行:

# 准备数据
bash test_tipc/prepare.sh ./test_tipc/configs/ch_ppocr_mobile_v2.0_det/train_infer_python.txt 'lite_train_lite_infer'
# 运行测试
bash test_tipc/test_train_inference_python.sh ./test_tipc/configs/ch_ppocr_mobile_v2.0_det/train_infer_python.txt 'lite_train_lite_infer'

关于本示例命令的更多信息可查看基础训练预测使用文档

配置文件命名规范

configs目录下,按模型名称划分为子目录,子目录中存放所有该模型测试需要用到的配置文件,配置文件的命名遵循如下规范:

  1. 基础训练预测配置简单命名为:train_infer_python.txt,表示Linux环境下单机、不使用混合精度训练+python预测,其完整命名对应train_linux_gpu_normal_normal_infer_python_linux_gpu_cpu.txt,由于本配置文件使用频率较高,这里进行了名称简化。

  2. 其他带训练配置命名格式为:train_训练硬件环境(linux_gpu/linux_dcu/…)_是否多机(fleet/normal)_是否混合精度(amp/normal)_预测模式(infer/lite/serving/js)_语言(cpp/python/java)_预测硬件环境(linux_gpu/mac/jetson/opencl_arm_gpu/...).txt。如linux gpu下多机多卡+混合精度链条测试对应配置 train_linux_gpu_fleet_amp_infer_python_linux_gpu_cpu.txtlinux dcu下基础训练预测对应配置 train_linux_dcu_normal_normal_infer_python_linux_dcu.txt

  3. 仅预测的配置如serving、lite等命名格式model_训练硬件环境(linux_gpu/linux_dcu/…)_是否多机(fleet/normal)_是否混合精度(amp/normal)_(infer/lite/serving/js)_语言(cpp/python/java)_预测硬件环境(linux_gpu/mac/jetson/opencl_arm_gpu/...).txt与2相比仅第一个字段从train换为model测试时模型直接下载获取这里的“训练硬件环境”表示所测试的模型是在哪种环境下训练得到的。

根据上述命名规范,可以直接从子目录名称和配置文件名找到需要测试的场景和功能对应的配置文件。

4. 开始测试

各功能测试中涉及混合精度、裁剪、量化等训练相关及mkldnn、Tensorrt等多种预测相关参数配置请点击下方相应链接了解更多细节和使用教程