简述OpenVINO™ + ResNet实现图像分类-APISpace

简述OpenVINO™ + ResNet实现图像分类

推理引擎(IE)应用开发流程

与相关函数介绍

图-1

Step 1:

InferenceEngine::Core // IE对象

Step 2:

Step 3:

使用上述两个相关输入与输出对象就可以设置输入的数据类型与精度，获取输入与输出层的名称。

Step 4:

ExecutableNetwork LoadNetwork ( const CNNNetwork &network, const std::string &deviceName, const std::map< std::string, std::string > &config={} )

通过Core的LoadNetwork方法生成可执行的网络，如果你有多个设备，就可以创建多个可执行的网络。其参数解释如下：

network 参数表示step2加载得到CNNNetwork对象实例

config默认为空

InferRequest InferenceEngine::CreateInferRequest()

表示从可执行网络创建推理请求。

Step 5:

根据输入层的名称获取输入buffer数据缓冲区，然后把输入图像数据填到缓冲区，实现输入设置。其中根据输入层名称获取输入缓冲区的函数为如下：

Blob::Ptr GetBlob ( const std::string &name // 输入层名称 )

注意：返回包含输入层维度信息，支持多个输入层数据设置！

Step 6:

推理预测，直接调用推理请求的InferRequest.infer()方法即可，该方法无参数。

Step 7:

调用InferRequest的GetBlob()方法，使用参数为输出层名称，就会得到网络的输出预测结果，根据输出层维度信息进行解析即可获取输出预测信息与显示。

图像分类与ResNet网络

图像分类是计算机视觉的关键任务之一，关于图像分类最知名的数据集是ImageNet，包含了自然场景下大量各种的图像数据，支持1000个类别的图像分类。OpenVINO在模型库的public中有ResNet模型1000个分类的预训练模型支持，它们主要是：

- resnest-18-pytorch

- resnest-34-pytorch

- resnest-50-pytorch

- resnet-50-tf

图-2（来自《Deep Residual Learning for Image Recognition》论文）

我们以ResNet18-pytorch的模型为例，基于Pytorch框架我们可以很轻松的把它转换为ONNX格式文件。然后使用Netron工具打开，可以看到网络的输入图示如下：

图-3

查看网络的输出：

图-4

这样我们很清楚的知道网络的输入与输出层名称，输入数据格式与输出数据格式，其中输入数据格式NCHW中的N表示图像数目，这里是1、C表示图像通道数，这里输入的是彩色图像，通道数为3、H与W分别表示图像的高与宽，均为224。在输出格式中1x1000中1表示图像数目、1000表示预测的1000个分类的置信度数据。

程序实现的基本流程与步骤

前面已经介绍了IE SDK相关函数，图像分类模型ResNet18的输入与输出格式信息。现在我们就可以借助IE SDK来完成一个完整的图像分类模型的应用部署了，根据前面提到的步骤各步的代码实现与解释如下：

1. 初始化IE

InferenceEngine::Core ie;

2. 加载ResNet18网络

InferenceEngine::CNNNetwork network = ie.ReadNetwork(onnx); InferenceEngine::InputsDataMap inputs = network.getInputsInfo(); InferenceEngine::OutputsDataMap outputs = network.getOutputsInfo();

3. 获取输入与输出名称、设置输入与输出数据格式

std::string output_name = ""; for (auto item : outputs) { output_name = item.first; auto output_data = item.second; output_data->setPrecision(Precision::FP32); std::cout << "output name: " << output_name << std::endl; }

4. 获取推理请求对象实例

auto executable_network = ie.LoadNetwork(network, "CPU"); auto infer_request = executable_network.CreateInferRequest();

5. 输入图像数据设置

auto input = infer_request.GetBlob(input_name); size_t num_channels = input->getTensorDesc().getDims()[1]; size_t h = input->getTensorDesc().getDims()[2]; size_t w = input->getTensorDesc().getDims()[3]; size_t image_size = h*w; cv::Mat blob_image; cv::resize(src, blob_image, cv::Size(w, h)); cv::cvtColor(blob_image, blob_image, cv::COLOR_BGR2RGB); blob_image.convertTo(blob_image, CV_32F); blob_image = blob_image / 255.0; cv::subtract(blob_image, cv::Scalar(0.485, 0.456, 0.406), blob_image); cv::divide(blob_image, cv::Scalar(0.229, 0.224, 0.225), blob_image);

// HWC =》NCHW float* data = static_cast(input->buffer());for (size_t row = 0; row < h; row++) { for (size_t col = 0; col < w; col++) { for (size_t ch = 0; ch < num_channels; ch++) { data[image_sizech + row*w + col] = blob_image.at(row, col)[ch]; } } }

在输入数据部分OpenCV导入的图像三通道顺序是BGR，所以要转换为RGB，resize到224x224大小、像素值归一化为0~1之间、然后要减去均值(0.485, 0.456, 0.406)，除以方差(0.229, 0.224, 0.225)完成预处理之后再填充到Blob缓冲区中区。

6. 推理

infer_request.Infer();

7. 解析输出与显示结果

auto output = infer_request.GetBlob(output_name); const float* probs = static_cast ::value_type*>(output->buffer()); const SizeVector outputDims = output->getTensorDesc().getDims(); std::cout << outputDims[0] << "x" << outputDims[1] << std::endl; float max = probs[0]; int max_index = 0; for (int i = 1; i < outputDims[1]; i++) { if (max < probs[i]) { max = probs[i]; max_index = i; } }

解析部分代码首先通过输出层名称获取输出数据对象BLOB，然后根据输出格式1x1000，寻找最大值对应的index，根据索引index得到对应的分类标签，然后通过OpenCV图像输出分类结果。

运行结果

图-5（来自ImageNet测试集）

c语言sscanf函数的用法是什么

409 2022-11-21

简述OpenVINO™ + ResNet实现图像分类

c语言sscanf函数的用法是什么

r语言清空数组的方法是什么

c语言一维数组怎么快速排列

推荐文章

api接口有哪几种分类及功能

什么是API接口?API接口简单介绍

短信API接口概述，短信API接口的优势

7款快递物流的物流查询API工具，物流快递查询API接口怎么对接？

企业四要素: 了解企业经营成功的关键

什么是语音验证码?,语音验证码平台有哪些

全国工商查询系统怎么查企业名录

哪些平台提供实名认证的接口？

PHP如何调用API接口?

如何使用百度天气预报API接口?

最近发表

热评文章

数据接口api（数据接口API开发平台）

数据开放接口api（数据服务api开发）

Python爬虫教程：爬取酷狗音乐（python爬取

hbuilder怎么更改字体大小和颜色

直播平台api接口 - 构建卓越的直播平台

实时股票数据api接口（股票实时行情api接口）