Halide(五)算法调度

这篇博客应该紧跟在第二节  Halide(二)算法描述 后面的,也是对官方教程的笔记。前面介绍了如何用Halide描述算法,进行调试,这一节就是讲如何对去调度算法,排算法的流水,让算法运行更快。

算法调度是一个很深入的课题,牵扯都各种平台、算法,这篇博客也仅仅是对官方教程第四节到第八节的简要笔记,记录一下Halide的相关API。

阅读更多

Halide(三)Buffer与cv::Mat的相互转换

目前OpenCV的NN模块中已经有Halide一部分代码,可以通过 net.setPreferableBackend(DNN_BACKEND_HALIDE); 告诉OpenCV NN引擎尽可能使用Halide进行计算。除非以后OpenCV完全实现Halide的运行机制,否则在图像处理任务中,Halide与OpenCV协同工作是不可避免的。这篇博客主要介绍Halide的图像类型和OpenCV图像类型的相互转化。

阅读更多

Halide(二)算法描述

基本语法和规则一定从官方教程开始,这篇博客是官方教程前几节的简要笔记。主要介绍 Halide 算法描述的语法规则、变量打印和调试、算法对ROI和padding的处理。

Halide(五)算法调度 是紧跟在本博客之后的章节,都是对官方教程的笔记,(三)和(四)是一些环境和常用算法的穿插,不关心可跳过。

阅读更多

Halide(一)环境配置

在工业生产环境中,算法从设计到落地一般跨度比较大。尤其是计算密集的图像处理算法,要达到比较高的效率,就必须要在数据临近、数据复用、计算并行等方面做均衡,算法实现者通常需要深入了解该算法,才能取得比较好的优化。为了降低算法实现过程中开发者的负担,要把算法设计和实现相分离开来,已经有多重解决案例,其中较为典型的就是Halide。

Halide就不多介绍了,毕竟是在Pixel2 HDR Plus上用过的,官网:https://halide-lang.org,上面有很多详细的教程和文档。Halide主要分为两部分,第一部分是要描述需要计算的内容(计算在算法层面的流程),第二部分是规划计算,把计算并行起来、分块儿、数据复用、顺序重排,以实现更高的性能。博主认为第一部分是比较容易的,官网的教程看一遍就可以理解,自己再跑下demo,而第二分部取决于使用的硬件,如果调试优化,需要更多时间去摸索(毕竟我们使用halide是为了获得比较高的性能,减少部署开销)。

这篇博客主要介绍windows下配置halide开发环境,linux配置开发环境比较简单,并且官网已经写的很详细了,只在最后会简要讲下linux配置开发环境步骤中官网没有提及的部分。

阅读更多