AI 模型编译器 MegCC 开源，解决推理引擎体积问题

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 871 天前的主题，其中的信息可能已经有所发展或是发生改变。

目前社区已经有多个移动端深度学习推理框架，如：NCNN 、MNN... 这些推理引擎都给社区的用户带来了在移动端上部署深度学习非常多的便利，但是他们也都有一个共性问题：随着不断地迭代以及性能优化，运行时库会逐渐的增大，特别是在不同算子 fuse 的时候，会导致非常多的长尾算子，这就会增大我们 App 或者 SDK 的体积。

为了解决这个问题，由 MegEngine 团队开源的 MegCC 创新使用模型预编译的方案，生成模型推理必要的代码，去除掉了和模型推理无关的代码，因此极大程度上减少了推理引擎的体积。主要方法是：

将传统框架运行时的必要步骤：计算图优化、Kernel 选择、内存分配都移到编译时，从而最大程度上减少了 Runtime 时的二进制体积大小，并根据模型信息做进一步的性能优化。

该方案有以下优点：

随着框架的迭代将不会使得推理引擎的体积增大
很多的算子融合可以在编译时根据模型信息生成对应的 code
模型编译时可以获得整个计算图的信息，这样可以进一步进行极致的性能优化
可以吸收社区在代码生成方面的经验用于为 MegCC 生成 code

不同于传统推理框架，MegCC 是一个真真实实的深度学习模型编译器，具备极其轻量的 Runtime 二进制体积，高性能，方便移植，极低内存使用以及快启动等核心特点。用户可在 MLIR 上进行计算图优化，内存规划，最后通过预先写好的 code 模版进行代码生成。目前，MegCC 已支持 Arm64 ，Armv7 ，x86 ，risc-v 以及单片机平台。

GitHub 开源地址：https://github.com/MegEngine/MegCCgithub.com/MegEngine/MegCC