InfiniCore 是一个跨平台统一编程工具集,为不同芯片平台的功能(包括计算、运行时、通信等)提供统一 C 语言接口。目前支持的硬件和后端包括:
- CPU;
- CUDA
- 英伟达 GPU;
- 摩尔线程 GPU;
- 天数智芯 GPU;
- 沐曦 GPU;
- 曙光 DCU;
- 华为昇腾 NPU;
- 寒武纪 MLU;
- 昆仑芯 XPU;
API 定义以及使用方式详见 InfiniCore文档
。
在 script/
目录中提供了 install.py
安装脚本。使用方式如下:
cd InfiniCore
python scripts/install.py [XMAKE_CONFIG_FLAGS]
参数 XMAKE_CONFIG_FLAGS
是 xmake 构建配置,可配置下列可选项:
选项 | 功能 | 默认值 |
---|---|---|
--omp=[y|n] |
是否使用 OpenMP | y |
--cpu=[y|n] |
是否编译 CPU 接口实现 | y |
--nv-gpu=[y|n] |
是否编译英伟达 GPU 接口实现 | n |
--ascend-npu=[y|n] |
是否编译昇腾 NPU 接口实现 | n |
--cambricon-mlu=[y|n] |
是否编译寒武纪 MLU 接口实现 | n |
--metax-gpu=[y|n] |
是否编译沐曦 GPU 接口实现 | n |
--moore-gpu=[y|n] |
是否编译摩尔线程 GPU 接口实现 | n |
--iluvatar-gpu=[y|n] |
是否编译沐曦 GPU 接口实现 | n |
--sugon-dcu=[y|n] |
是否编译曙光 DCU 接口实现 | n |
--kunlun-xpu=[y|n] |
是否编译昆仑 XPU 接口实现 | n |
--ninetoothed=[y|n] |
是否编译九齿实现 | n |
--ccl=[y|n] |
是否编译 InfiniCCL 通信库接口实现 | n |
-
生成九齿算子(可选)
参见使用九齿章节。
-
项目配置
windows系统上,建议使用
xmake v2.8.9
编译项目。-
查看当前配置
xmake f -v
-
配置 CPU(默认配置)
xmake f -cv
-
配置加速卡
# 英伟达 # 可以指定 CUDA 路径, 一般环境变量为 `CUDA_HOME` 或者 `CUDA_ROOT` # window系统:--cuda="%CUDA_HOME%" # linux系统:--cuda=$CUDA_HOME xmake f --nv-gpu=true --cuda=$CUDA_HOME -cv # 寒武纪 xmake f --cambricon-mlu=true -cv # 华为昇腾 xmake f --ascend-npu=true -cv
-
-
编译安装
默认安装路径为
$HOME/.infini
。xmake build && xmake install
-
设置环境变量
按输出提示设置
INFINI_ROOT
和LD_LIBRARY_PATH
环境变量。
python test/infiniop/[operator].py [--cpu | --nvidia | --cambricon | --ascend]
python scripts/python_test.py [--cpu | --nvidia | --cambricon | --ascend]
详见 test/infiniop-test
目录
编译(需要先安装InfiniCCL):
xmake build infiniccl-test
在英伟达平台运行测试(会自动使用所有可见的卡):
infiniccl-test --nvidia
九齿是一门基于 Triton 但提供更高层抽象的领域特定语言(DSL)。使用九齿可以降低算子的开发门槛,并且提高开发效率。
InfiniCore 目前已经可以接入使用九齿实现的算子,但是这部分实现的编译是默认关闭的。如果选择编译库中的九齿实现,需要使用 --ninetoothed=y
,并在运行一键安装脚本前完成以下准备工作:
- 安装九齿与九齿算子库:
git clone https://github.com/InfiniTensor/ntops.git
cd ntops
pip install -e .
注:安装 ntops
时,ninetoothed
会被当成依赖也一并安装进来。
- 在
InfiniCore
文件夹下运行以下命令 AOT 编译库中的九齿算子:
PYTHONPATH=${PYTHONPATH}:src python scripts/build_ntops.py
注:如果对九齿相关文件有修改,需要重新构建 InfiniCore 时,也需要同时运行以上命令进行重新生成。