使用如下命令安装cuda版 CMAKE_ARGS="-DGGML_CUDA=ON" pip install -U chatglm-cpp Linux云服务机器,资源有限,AWS g4dn.xlarge 安装直接导致机器卡死,ssh都响应不了 v0.4.0有此现象,v0.3.x没有 请问有没有能限制资源使用的cmake args?