ModelCloud · Qubitium · Nov 28, 2024 · Nov 26, 2024 · Nov 26, 2024 · Nov 26, 2024
diff --git a/gptqmodel/__init__.py b/gptqmodel/__init__.py
@@ -1,4 +1,5 @@
 from .models import GPTQModel, get_best_device
 from .quantization import BaseQuantizeConfig, QuantizeConfig
 from .utils import BACKEND, get_backend
+from .utils.exllama import exllama_set_max_input_length
 from .version import __version__
diff --git a/gptqmodel/integration/__init__.py b/gptqmodel/integration/__init__.py
diff --git a/gptqmodel/integration/optimum/__init__.py b/gptqmodel/integration/optimum/__init__.py
diff --git a/gptqmodel/integration/optimum/constants.py b/gptqmodel/integration/optimum/constants.py
diff --git a/gptqmodel/integration/optimum/data.py b/gptqmodel/integration/optimum/data.py
diff --git a/gptqmodel/integration/optimum/hf_quantizer_gptq.py b/gptqmodel/integration/optimum/hf_quantizer_gptq.py