add moss-int4
This commit is contained in:
commit
57cb6b05de
|
|
@ -87,6 +87,12 @@ llm_model_dict = {
|
||||||
"local_model_path": None,
|
"local_model_path": None,
|
||||||
"provides": "MOSSLLMChain"
|
"provides": "MOSSLLMChain"
|
||||||
},
|
},
|
||||||
|
"moss-int4": {
|
||||||
|
"name": "moss",
|
||||||
|
"pretrained_model_name": "fnlp/moss-moon-003-sft-int4",
|
||||||
|
"local_model_path": None,
|
||||||
|
"provides": "MOSSLLM"
|
||||||
|
},
|
||||||
"vicuna-13b-hf": {
|
"vicuna-13b-hf": {
|
||||||
"name": "vicuna-13b-hf",
|
"name": "vicuna-13b-hf",
|
||||||
"pretrained_model_name": "vicuna-13b-hf",
|
"pretrained_model_name": "vicuna-13b-hf",
|
||||||
|
|
@ -204,6 +210,10 @@ STREAMING = True
|
||||||
# Use p-tuning-v2 PrefixEncoder
|
# Use p-tuning-v2 PrefixEncoder
|
||||||
USE_PTUNING_V2 = False
|
USE_PTUNING_V2 = False
|
||||||
PTUNING_DIR='./ptuing-v2'
|
PTUNING_DIR='./ptuing-v2'
|
||||||
|
<<<<<<< HEAD
|
||||||
|
=======
|
||||||
|
|
||||||
|
>>>>>>> f68d347c25b4bdd07f293c65a6e44a673a11f614
|
||||||
# LLM running device
|
# LLM running device
|
||||||
LLM_DEVICE = "cuda" if torch.cuda.is_available() else "mps" if torch.backends.mps.is_available() else "cpu"
|
LLM_DEVICE = "cuda" if torch.cuda.is_available() else "mps" if torch.backends.mps.is_available() else "cpu"
|
||||||
|
|
||||||
|
|
|
||||||
Loading…
Reference in New Issue