update README.md

2023-10-11 06:13:48 +08:00 · 2023-10-11 06:13:48 +08:00 · c313f99b40
parent 76e21c87da
commit c313f99b40
1 changed files with 5 additions and 2 deletions
--- a/README.md
+++ b/README.md
@ -85,8 +85,11 @@ docker run -d --gpus all -p 80:8501 registry.cn-beijing.aliyuncs.com/chatchat/ch
  + 最低显存要求: 40GB  
  + 推荐显卡: A100, A40, A6000

-如果使用 int8 推理，则以显存x1.5倍要求；使用 fp16 推理，则以显存x2.5倍要求。
-例如，使用 Qwen-7B-Chat 模型 fp16 推理，则需要使用 16GB 显存。
+若使用 int8 推理，则显存大致为 int4 推理要求的 1.5 倍；
+
+若使用 fp16 推理，则显存大致为 int4 推理要求的 2.5 倍。
+
+💡 例如：使用 fp16 推理 Qwen-7B-Chat 模型，则需要使用 16GB 显存。

 以上仅为估算，实际情况以 nvidia-smi 占用为准。