zR
|
efd8edda16
|
Dev (#1618)
* 增加了仅限GPT4的agent功能,陆续补充,中文版readme已写
* issue提到的一个bug
* 温度最小改成0,但是不应该支持负数
* 修改了最小的温度
* 增加了部分Agent支持和修改了启动文件的部分bug
* 修改了GPU数量配置文件
* 1
1
* 修复配置文件错误
* 更新readme,稳定测试
|
2023-09-28 20:19:26 +08:00 |
liunux4odoo
|
523764e284
|
fix: set vllm based on platform to avoid error on windows
|
2023-09-27 21:43:54 +08:00 |
hzg0601
|
2716ff739d
|
1. 更新congif中关于vllm后端相关说明;2. 更新requirements,requirements_api;
|
2023-09-26 21:55:57 +08:00 |
hzg0601
|
2d823aa4b1
|
1. debug vllm加速框架完毕;2. 修改requirements,requirements_api对vllm的依赖;3.注释掉serve_config中baichuan-7b的device为cpu的配置
|
2023-09-24 02:05:40 +08:00 |
hzg0601
|
810145c5fb
|
新增特性:1.支持vllm推理加速框架;2. 更新支持模型列表
|
2023-09-23 01:37:37 +08:00 |
Leego
|
9bcce0a572
|
【功能新增】在线 LLM 模型支持阿里云通义千问 (#1534)
* feat: add qwen-api
* 使Qwen API支持temperature参数;添加测试用例
* 将online-api的sdk列为可选依赖
---------
Co-authored-by: liunux4odoo <liunux@qq.com>
|
2023-09-20 21:34:12 +08:00 |
liunux4odoo
|
a65bc4a63c
|
添加configs/prompt_config.py,允许用户自定义prompt模板: (#1504)
1、 默认包含2个模板,分别用于LLM对话,知识库和搜索引擎对话
2、 server/utils.py提供函数get_prompt_template,获取指定的prompt模板内容(支持热加载)
3、 api.py中chat/knowledge_base_chat/search_engine_chat接口支持prompt_name参数
|
2023-09-17 13:27:11 +08:00 |
liunux4odoo
|
f7c73b842a
|
优化configs (#1474)
* remove llm_model_dict
* optimize configs
* fix get_model_path
* 更改一些默认参数,添加千帆的默认配置
* Update server_config.py.example
|
2023-09-15 17:52:22 +08:00 |
liunux4odoo
|
30aeec1c45
|
修改智谱API默认名称,给WEBUI设置主题 (#1484)
* 給WEBUI设置主题
* chatglm-api更名为zhipu-api
|
2023-09-15 01:48:02 +08:00 |
liunux4odoo
|
4cf2e5ea5e
|
修复文心一言,添加测试用例
|
2023-09-14 23:37:34 +08:00 |
zR
|
bfdbe69fa1
|
增加了自定义分词器适配 (#1462)
* 添加了自定义分词器适配和测试文件
---------
Co-authored-by: zR <zRzRzRzRzRzRzR>
|
2023-09-13 15:42:12 +08:00 |
liunux4odoo
|
512638a3b1
|
支持讯飞星火大模型在线API (#1460)
* 支持讯飞星火大模型在线API
|
2023-09-13 13:51:05 +08:00 |
liunux4odoo
|
a03b8d330d
|
升级到langchain==0.0.287,fschat==0.0.28;处理langchain.Milvus bug(#10492) (#1454)
* 修复milvus_kb_service中一些bug,添加文档后将数据同步到数据库
* 升级到langchain==0.0.287,fschat==0.0.28;处理langchain.Milvus bug(#10492)
* 修复切换模型BUG: 从在线API切换模型时出错
|
2023-09-13 08:43:11 +08:00 |
liunux4odoo
|
03c021d50f
|
添加MiniMax在线API支持 (#1445)
|
2023-09-12 15:24:47 +08:00 |
liunux4odoo
|
6cb1bdf623
|
添加切换模型功能,支持智谱AI在线模型 (#1342)
* 添加LLM模型切换功能,需要在server_config中设置可切换的模型
* add tests for api.py/llm_model/*
* - 支持模型切换
- 支持智普AI线上模型
- startup.py增加参数`--api-worker`,自动运行所有的线上API模型。使用`-a
(--all-webui), --all-api`时默认开启该选项
* 修复被fastchat覆盖的标准输出
* 对fastchat日志进行更细致的控制,startup.py中增加-q(--quiet)开关,可以减少无用的fastchat日志输出
* 修正chatglm api的对话模板
Co-authored-by: liunux4odoo <liunu@qq.com>
|
2023-09-01 23:58:09 +08:00 |
liunux4odoo
|
34a416b941
|
优化server_config配置项 (#1293)
* update server_config.py:
- 在model_config中增加HISTORY_LEN配置参数
- 将server_config中helper function移动到server.utils中
- 统一set_httpx_timeout的定义和调用
* update webui.py:
应用model_config中的配置项:HISTORY_LEN,VECTOR_SEARCH_TOP_K,SEARCH_ENGINE_TOP_K
---------
Co-authored-by: liunux4odoo <liunu@qq.com>
|
2023-08-29 10:06:09 +08:00 |
hzg0601
|
cc0bd4efd9
|
update server_config.py.example: 增加多卡启动的说明
|
2023-08-25 11:27:39 +08:00 |
liunux4odoo
|
f8229fc4a9
|
update server_config example
|
2023-08-17 21:50:36 +08:00 |
imClumsyPanda
|
4318197ac7
|
reformat server_config.py.example
|
2023-08-17 21:30:40 +08:00 |
liunux4odoo
|
f92b002342
|
add startup.py: start specified servers with one command. see python startup.py --help
|
2023-08-17 13:24:53 +08:00 |