Langchain-Chatchat

Commit Graph

Author	SHA1	Message	Date
zR	57612d5232	修复一些bug (#1965 ) * 修改一些bug * 更新掉了一部分之前的bug	2023-11-03 18:56:27 +08:00
qiankunli	fa906b33a8	添加对话评分与历史消息保存功能 (#1940 ) * 新功能： - WEBUI 添加对话评分功能 - 增加 /chat/feedback 接口，用于接收对话评分 - /chat/chat 接口返回值由 str 改为 {"text":str, "chat_history_id": str} - init_database.py 添加 --create-tables --clear-tables 参数依赖： - streamlit-chatbox==1.1.11 开发者： - ChatHistoryModel 的 id 字段支持自动生成 - SAVE_CHAT_HISTORY 改到 basic_config.py * 修复：点击反馈后页面未刷新 --------- Co-authored-by: liqiankun.1111 <liqiankun.1111@bytedance.com> Co-authored-by: liunux4odoo <liunux@qq.com> Co-authored-by: liunux4odoo <41217877+liunux4odoo@users.noreply.github.com>	2023-11-03 11:31:45 +08:00
liunux4odoo	554122f60e	Feat (#1951 ) * 知识库支持子目录（不包括temp和tmp开头的目录），文件相对路径总长度不可超过255 * init_database.py 增加 --import-db 参数，在版本升级时，如果 info.db 表结构发生变化，但向量库无需重建，可以在重建数据库后，使用本参数从旧的数据库中导入信息	2023-11-02 14:46:39 +08:00
liunux4odoo	d8e15b57ba	知识库支持子目录（不包括temp和tmp开头的目录），文件相对路径总长度不可超过255 (#1928 )	2023-10-31 16:59:40 +08:00
liunux4odoo	65592a45c3	支持在线 Embeddings, Lite 模式支持所有知识库相关功能 (#1924 ) 新功能： - 支持在线 Embeddings：zhipu-api, qwen-api, minimax-api, qianfan-api - API 增加 /other/embed_texts 接口 - init_database.py 增加 --embed-model 参数，可以指定使用的嵌入模型（本地或在线均可） - 对于 FAISS 知识库，支持多向量库，默认位置：{KB_PATH}/vector_store/{embed_model} - Lite 模式支持所有知识库相关功能。此模式下最主要的限制是： - 不能使用本地 LLM 和 Embeddings 模型 - 知识库不支持 PDF 文件 - init_database.py 重建知识库时不再默认情况数据库表，增加 clear-tables 参数手动控制。 - API 和 WEBUI 中 score_threshold 参数范围改为 [0, 2]，以更好的适应在线嵌入模型问题修复： - API 中 list_config_models 会删除 ONLINE_LLM_MODEL 中的敏感信息，导致第二轮API请求错误开发者： - 统一向量库的识别：以（kb_name,embed_model）为判断向量库唯一性的依据，避免 FAISS 知识库缓存加载逻辑错误 - KBServiceFactory.get_service_by_name 中添加 default_embed_model 参数，用于在构建新知识库时设置 embed_model - 优化 kb_service 中 Embeddings 操作： - 统一加载接口： server.utils.load_embeddings，利用全局缓存避免各处 Embeddings 传参 - 统一文本嵌入接口：server.knowledge_base.kb_service.base.[embed_texts, embed_documents] - 重写 normalize 函数，去除对 scikit-learn/scipy 的依赖	2023-10-31 14:26:50 +08:00
liunux4odoo	deed92169f	支持在线 Embeddings：zhipu-api, qwen-api, minimax-api, qianfan-api (#1907 ) * 新功能： - 支持在线 Embeddings：zhipu-api, qwen-api, minimax-api, qianfan-api - API 增加 /other/embed_texts 接口 - init_database.py 增加 --embed-model 参数，可以指定使用的嵌入模型（本地或在线均可）问题修复： - API 中 list_config_models 会删除 ONLINE_LLM_MODEL 中的敏感信息，导致第二轮API请求错误开发者： - 优化 kb_service 中 Embeddings 操作： - 统一加载接口： server.utils.load_embeddings，利用全局缓存避免各处 Embeddings 传参 - 统一文本嵌入接口：server.embedding_api.[embed_texts, embed_documents]	2023-10-28 23:37:30 +08:00
zR	aa7c580974	Dev (#1902 ) 修改Agent的内容	2023-10-27 22:53:43 +08:00
zR	24d1e28a07	一些细节优化 (#1891 ) Co-authored-by: zR <zRzRzRzRzRzRzR>	2023-10-27 11:52:44 +08:00
liunux4odoo	b4c68ddd05	优化在线 API ，支持 completion 和 embedding，简化在线 API 开发方式 (#1886 ) * 优化在线 API ，支持 completion 和 embedding，简化在线 API 开发方式新功能 - 智谱AI、Minimax、千帆、千问 4 个在线模型支持 embeddings（不通过Fastchat，后续会单独提供相关api接口） - 在线模型自动检测传入参数，在传入非 messages 格式的 prompt 时，自动转换为 completion 形式，以支持 completion 接口开发者： - 重构ApiModelWorker: - 所有在线 API 请求封装到 do_chat 方法：自动传入参数 ApiChatParams，简化参数与配置项的获取；自动处理与fastchat的接口 - 加强 API 请求错误处理，返回更有意义的信息 - 改用 qianfan sdk 重写 qianfan-api - 将所有在线模型的测试用例统一在一起，简化测试用例编写 * Delete requirements_langflow.txt	2023-10-26 22:44:48 +08:00
zR	e74fe2d950	Zilliz修复 (#1874 ) * 修复zilliz的问题	2023-10-25 21:59:26 +08:00
liunux4odoo	19f5f07d57	fix: unused imported faiss in milvus_kb_server (close #1849 )	2023-10-24 15:01:19 +08:00
zR	a036e3ccda	修改了部分Agent Prompt 修改了一些适配问题 (#1839 ) * 支持了agentlm * 支持了agentlm和相关提示词 * 修改了Agent的一些功能，加入了Embed方面的一个优化 * 修改了部分Agent的工具 * 增加一些Langchain的自带工具 * 修复一些兼容性的bug	2023-10-23 14:53:14 +08:00
zR	e920cd0064	合并分支，支持 (#1808 ) * 北京黑客松更新知识库支持：支持zilliz数据库 Agent支持：支持以下工具调用 1. 支持互联网Agent调用 2. 支持知识库Agent调用 3. 支持旅游助手工具(未上传）知识库更新 1. 支持知识库简介，用于Agent选择 2. UI对应知识库简介提示词选择 1. UI 和模板支持提示词模板更换选择 * 数据库更新介绍问题解决 * 关于Langchain自己支持的模型 1. 修复了Openai无法调用的bug 2. 支持了Azure Openai Claude模型（在模型切换界面由于优先级问题，显示的会是其他联网模型) 3. 422问题被修复，用了另一种替代方案。 4. 更新了部分依赖	2023-10-20 18:13:55 +08:00
liunux4odoo	b9b42991f6	- 支持metaphor搜索引擎（无需代理，key申请简单，目前不支持中文） - 增加默认知识库和默认搜索引擎的配置项 - 修复WEBUI弹出当前模型错误	2023-10-18 23:02:20 +08:00
zR	69e5da4e7a	北京黑客松更新 (#1785 ) * 北京黑客松更新知识库支持：支持zilliz数据库 Agent支持：支持以下工具调用 1. 支持互联网Agent调用 2. 支持知识库Agent调用 3. 支持旅游助手工具(未上传）知识库更新 1. 支持知识库简介，用于Agent选择 2. UI对应知识库简介提示词选择 1. UI 和模板支持提示词模板更换选择	2023-10-18 15:19:02 +08:00
liunux4odoo	94977c7ab1	修复：切换embed_model时，FAISS向量库未正确释放，导致`d == self.d assert (#1766 ) 修复： - 切换embed_model时，FAISS向量库未正确释放，导致d == self.d assert error (close [求助] 初始化知识库发生错误 #1657 ) - ApiRequest中chat接口增加max_tokens参数 - FileDocModel模型字段错误(字段错误 #1691)	2023-10-16 21:02:07 +08:00
zR	77d38db00e	修改部分错误的文档，加长了历史记录（for 32k Models） (#1629 ) * 更新上agent提示词代码 * 更新部分文档，修复了issue中提到的bge匹配超过1 的bug * 按需修改	2023-09-29 20:17:29 +08:00
WilliamChen-luckbob	8fa99026c8	根据官方文档，添加对英文版的bge embedding的指示模板 (#1585 ) Co-authored-by: zR <2448370773@qq.com>	2023-09-28 19:18:31 +08:00
liunux4odoo	b3c7f8b072	修复webui中重建知识库以及对话界面UI错误 (#1615 ) * 修复bug:webui点重建知识库时，如果存在不支持的文件会导致整个接口错误;migrate中没有导入CHUNK_SIZE * 修复：webui对话界面的expander一直为running状态；简化历史消息获取方法	2023-09-28 15:12:03 +08:00
zR	d39878ff35	Dev (#1613 ) * 增加了仅限GPT4的agent功能，陆续补充，中文版readme已写 * issue提到的一个bug * 温度最小改成0，但是不应该支持负数 * 修改了最小的温度	2023-09-27 21:17:50 +08:00
imClumsyPanda	f3042a6a29	merge master	2023-09-22 12:36:45 +08:00
peterz3g	3ff130ecc2	修复csv文件解析编码报错的问题。 (#1508 )	2023-09-21 14:41:49 +08:00
liunux4odoo	818cb1a491	update kb_doc_api: use Form instead of Body when upload file	2023-09-21 09:57:36 +08:00
glide-the	bd0164ea62	处理序列化至磁盘的逻辑	2023-09-20 21:35:23 +08:00
Jim Zhang	cb2b560a5b	fix : Duplicate variable and function name (#1509 ) Co-authored-by: Jim <zhangpengyi@taijihuabao.com>	2023-09-20 16:46:31 +08:00
Jim Zhang	59fb309ba4	fix : Duplicate variable and function name (#1509 ) Co-authored-by: Jim <zhangpengyi@taijihuabao.com>	2023-09-18 11:00:04 +08:00
liunux4odoo	1bae930691	修复faiss_pool知识库缓存key错误 (#1507 )	2023-09-17 16:31:44 +08:00
glide-the	902ba0c321	增加传入矢量名称加载	2023-09-17 13:56:18 +08:00
liunux4odoo	c8d8727783	更新migrate.py和init_database.py，加强知识库迁移工具： (#1498 ) 1. 添加--update-in-db参数，按照数据库信息，从本地文件更新向量库 2. 添加--increament参数，根据本地文件增量更新向量库 3. 添加--prune-db参数，删除本地文件后，自动清理相关的向量库 4. 添加--prune-folder参数，根据数据库信息，清理无用的本地文件 5. 取消--update-info-only参数。数据库中存储了向量库信息，该操作意义不大 6. 添加--kb-name参数，所有操作支持指定操作的知识库，不指定则为所有本地知识库 7. 添加知识库迁移的测试用例 8. 删除milvus_kb_service的save_vector_store方法	2023-09-16 09:09:27 +08:00
liunux4odoo	80375e1ff3	fix merge conflict for #1474 (#1494 )	2023-09-15 18:11:15 +08:00
liunux4odoo	f7c73b842a	优化configs (#1474 ) * remove llm_model_dict * optimize configs * fix get_model_path * 更改一些默认参数，添加千帆的默认配置 * Update server_config.py.example	2023-09-15 17:52:22 +08:00
imClumsyPanda	20eef45a58	update README.md	2023-09-15 09:53:58 +08:00
zR	769d75d784	修复测试文件 (#1467 ) Co-authored-by: zR <zRzRzRzRzRzRzR>	2023-09-13 17:12:05 +08:00
zR	bfdbe69fa1	增加了自定义分词器适配 (#1462 ) * 添加了自定义分词器适配和测试文件 --------- Co-authored-by: zR <zRzRzRzRzRzRzR>	2023-09-13 15:42:12 +08:00
liunux4odoo	16d8809c9a	api和webui知识库操作支持chunk_size/overlap_size/zh_title_enhance参数 (#1459 )	2023-09-13 11:19:47 +08:00
liunux4odoo	a03b8d330d	升级到langchain==0.0.287,fschat==0.0.28;处理langchain.Milvus bug(#10492 ) (#1454 ) * 修复milvus_kb_service中一些bug，添加文档后将数据同步到数据库 * 升级到langchain==0.0.287,fschat==0.0.28;处理langchain.Milvus bug(#10492) * 修复切换模型BUG: 从在线API切换模型时出错	2023-09-13 08:43:11 +08:00
liunux4odoo	efd6d4a251	修复milvus_kb_service中一些bug，添加文档后将数据同步到数据库 (#1452 )	2023-09-12 22:34:03 +08:00
imClumsyPanda	2020f5bb88	merge master	2023-09-12 15:51:28 +08:00
imClumsyPanda	8064586374	delete .doc from supported formats	2023-09-12 15:22:18 +08:00
liunux4odoo	6a03611750	fix api and webui: (#1435 ) 1. fix #1431: 优化知识库问答与搜索引擎问答的API接口，避免docs重复返回 2. startup.py根据configs.log_verbose控制log级别 3. 修复/llm_model/list_models的bug: 只有一个参数时，fastapi未返回json导致视图函数出错	2023-09-12 08:31:17 +08:00
liunux4odoo	22ff073309	修改Embeddings和FAISS缓存加载方式，知识库相关API接口支持多线程并发 (#1434 ) * 修改Embeddings和FAISS缓存加载方式，支持多线程，支持内存FAISS * 知识库相关API接口支持多线程并发 * 根据新的API接口调整ApiRequest和测试用例 * 删除webui.py失效的启动说明	2023-09-11 20:41:41 +08:00
glide-the	5550e3c1a9	增加显示详细日志开关	2023-09-08 20:48:31 +08:00
liunux4odoo	775870a516	改变api视图函数的sync/async，提高api并发能力： (#1414 ) 1. 4个chat类接口改为async 2. 知识库操作，涉及向量库修改的使用async，避免FAISS写入错误；涉及向量库读取的改为sync，提高并发	2023-09-08 12:25:02 +08:00
liunux4odoo	1195eb75eb	merge pr1413	2023-09-08 10:30:07 +08:00
liunux4odoo	661a0e9d72	新功能: - 知识库管理中的add_docs/delete_docs/update_docs均支持批量操作，并利用多线程提高效率 - API的重建知识库接口支持多线程 - add_docs可提供参数控制上传文件后是否继续进行向量化 - add_docs/update_docs支持传入自定义docs(以json形式)。后续考虑区分完整或补充式自定义docs - download_doc接口添加`preview`参数，支持下载或预览 - kb_service增加`save_vector_store`方法，便于保存向量库（仅FAISS，其它无操作） - 将document_loader & text_splitter逻辑从KnowledgeFile中抽离出来，为后续对内存文件进行向量化做准备 - KowledgeFile支持docs & splitted_docs的缓存，方便在中间过程做一些自定义其它： - 将部分错误输出由print改为logger.error	2023-09-08 08:55:12 +08:00
glide-the	1027ab6c06	增加构建文档metadata检索的开关，移动到dev_metadata_search	2023-09-05 20:59:57 +08:00
glide-the	491c9605d9	增加构建文档metadata检索的开关	2023-09-05 18:35:11 +08:00
liunux4odoo	464ccc6d53	Update migrate.py (#1371 ) fix bug at line 85 : for kb_file in kb_file	2023-09-05 11:52:22 +08:00
liunux4odoo	015ce57691	Update migrate.py (#1371 ) fix bug at line 85 : for kb_file in kb_file	2023-09-05 11:47:25 +08:00
liunux4odoo	93b133f9ac	将KnowledgeFile的file2text拆分成file2docs、docs2texts和file2text三个部分，在保持接口不变的情况下，实现： 1、支持chunk_size和chunk_overlap参数 2、支持自定义text_splitter 3、支持自定义docs 修复：csv文件不使用text_splitter	2023-09-04 21:00:16 +08:00

1 2 3

138 Commits