Langchain-Chatchat

Commit Graph

Author	SHA1	Message	Date
wvivi2023	cc706ce7ef	enhance log	2024-04-02 10:32:34 +08:00
wvivi2023	df219c6ae6	fix download original issue when chating	2024-03-28 10:55:52 +08:00
wvivi2023	26f3f364d7	完善文档查询接口	2024-03-07 14:29:08 +08:00
wvivi2023	5b211fc44d	Merge branch 'master' into branch-0.2.9	2024-01-26 18:08:14 +08:00
liunux4odoo	9c525b7fa5	publish 0.2.10 (#2797 ) 新功能： - 优化 PDF 文件的 OCR，过滤无意义的小图片 by @liunux4odoo #2525 - 支持 Gemini 在线模型 by @yhfgyyf #2630 - 支持 GLM4 在线模型 by @zRzRzRzRzRzRzR - elasticsearch更新https连接 by @xldistance #2390 - 增强对PPT、DOC知识库文件的OCR识别 by @596192804 #2013 - 更新 Agent 对话功能 by @zRzRzRzRzRzRzR - 每次创建对象时从连接池获取连接，避免每次执行方法时都新建连接 by @Lijia0 #2480 - 实现 ChatOpenAI 判断token有没有超过模型的context上下文长度 by @glide-the - 更新运行数据库报错和项目里程碑 by @zRzRzRzRzRzRzR #2659 - 更新配置文件/文档/依赖 by @imClumsyPanda @zRzRzRzRzRzRzR - 添加日文版 readme by @eltociear #2787 修复： - langchain 更新后，PGVector 向量库连接错误 by @HALIndex #2591 - Minimax's model worker 错误 by @xyhshen - ES库无法向量检索.添加mappings创建向量索引 by MSZheng20 #2688	2024-01-26 06:58:49 +08:00
wvivi2023	99969ef1e3	一级目录加强	2024-01-19 15:54:26 +08:00
wvivi2023	afa07ad208	enhance	2024-01-16 15:37:47 +08:00
wvivi2023	c5d1ff6621	enhance	2024-01-15 09:54:00 +08:00
wvivi2023	0c0c87a3fb	use streamingresponse to return	2024-01-11 09:06:27 +08:00
wvivi2023	3593e6ca2c	update	2024-01-04 18:02:43 +08:00
liunux4odoo	c179230ce0	remove /chat/fastchat API endpoint (#2506 )	2023-12-29 09:44:37 +08:00
liunux4odoo	5cccd5e7aa	merge from master	2023-12-29 09:10:01 +08:00
liunux4odoo	9ff7bef2c2	新功能：知识库管理界面支持查看、编辑、删除向量库文档 (#2471 ) * 新功能： - 知识库管理界面支持查看、编辑、删除向量库文档。暂不支持增加（aggrid添加新行比较麻烦，需要另外实现） - 去除知识库管理界面中重建知识库和删除知识库按钮，建议用户到终端命令操作修复： - 所有与知识库名称、文件名称有关的数据库操作函数都改成大小写不敏感，所有路径统一为 posix 风格，避免因路径文本不一致导致数据重复和操作失效（close #2232）开发者： - 添加 update_docs_by_id 函数与 API 接口。当前仅支持 FAISS，暂时未用到，未将来对知识库做更细致的修改做准备 - 统一 DocumentWithScore 与 DocumentWithVsId - FAISS 返回的 Document.metadata 中包含 ID，方便后续查找比对 - /knowledge_base/search_docs 接口支持 file_name, metadata 参数，可以据此检索文档 * fix bug	2023-12-26 13:44:36 +08:00
hzg0601	129c765a74	新增特性:reranker对向量召回文本进行重排	2023-12-21 19:05:11 +08:00
hzg0601	5891f94c88	temporarily add reranker	2023-12-21 16:05:16 +08:00
Astlvk	7e01e82470	fixed 迭代器参数传递错误，知识库问答报错TypeError: unhashable type: 'list' (#2383 ) Co-authored-by: liunux4odoo <41217877+liunux4odoo@users.noreply.github.com>	2023-12-15 07:54:36 +08:00
xldistance	7e8391eb55	修复knowledge_base_chat_iterator传参错误 (#2386 )	2023-12-15 07:53:36 +08:00
liunux4odoo	472a97a616	所有 chat 接口都改为 EventSourceResponse；ApiRequest 作对应修改	2023-12-13 16:53:24 +08:00
liunux4odoo	c8fef3380c	merge from dev	2023-12-13 16:52:40 +08:00
liunux4odoo	2604c9e761	fix: prompt template name error in file_chat (#2366 )	2023-12-12 21:12:33 +08:00
liunux4odoo	7d2de47bcf	文件对话和知识库对话 API 接口实现全异步操作，防止阻塞 (#2256 ) * EmbeddingFunAdapter 支持异步操作；文件对话和知识库对话 API 接口实现全异步操作，防止阻塞 * 修复：使 list_files_from_folder 返回相对路径	2023-12-02 19:22:44 +08:00
liunux4odoo	4fa28c71b1	修复：chat 接口默认使用 memory获取10条历史消息，导致最终拼接的prompt出错 (#2247 ) 修改后默认使用用户传入的history，只有同时传入conversation_id和history_len时才从数据库读取历史消息使用memory还有一个问题，对话角色是固定的，不能适配不同的模型。其它：注释一些无用的 print	2023-12-01 11:35:43 +08:00
imClumsyPanda	c34b4136c0	update file format	2023-11-30 23:33:48 +08:00
zR	b7a50daa0f	更新Langchain依赖到0.0.342以上版本 (#2212 )	2023-11-29 15:08:13 +08:00
liunux4odoo	7d580d9a47	修复：*_chat 接口中重设 max_tokens 时导致 `local variable 'max_tokens' referenced before assignment` 错误	2023-11-28 21:00:00 +08:00
liunux4odoo	8b695dba03	*_chat 接口中，当 max_tokens=0时，将其设为 None,避免 swagger ui 中默认值为0时访问出错	2023-11-26 16:47:58 +08:00
liunux4odoo	1de4258aa0	给 ApiModelWorker 添加 logger 成员变量，API请求出错时输出有意义的错误信息。 (#2169 ) * 给 ApiModelWorker 添加 logger 成员变量，API请求出错时输出有意义的错误信息。 /chat/chat 接口 conversation_id参数改为默认 ""，避免 swagger 页面默认值错误导致历史消息失效 * 修复在线模型一些bug	2023-11-25 13:51:07 +08:00
liunux4odoo	aae4144476	数据库和向量库中文档 metadata["source"] 改为相对路径，便于向量库迁移 (#2153 ) 修复： - 上传知识库文件名称包括子目录时，自动创建子目录	2023-11-23 19:54:00 +08:00
qiankunli	1c97673d41	feat: add db memory (#2046 ) * feat: add db memory * WEBUI 添加多会话功能 --------- Co-authored-by: liqiankun.1111 <liqiankun.1111@bytedance.com> Co-authored-by: liunux4odoo <liunux@qq.com>	2023-11-22 18:38:26 +08:00
liunux4odoo	3b3d948d27	添加文件对话模式 (#2071 ) 开发者： - 添加 /chat/file_chat, /knowledge_base/upload_temp_docs API 接口 - 添加 CACHED_MEMO_VS_NUM, BASE_TEMP_DIR 配置项	2023-11-16 07:39:27 +08:00
zR	21b079d751	GLM3支持传入提示词 (#2058 ) 支持传入提示词的Agent ChatGLM3-6B	2023-11-14 17:45:22 +08:00
zR	91ff0574df	支持ChatGLM3-6B (#2021 ) * 更新依赖和配置文件中的Agent模型 * 支持基础的glm3_agent	2023-11-12 16:45:50 +08:00
liunux4odoo	b51ba11f45	支持通过配置项同时启动多个模型，将Wiki纳入samples知识库 (#2002 ) 新功能： - 将 LLM_MODEL 配置项改为 LLM_MODELS 列表，同时启动多个模型 - 将 wiki 纳入 samples 知识库依赖变化： - 指定 streamlit~=1.27.0。1.26.0会报rerun错误，1.28.0会有无限刷新错误修复优化： - 优化 get_default_llm_model 逻辑 - 适配 Qwen 在线 API 做 Embeddings 时最大 25 行的限制 - 列出知识库磁盘文件时跳过 . 开头的文件	2023-11-09 22:15:52 +08:00
zR	57612d5232	修复一些bug (#1965 ) * 修改一些bug * 更新掉了一部分之前的bug	2023-11-03 18:56:27 +08:00
qiankunli	fa906b33a8	添加对话评分与历史消息保存功能 (#1940 ) * 新功能： - WEBUI 添加对话评分功能 - 增加 /chat/feedback 接口，用于接收对话评分 - /chat/chat 接口返回值由 str 改为 {"text":str, "chat_history_id": str} - init_database.py 添加 --create-tables --clear-tables 参数依赖： - streamlit-chatbox==1.1.11 开发者： - ChatHistoryModel 的 id 字段支持自动生成 - SAVE_CHAT_HISTORY 改到 basic_config.py * 修复：点击反馈后页面未刷新 --------- Co-authored-by: liqiankun.1111 <liqiankun.1111@bytedance.com> Co-authored-by: liunux4odoo <liunux@qq.com> Co-authored-by: liunux4odoo <41217877+liunux4odoo@users.noreply.github.com>	2023-11-03 11:31:45 +08:00
liunux4odoo	d8e15b57ba	知识库支持子目录（不包括temp和tmp开头的目录），文件相对路径总长度不可超过255 (#1928 )	2023-10-31 16:59:40 +08:00
liunux4odoo	65592a45c3	支持在线 Embeddings, Lite 模式支持所有知识库相关功能 (#1924 ) 新功能： - 支持在线 Embeddings：zhipu-api, qwen-api, minimax-api, qianfan-api - API 增加 /other/embed_texts 接口 - init_database.py 增加 --embed-model 参数，可以指定使用的嵌入模型（本地或在线均可） - 对于 FAISS 知识库，支持多向量库，默认位置：{KB_PATH}/vector_store/{embed_model} - Lite 模式支持所有知识库相关功能。此模式下最主要的限制是： - 不能使用本地 LLM 和 Embeddings 模型 - 知识库不支持 PDF 文件 - init_database.py 重建知识库时不再默认情况数据库表，增加 clear-tables 参数手动控制。 - API 和 WEBUI 中 score_threshold 参数范围改为 [0, 2]，以更好的适应在线嵌入模型问题修复： - API 中 list_config_models 会删除 ONLINE_LLM_MODEL 中的敏感信息，导致第二轮API请求错误开发者： - 统一向量库的识别：以（kb_name,embed_model）为判断向量库唯一性的依据，避免 FAISS 知识库缓存加载逻辑错误 - KBServiceFactory.get_service_by_name 中添加 default_embed_model 参数，用于在构建新知识库时设置 embed_model - 优化 kb_service 中 Embeddings 操作： - 统一加载接口： server.utils.load_embeddings，利用全局缓存避免各处 Embeddings 传参 - 统一文本嵌入接口：server.knowledge_base.kb_service.base.[embed_texts, embed_documents] - 重写 normalize 函数，去除对 scikit-learn/scipy 的依赖	2023-10-31 14:26:50 +08:00
zR	aa7c580974	Dev (#1902 ) 修改Agent的内容	2023-10-27 22:53:43 +08:00
zR	bb72d9ac26	支持GLM (#1896 ) * 支持glm3	2023-10-27 17:56:27 +08:00
zR	24d1e28a07	一些细节优化 (#1891 ) Co-authored-by: zR <zRzRzRzRzRzRzR>	2023-10-27 11:52:44 +08:00
liunux4odoo	b4c68ddd05	优化在线 API ，支持 completion 和 embedding，简化在线 API 开发方式 (#1886 ) * 优化在线 API ，支持 completion 和 embedding，简化在线 API 开发方式新功能 - 智谱AI、Minimax、千帆、千问 4 个在线模型支持 embeddings（不通过Fastchat，后续会单独提供相关api接口） - 在线模型自动检测传入参数，在传入非 messages 格式的 prompt 时，自动转换为 completion 形式，以支持 completion 接口开发者： - 重构ApiModelWorker: - 所有在线 API 请求封装到 do_chat 方法：自动传入参数 ApiChatParams，简化参数与配置项的获取；自动处理与fastchat的接口 - 加强 API 请求错误处理，返回更有意义的信息 - 改用 qianfan sdk 重写 qianfan-api - 将所有在线模型的测试用例统一在一起，简化测试用例编写 * Delete requirements_langflow.txt	2023-10-26 22:44:48 +08:00
liunux4odoo	03e55e11c4	支持lite模式：无需安装torch等重依赖，通过在线API实现LLM对话和搜索引擎对话 (#1860 ) * move get_default_llm_model from webui to ApiRequest 增加API接口及其测试用例： - /server/get_prompt_template: 获取服务器配置的 prompt 模板 - 增加知识库多线程访问测试用例支持lite模式：无需安装torch等重依赖，通过在线API实现LLM对话和搜索引擎对话 * fix bug in server.api --------- Co-authored-by: imClumsyPanda <littlepanda0716@gmail.com>	2023-10-25 08:30:23 +08:00
Zhi-guo Huang	be67ea43d8	Merge pull request #1828 from qiankunli/feat/add-completion-api 增加completion功能的API接口，注意暂不支持online_api模型	2023-10-24 22:10:54 +08:00
liqiankun.1111	b002a2879b	feat: add completion api	2023-10-22 17:07:26 +08:00
zR	1b50547e60	Dev (#1822 ) * 支持了agentlm * 支持了agentlm和相关提示词 * 修改了Agent的一些功能，加入了Embed方面的一个优化 --------- Co-authored-by: zR <zRzRzRzRzRzRzR>	2023-10-22 00:00:15 +08:00
liunux4odoo	d316efe8d3	release 0.2.6 (#1815 ) ## 🛠 新增功能 - 支持百川在线模型 (@hzg0601 @liunux4odoo in #1623) - 支持 Azure OpenAI 与 claude 等 Langchain 自带模型 (@zRzRzRzRzRzRzR in #1808) - Agent 功能大量更新，支持更多的工具、更换提示词、检索知识库 (@zRzRzRzRzRzRzR in #1626 #1666 #1785) - 加长 32k 模型的历史记录 (@zRzRzRzRzRzRzR in #1629 #1630) - _chat 接口支持 max_tokens 参数 (@liunux4odoo in #1744) - 实现 API 和 WebUI 的前后端分离 (@liunux4odoo in #1772) - 支持 zlilliz 向量库 (@zRzRzRzRzRzRzR in #1785) - 支持 metaphor 搜索引擎 (@liunux4odoo in #1792) - 支持 p-tuning 模型 (@hzg0601 in #1810) - 更新完善文档和 Wiki (@imClumsyPanda @zRzRzRzRzRzRzR @glide-the in #1680 #1811) ## 🐞 问题修复 - 修复 bge- 模型匹配超过 1 的问题 (@zRzRzRzRzRzRzR in #1652) - 修复系统代理为空的问题 (@glide-the in #1654) - 修复重建知识库时 `d == self.d assert error` (@liunux4odoo in #1766) - 修复对话历史消息错误 (@liunux4odoo in #1801) - 修复 OpenAI 无法调用的 bug (@zRzRzRzRzRzRzR in #1808) - 修复 windows下 BIND_HOST=0.0.0.0 时对话出错的问题 (@hzg0601 in #1810)	2023-10-20 23:16:06 +08:00
liunux4odoo	d053950aee	新功能： (#1801 ) - 更新langchain/fastchat依赖，添加xformers依赖 - 默认max_tokens=None, 生成tokens自动为模型支持的最大值修复： - history_len=0 时会带入1条不完整的历史消息，导致LLM错误 - 当对话轮数达到history_len时，传入的历史消息为空	2023-10-19 22:09:15 +08:00
liunux4odoo	b9b42991f6	- 支持metaphor搜索引擎（无需代理，key申请简单，目前不支持中文） - 增加默认知识库和默认搜索引擎的配置项 - 修复WEBUI弹出当前模型错误	2023-10-18 23:02:20 +08:00
zR	69e5da4e7a	北京黑客松更新 (#1785 ) * 北京黑客松更新知识库支持：支持zilliz数据库 Agent支持：支持以下工具调用 1. 支持互联网Agent调用 2. 支持知识库Agent调用 3. 支持旅游助手工具(未上传）知识库更新 1. 支持知识库简介，用于Agent选择 2. UI对应知识库简介提示词选择 1. UI 和模板支持提示词模板更换选择	2023-10-18 15:19:02 +08:00
liunux4odoo	9ce328fea9	实现Api和WEBUI的前后端分离 (#1772 ) * update ApiRequest: 删除no_remote_api本地调用模式；支持同步/异步调用 * 实现API和WEBUI的分离： - API运行服务器上的配置通过/llm_model/get_model_config、/server/configs接口提供，WEBUI运行机器上的配置项仅作为代码内部默认值使用 - 服务器可用的搜索引擎通过/server/list_search_engines提供 - WEBUI可选LLM列表中只列出在FSCHAT_MODEL_WORKERS中配置的模型 - 修改WEBUI中默认LLM_MODEL获取方式，改为从api端读取 - 删除knowledge_base_chat中`local_doc_url`参数其它修改： - 删除多余的kb_config.py.exmaple(名称错误) - server_config中默认关闭vllm - server_config中默认注释除智谱AI之外的在线模型 - 修改requests从系统获取的代理，避免model worker注册错误 * 修正： - api.list_config_models返回模型原始配置 - api.list_config_models和api.get_model_config中过滤online api模型的敏感信息 - 将GPT等直接访问的模型列入WEBUI可选模型列表其它： - 指定langchain==0.3.313, fschat==0.2.30, langchain-experimental==0.0.30	2023-10-17 16:52:07 +08:00

1 2 3

110 Commits