wvivi2023
cc706ce7ef
enhance log
2024-04-02 10:32:34 +08:00
wvivi2023
7b9369e625
enhance pdf loader
2024-03-18 09:28:30 +08:00
wvivi2023
5b211fc44d
Merge branch 'master' into branch-0.2.9
2024-01-26 18:08:14 +08:00
wvivi2023
5a9c25d010
roll back the last commit
2024-01-26 14:32:17 +08:00
wvivi2023
1d12f84310
fix the issue doc file can't be loaded
2024-01-26 14:18:57 +08:00
liunux4odoo
9c525b7fa5
publish 0.2.10 ( #2797 )
...
新功能:
- 优化 PDF 文件的 OCR,过滤无意义的小图片 by @liunux4odoo #2525
- 支持 Gemini 在线模型 by @yhfgyyf #2630
- 支持 GLM4 在线模型 by @zRzRzRzRzRzRzR
- elasticsearch更新https连接 by @xldistance #2390
- 增强对PPT、DOC知识库文件的OCR识别 by @596192804 #2013
- 更新 Agent 对话功能 by @zRzRzRzRzRzRzR
- 每次创建对象时从连接池获取连接,避免每次执行方法时都新建连接 by @Lijia0 #2480
- 实现 ChatOpenAI 判断token有没有超过模型的context上下文长度 by @glide-the
- 更新运行数据库报错和项目里程碑 by @zRzRzRzRzRzRzR #2659
- 更新配置文件/文档/依赖 by @imClumsyPanda @zRzRzRzRzRzRzR
- 添加日文版 readme by @eltociear #2787
修复:
- langchain 更新后,PGVector 向量库连接错误 by @HALIndex #2591
- Minimax's model worker 错误 by @xyhshen
- ES库无法向量检索.添加mappings创建向量索引 by MSZheng20 #2688
2024-01-26 06:58:49 +08:00
wvivi2023
51424db243
enhance RapidWordLoader
2024-01-17 10:49:59 +08:00
wvivi2023
afa07ad208
enhance
2024-01-16 15:37:47 +08:00
wvivi2023
565a94c1bb
customize word loader
2024-01-10 10:45:47 +08:00
wvivi2023
7b7a180323
merge 0.2.6
...
merge 0.2.6
2024-01-02 10:10:41 +08:00
liunux4odoo
67b7c99d03
ocr 支持 GPU 加速(需要手动安装 rapidocr_paddle[gpu]);知识库支持 MHTML 和 Evernote 文件。 ( #2265 )
...
在 requirements 和 Wiki 中增加对可选文档加载器 SDK 的说明 ( close #2264 )
2023-12-04 09:39:56 +08:00
wvivi2023
dce1d16e29
enhance splitter
...
enhance splitter
2023-11-29 13:25:44 +08:00
liunux4odoo
aae4144476
数据库和向量库中文档 metadata["source"] 改为相对路径,便于向量库迁移 ( #2153 )
...
修复:
- 上传知识库文件名称包括子目录时,自动创建子目录
2023-11-23 19:54:00 +08:00
zR
24d1e28a07
一些细节优化 ( #1891 )
...
Co-authored-by: zR <zRzRzRzRzRzRzR>
2023-10-27 11:52:44 +08:00
imClumsyPanda
2020f5bb88
merge master
2023-09-12 15:51:28 +08:00
glide-the
b0a9d8f30e
增加显示ocr识别进度
2023-09-08 21:32:41 +08:00
roki1031
196bde3ead
提醒fitz包是来自pyMuPDF ( #1407 )
2023-09-08 12:20:20 +08:00
imClumsyPanda
6c4ef26e9a
add RapidOCRPDFLoader and RapidOCRLoader ( #1275 )
...
* add RapidOCRPDFLoader
* update mypdfloader.py and requirements.txt
* add myimgloader.py
* add test samples
* add TODO to mypdfloader
* add loaders to KnowledgeFile class
* add loaders to KnowledgeFile class
2023-09-01 10:23:57 +08:00