Commit Graph

15 Commits

Author SHA1 Message Date
c47ddad5f1 实现PDF批量模糊文本查找功能,支持多个目标文本的相似度匹配,优化文本坐标返回逻辑 2025-07-30 18:00:31 +08:00
73557a272d 实现智能模糊文本查找功能,支持精确、模糊和部分匹配,优化文本坐标返回逻辑 2025-07-30 12:48:11 +08:00
44ef61daab 新增PDF文本查找功能,支持全文和逐页搜索,返回文本坐标信息 2025-07-30 08:51:30 +08:00
466fae53c9 将主函数中的文件路径硬编码更改为从环境变量加载 2025-07-23 21:54:22 +08:00
d8f2a26ecc 实现pdf-img-chunk完整功能,从环境变量加载配置,新增网络图片下载功能,并优化文本块处理逻辑 2025-07-23 17:13:38 +08:00
a0872e5eac 更新 Elasticsearch 和 MinIO 配置,重构文件上传逻辑,添加图片链接处理功能 2025-07-22 23:10:34 +08:00
40211521a2 更新主函数,添加PDF和TXT文件处理说明,注释掉文件选择和处理逻辑 2025-07-22 18:29:48 +08:00
2cc9dbfcd0 新增PDF和TXT文件处理功能,包括文件选择、对齐、上传和文本块处理 2025-07-22 16:51:03 +08:00
19133b203a Merge branch 'main' of https://git.lqsjy.cn/glowz/ragflow_api_test 2025-07-16 10:58:00 +08:00
ba46368082 add url 2025-07-16 10:55:38 +08:00
ca92e349e0 整理 2025-07-15 21:52:38 +08:00
29d9b44e0a 更新MinIO文件上传逻辑,修改上传文件名和路径;调整文件选择路径以支持新的目录结构 2025-07-08 22:49:51 +08:00
5b940d5070 更新本地地址配置,修复连接问题;新增命令行接口以支持文档上传和处理功能 2025-07-06 10:47:10 +08:00
68444ad7ff 重构添加文档块功能,改进文件读取和错误处理逻辑 2025-07-05 11:43:50 +08:00
587305f070 添加初始文件和功能,包括数据集和文档类的定义,以及添加文档块的用户界面 2025-07-04 18:26:36 +08:00