• Joined on 2024-11-19
glowz pushed to main at glowz/ragflow_api_test 2025-08-08 17:21:39 +08:00
51f24ced05 新增批量更新Elasticsearch文档的功能,优化process_pdf_txt_pairs函数以提高处理效率
glowz pushed to main at glowz/ragflow_api_test 2025-08-08 10:39:05 +08:00
1c23d272bb 优化 Elasticsearch 更新逻辑,支持批量位置更新,调整匹配结果处理,新增位置整数格式返回
c1d66237e6 新增 chunk_pos.py 文件,集成 Elasticsearch 功能,支持文档块位置和图像 ID 更新,优化索引映射获取逻辑
Compare 2 commits »
glowz pushed to main at glowz/ragflow_api_test 2025-08-06 23:01:12 +08:00
e5ac523bd9 test positions
glowz pushed to main at glowz/ragflow_api_test 2025-08-05 22:50:21 +08:00
ec30b8d78a 优化find_text_in_pdf函数,支持列表类型查询结果的合并,调整阈值以提高匹配准确性,更新主函数示例以支持多行查询
glowz pushed to main at glowz/ragflow_api_test 2025-08-05 18:25:17 +08:00
c8f96ee41e 优化PDF文本查找功能,支持列表类型查询,新增预处理选项以提高模糊匹配准确性,修复多个匹配结果的处理逻辑
020de8da5d 新增PDF文本查找功能,支持多行正则和模糊匹配,优化匹配结果返回逻辑
Compare 2 commits »
glowz pushed to main at glowz/ragflow_api_test 2025-08-04 18:16:20 +08:00
657e3cb9e5 优化PDF文本查找功能,新增详细查找方法,支持按块和行查找,返回匹配文本的位置信息
glowz pushed to master at glowz/mmkk 2025-08-03 20:10:23 +08:00
3b375a22d8 修复行号显示和同步问题
glowz pushed to master at glowz/mmkk 2025-08-03 06:24:24 +08:00
9b3f959c3d Initial commit: Markdown editor with file management and regex tools
glowz created branch master in glowz/mmkk 2025-08-03 06:24:24 +08:00
glowz created repository glowz/mmkk 2025-08-03 06:17:59 +08:00
glowz pushed to main at glowz/data-prepare 2025-07-30 23:05:36 +08:00
40262648c4 添加多个类别关键词,优化数据处理逻辑,支持从arXiv提取和筛选论文数据
glowz pushed to main at glowz/ragflow_api_test 2025-07-30 18:24:32 +08:00
c47ddad5f1 实现PDF批量模糊文本查找功能,支持多个目标文本的相似度匹配,优化文本坐标返回逻辑
73557a272d 实现智能模糊文本查找功能,支持精确、模糊和部分匹配,优化文本坐标返回逻辑
44ef61daab 新增PDF文本查找功能,支持全文和逐页搜索,返回文本坐标信息
Compare 3 commits »
glowz pushed to main at glowz/data-prepare 2025-07-28 06:11:47 +08:00
7d15721f61 添加从arXiv批量获取论文数据的功能,并将结果保存为JSONL格式,优化了数据处理流程
ecf6279300 添加多种问题模板生成和数据解析功能,优化数据转换流程
Compare 2 commits »
glowz pushed to main at glowz/data-prepare 2025-07-25 18:12:03 +08:00
2846ebd310 添加爬取arXiv论文的功能,支持根据查询获取论文标题、作者和摘要
glowz pushed to main at glowz/ragflow_api_test 2025-07-23 22:16:31 +08:00
466fae53c9 将主函数中的文件路径硬编码更改为从环境变量加载
glowz pushed to main at glowz/ragflow_api_test 2025-07-23 17:18:04 +08:00
d8078c6d09 add env file
glowz pushed to main at glowz/ragflow_api_test 2025-07-23 17:14:01 +08:00
d8f2a26ecc 实现pdf-img-chunk完整功能,从环境变量加载配置,新增网络图片下载功能,并优化文本块处理逻辑
glowz pushed to main at glowz/ragflow_api_test 2025-07-22 23:10:41 +08:00
a0872e5eac 更新 Elasticsearch 和 MinIO 配置,重构文件上传逻辑,添加图片链接处理功能
glowz pushed to main at glowz/ragflow_api_test 2025-07-22 18:29:57 +08:00
40211521a2 更新主函数,添加PDF和TXT文件处理说明,注释掉文件选择和处理逻辑
2cc9dbfcd0 新增PDF和TXT文件处理功能,包括文件选择、对齐、上传和文本块处理
Compare 2 commits »
glowz pushed to main at glowz/ragflow_api_test 2025-07-21 23:08:25 +08:00
4c1e031bb5 新增整合上传功能,支持PDF和TXT文件的上传及处理,包括图片链接的提取与上传
Compare 2 commits »