Merge branch 'main' of https://github.com/Cunninger/ocr-based-qwen
This commit is contained in:
commit
7634f61cb9
22
README.md
22
README.md
@ -7,7 +7,8 @@
|
||||
本项目基于 [QwenLM](https://chat.qwenlm.ai/) 。通过调用 QwenLM 的 ”API“,你可以从图片中提取文字内容,并且该项目支持一键部署到 **Cloudflare Workers** (CF) 上。
|
||||
|
||||
## 项目展示
|
||||

|
||||

|
||||
|
||||
## 测试cookie
|
||||
- 如果出现**处理失败: 文件上传失败的错误**,说明测试Cookie 上传文件过多, 尝试获取自己账号的Cookie 使用
|
||||
```
|
||||
@ -38,6 +39,25 @@ acw_tc=c2db8f77aa0023a996777b8537356b308a98c7fb128b3020323ddd0d440fee2e; x-ap=ap
|
||||
- **API 支持**:提供 `curl` 接口调用,支持通过图片文件、base64 和图片 URL 3种方式。(Apifox调用文档示例(**仅作为代码示例,这个网页调试有问题**):https://0vkh6v4ad8.apifox.cn/)
|
||||
- **验证码识别**:新增验证码识别功能,支持常见类型的验证码(如数字、字母、混合字符等),提升自动化处理能力。
|
||||
- **自定义prompt**: 在高级模式下(v1.1.0支持),用户可以自定义 prompt,跳过格式化处理,直接返回原始结果,而在普通模式下,使用默认的 prompt 并保持现有的格式化处理逻辑。
|
||||
## 提示词工程
|
||||
```
|
||||
const defaultPrompt =
|
||||
'不要输出任何额外的解释或说明,禁止输出例如:识别内容、以上内容已严格按照要求进行格式化和转换等相关无意义的文字!' + '请识别图片中的内容,注意以下要求:\n' +
|
||||
'对于数学公式和普通文本:\n' +
|
||||
'1. 所有数学公式和数学符号都必须使用标准的LaTeX格式\n' +
|
||||
'2. 行内公式使用单个$符号包裹,如:$x^2$\n' +
|
||||
'3. 独立公式块使用两个$$符号包裹,如:$$\\sum_{i=1}^n i^2$$\n' +
|
||||
'4. 普通文本保持原样,不要使用LaTeX格式\n' +
|
||||
'5. 保持原文的段落格式和换行\n' +
|
||||
'6. 明显的换行使用\\n表示\n' +
|
||||
'7. 确保所有数学符号都被正确包裹在$或$$中\n\n' +
|
||||
'对于验证码图片:\n' +
|
||||
'1. 只输出验证码字符,不要加任何额外解释\n' +
|
||||
'2. 忽略干扰线和噪点\n' +
|
||||
'3. 注意区分相似字符,如0和O、1和l、2和Z等\n' +
|
||||
'4. 验证码通常为4-6位字母数字组合\n\n' +
|
||||
'';
|
||||
```
|
||||
## 🛠️ 部署指南
|
||||
|
||||
### 1. 部署到 Cloudflare Workers
|
||||
|
Loading…
x
Reference in New Issue
Block a user