2025-01-17 15:22:55 +08:00
2025-01-17 15:22:55 +08:00
2025-01-15 07:45:56 +08:00

🖼️ QwenLM OCR

本项目是对 QwenLM 的 OCR 功能进行逆向工程的实现。通过调用 QwenLM 的 API你可以从图片中提取文字内容并且该项目支持一键部署到 Cloudflare Workers (CF) 上。

项目展示

image

🚀 功能特性

  • 图片 OCR:使用 QwenLM 强大的 OCR 功能从图片中提取文字。
  • 拖拽上传:直接将图片拖拽到页面即可识别。
  • 复制粘贴:支持从剪贴板直接粘贴图片进行识别。
  • Token 管理:支持多 Token 轮询使用,提升稳定性。
  • 历史记录:保存每次识别的结果和图片,方便查看。
  • 一键复制:轻松复制识别结果到剪贴板。
  • 数学公式识别:特别优化了对数学公式的提取,支持 LaTeX 格式输出。
  • API 支持:提供 curl 接口调用,支持 base64 和图片 URL 两种方式。
  • 验证码识别:新增验证码识别功能,支持常见类型的验证码(如数字、字母、混合字符等),提升自动化处理能力。

🛠️ 部署指南

1. 部署到 Cloudflare Workers

  1. 配置 Cloudflare Workers

    • 登录 Cloudflare Dashboard
    • 创建一个新的 Worker。
    • worker.js 中的代码复制到 Worker 编辑器中。
  2. 部署

    • 保存并部署 Worker。
    • 获取 Worker 的访问地址,即可使用。

🧩 使用说明

  1. 设置 Token

    • 前往 QwenLM 获取 Token。
    • 点击右上角的 ⚙️ Token设置 按钮。
    • 输入你的 QwenLM API Token多个 Token 用英文逗号分隔)。
    • 点击 保存
  2. 上传图片

    • 拖拽图片到页面,或点击上传区域选择图片。
    • 支持直接粘贴图片。
  3. 查看结果

    • 识别结果会显示在页面下方。
    • 点击 复制结果 按钮,将识别内容复制到剪贴板。
  4. 查看历史记录

    • 点击左侧的 📋 识别历史 按钮,查看历史识别记录。
    • 点击历史记录中的图片,可以查看大图。
  5. API 调用

    • 支持 base64
      curl --location 'https://ocr.doublefenzhuan.me/api/recognize/base64' \
      --header 'Content-Type: application/json' \
      --data '{
          "token": "eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpZCI6IjUzZTk0Nzg4LWMwM2QtNDY4Mi05OTNhLWE0ZDNjNGUyZDY0OSIsImV4cCI6MTczOTA3NTE0MX0.FtwG6xDLYd2rngWUhuldg56WXCiLSTL0RI6xJJQ4vHM",
          "base64Image": "xxx"
      }'
      
    • 支持图片 URL:
      curl --location 'https://ocr.doublefenzhuan.me/api/recognize/url' \
      --header 'Content-Type: application/json' \
      --data '{
          "token": "eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpZCI6IjUzZTk0Nzg4LWMwM2QtNDY4Mi05OTNhLWE0ZDNjNGUyZDY0OSIsImV4cCI6MTczOTA3NTE0MX0.FtwG6xDLYd2rngWUhuldg56WXCiLSTL0RI6xJJQ4vHM",
          "imageUrl": "xxxx"
      }'
      
  6. 验证码识别 image

📜 许可证

本项目基于 MIT 许可证开源。详情请查看 LICENSE 文件。

🙏 致谢

  • 感谢 QwenLM 提供的 OCR 功能。
  • 感谢 Cloudflare 提供的 Workers 服务。

🌟 如果觉得这个项目对你有帮助,欢迎点个 Star 支持一下!🌟

体验地址智能图片识别 (doublefenzhuan.me)

GitHub 仓库Cunninger/ocr-based-qwen


后续计划

  • 优化数学公式识别精度;
  • 增加更多 API 功能支持;
  • 提升识别速度和稳定性。

快来体验吧!如果有任何问题或建议,欢迎在 GitHub 上提 Issue 或直接联系我!

更新

2025/01/13 应佬友需求,优化了对数学公式的识别,效果如下图

  • 原图:

image

  • 识别效果图: image

2025/01/13 18点34分 支持curl接口调用

  • 支持base64
curl --location 'https://ocr.doublefenzhuan.me/api/recognize/base64' \
--header 'Content-Type: application/json' \
--data '{
    "token": "eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpZCI6IjUzZTk0Nzg4LWMwM2QtNDY4Mi05OTNhLWE0ZDNjNGUyZDY0OSIsImV4cCI6MTczOTA3NTE0MX0.FtwG6xDLYd2rngWUhuldg56WXCiLSTL0RI6xJJQ4vHM",
    "base64Image": "xxx"
}'
  • 效果图: image

  • 支持图片URL:

curl --location 'https://ocr.doublefenzhuan.me/api/recognize/url' \
--header 'Content-Type: application/json' \
--data '{
    "token": "eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpZCI6IjUzZTk0Nzg4LWMwM2QtNDY4Mi05OTNhLWE0ZDNjNGUyZDY0OSIsImV4cCI6MTczOTA3NTE0MX0.FtwG6xDLYd2rngWUhuldg56WXCiLSTL0RI6xJJQ4vHM",
    
     "imageUrl": "xxxx"
}'
  • 效果图: image

趋势

Star History Chart

Description
基于 https://chat.qwenlm.ai/ 的OCR。测试Token:可见readme || Based on the OCR of (https://chat.qwenlm.ai/). Test Token: See README.
Readme 495 KiB
Languages
JavaScript 100%