Web前端开发网

fly63.com

首页 资源 工具 文章 教程 栏目
  • 在线搜索
  • 文章标签
  • 广告合作
  • 赞助一下
  • 关于我们
资源推荐
宝塔服务器面板
简单好用的服务器运维面板
SpeedAI
一键去重、降AIGC率、数据可视化、论文写作
美图设计室
AI智能一键生成海报,免费平面设计
硅云优惠券
领先的基础云计算服务提供商,PHP云虚拟主机第一品牌
任推邦
APP推广项目分发和流量变现平台
我要自学网
免费视频教程,提供全方位软件学习
腾讯云优惠券
云服务器,云数据库,CDN,域名注册等多种云计算服务
fly63工具箱
简单、易用、便捷的在线工具
蜂小推
不扣量的项目推广平台
AI提示词商城
AI提示词交易与管理平台,提升效率

资源分类

AI智能 酷站推荐 招聘/兼职 框架/库 模块/管理 移动端UI框架 Web-UI框架 Js插件 Jquery插件 CSS相关 IDE环境 在线工具 图形动效 游戏框架 node相关 调试/测试 在线学习 社区/论坛 博客/团队 前端素材 图标/图库 建站资源 设计/灵感 IT资讯
网站收录 / 问题反馈

MonkeyOCR

分享
复制链接
新浪微博
QQ 好友

扫一扫分享

GitHub:https://github.com/Yuliang-Liu/MonkeyOCR
网站描述:专注于文档解析的OCR项目
GitHub
MonkeyOCR 是一个专注于文档解析的项目,采用了 Structure-Recognition-Relation (SRR) 三元组范式,在简化模块化方法的多工具 pipeline 的同时,避免了使用大型多模态模型处理全页文档的低效问题。


核心特点

  1. 性能优势:
    • MonkeyOCR-pro-1.2B 在中文文档上的表现超过 MonkeyOCR-3B 7.4%
    • MonkeyOCR-pro-1.2B 相比 MonkeyOCR-pro-3B 速度提升约 36%,而性能仅下降约 1.6%
    • 在 olmOCR-Bench 上,MonkeyOCR-pro-1.2B 优于 Nanonets-OCR-3B 7.3%
    • 在 OmniDocBench 上,MonkeyOCR-pro-3B 在中英文文档上均取得最佳整体性能,超过了包括 Gemini 2.0-Flash、GPT-4o 等在内的闭源和超大型开源 VLMs
  2. 推理速度:
    不同 GPU 上的处理速度(页 / 秒)有详细测试数据,例如在 4090 GPU 上,MonkeyOCR-pro-3B 处理 1000 页 PDF 的速度可达 1.006 页 / 秒,MonkeyOCR-pro-1.2B 则为 0.683 页 / 秒(3090 GPU 上)。


部署方式

支持多种部署方式:
  • 本地部署
  • Docker 部署
  • WSL2 + Docker 部署(针对 Windows 用户)


模型下载

可通过 HuggingFace 或 ModelScope 下载模型,项目提供了专门的下载脚本 tools/download_model.py 方便获取模型权重。

仅供个人学习参考/导航指引使用,具体请以第三方网站说明为准,本站不提供任何专业建议。如果地址失效或描述有误,请联系站长反馈~感谢您的理解与支持!

链接: https://fly63.com/nav/4242

更多»
热门资源
fly63工具箱
简单、易用、便捷的在线工具
官网
GitHub
remove.bg
消除图片背景:100% 自动 – 只需 5 秒
官网
阿里云DataV
地图数据
官网
retoucher
在线AI智能抠图去背景工具
官网
飞书多维表格
飞书旗下的一款在线协作与业务管理工具
官网
Apifox
API 文档、API 调试、API Mock、API 自动化测试一体化协作平台
官网
易文档
需求文档、API文档、部署文档到使用手册
官网
mdx-deck
基于MDX的演示文稿
官网
GitHub
YouCompress
在线免费文件压缩工具
官网
iHateRegex
快速搜索并匹配到合适的正则表达式
官网
GitHub
Trilium Notes
层级结构的笔记程序,专注构建个人的大型知识库
点击进入
GitHub
CodeZen
在线源代码转图片工具
官网
类似于MonkeyOCR的资源
JuxtaposeJS
在线照片比对特效制作工具
官网
悦书
免费PDF文件阅读器
官网
Ultimate CSS Gradient
一款CSS3渐变设计的在线工具
官网
Optimizt
用CLI命令去优化图像的工具
点击进入
GitHub
Anime4K
实时动画升级算法,实时、视频动画放大算法
官网
GitHub
阿里云DataV
地图数据
官网
Cobalt
支持全平台视频、音频和图片下载的开源工具
官网
GitHub
markdown-it
一款优秀的 Markdown 快速解析器,支持 100% 通用 markdown 特性
官网
GitHub
目录

手机扫一扫预览

》
分享组件加载中...
首页 技术导航 在线工具 技术文章 教程资源 前端标签 AI工具集 前端库/框架 实用工具箱 广告合作 关于我们

Copyright © 2018 Web前端开发网提供免费在线工具、编程学习资源(教程/框架/库),内容以学习参考为主,助您解决各类实际问题,快速提升专业能力。