又来了个OCR模型：混元OCR发布并开源github.com/Tencent-H

蚁工厂 2025-11-25 18:20:01

又来了个OCR模型：混元OCR发布并开源github.com/Tencent-Hunyuan/HunyuanOCRHunyuanOCR是一款基于腾讯混元原生多模态架构的端到端OCR专家模型。仅以1B轻量化参数，便已斩获多项业界SOTA成绩。该模型精通复杂多语种文档解析，同时在文字检测识别、开放字段信息抽取、视频字幕识别、拍照翻译等全场景实用技能中表现出色。✨ 核心特点 💪 轻量化架构：基于混元原生多模态架构与训练策略，打造仅1B参数的OCR专项模型，大幅降低部署成本。 📑 全场景功能：单一模型覆盖文字检测和识别、复杂文档解析、卡证票据字段抽取、字幕提取等OCR经典任务，更支持端到端拍照翻译与文档问答。 🚀 极致易用：深度贯彻大模型"端到端"理念，单一指令、单次推理直达SOTA结果，较业界级联方案更高效便捷。 🌏 多语种支持：支持超过100种语言，在单语种和混合语言场景下均表现出色。

0 阅读：0

感谢大家的关注

作者最新文章

1

deepseek这会挂了，难道要发r2？目前已恢复

2

又来了个OCR模型：混元OCR发布并开源github.com/Tencent-H

3

伯克利的博士生江昊哲写了一篇博文： Can Transformers Do Ev

4

一份 Stanford CS336，从头构建大语言模型的课程笔记bearbear

5

Git 3.0 将正式启用 main 作为默认分支（2020年10月开始， Gi

6

耶鲁大学 CPSC 4690/5690 “随机算法”课程的讲义，587页的大部头

7

SSD硬盘不适合做那种存下来放一边的数据备份，因为长期不通电的话可能会丢失数据。

8

The Bitter Lesson of LLM Extensionswww.s

9

paperreview.ai/吴恩达发布了一个用智能体做论文评审的工具Stanf

10

Claude Agent Skills 深度解析：基于第一性原理的提示工程架构l

热门分类

科技TOP

1

昨天小鹏科技日最出圈的就是机器人全网都在找它是披着皮的真人的证据确实相比今年4月

2

为啥股价会跌？没看明白。单从步态讲小鹏机器人是全球走得最好最像人的。我平时研究临

3

科技发展真是越来越离谱啦！近日，浙江温州街头，一个人形机器人稳稳牵着机器狗遛弯，

4

【：最强Mate机皇】华为终端官宣将于11月25日举行华为Mate80系列/M

5

对小鹏机器人太好奇了，不可能是真人套个皮吧？小鹏好歹是家上市公司专门开个发布会亮

6

最近关于荣耀500系列的爆料越来越全面，如果这些配置是真的就太棒了！数字系列一

7

荣耀的连环招太狠了！三款新机，款款都是王炸！影像有荣耀500Pro：骁龙8

8

这新闻是认真的吗，华为MateX7如果8000元起步，那现在买X6的不得哭晕在

9

家人们谁懂啊！荣耀这是要“卷疯”友商啊😱最近手机圈又出大动静啦！荣耀500

10

咋回事？我连预定都没抢到？！昨天还在那儿各种挑槽点呢结果今天华为Mate8

科技最新文章

1

荣耀直接掀桌子，大家干脆都别玩了荣耀500系列是2699元起售顶配版给到了1

2

原来有钱人都用苹果和华为

3

荣耀500和荣耀500Pro哪个更好看其实我个人会觉得标准版还是好看一些毕竟

4

给准备后面m80的兄弟们一个建议！要么标准版，要么promax。相信我。跟店里

5

樊振东终于不用装了也不用再解释了现在全国网友都知道了，他即将获得他的第二个金

6

Mate80系列配置爆料，找到两张，你们觉得可信吗

7

笑不活了！樊振东去当一天粗粮的店长，细心的为用户贴膜。粗粮官方送了东东一个金色的

8

【：最强Mate机皇】华为终端官宣将于11月25日举行华为Mate80系列/M

9

华为Mate80ProMax是采用全金属机身全新材质，下面多一个圆圈是为了

10

华为Mate10，起步4+64GB，卖3899华为Mate20，起步6+64G