Blue Flower

Mini ocr是一款由马飞涛开发的ocr识别软件。mini名字的由来是因为其他商业ocr软件都非常大,本软件只有几兆,所以称之为mini,中音译“迷你”,Mini ocr主要功能是识别图像文件中的文字,并将以文本的形式展示,这对于很多编辑工作者摘抄和借鉴资料非常有帮助,有需要的朋友可以下载。

Mini ocr功能特色

知识兔1、采用复合特征的分类方法
2、字符集选择3755个一级汉字
3、字体选择最常用的宋体
4、字号选择从小五号到一号汉字,主要针对20个点之内的小字体
5、英汉混排时,汉语优先
6、汉字粘连时,进行动态优化切分

Mini ocr使用方法

知识兔1、下载软件压缩包文件,解压点击“MiniOcr.exe”即可运行,Mini Ocr免费、绿色,无需安装。
202210300453507554230000
2、点击“打开图像文件”按钮,将目标图片添加进来,如下图所示:
202210300453511302180001
3、Mini Ocr会将图片显示在右边的窗口中,如下图,如果文件为长图,还可以点击“段落分割”来进行切割!
202210300453515720120002
4、点击“文字识别”按钮,Mini Ocr则会自动识别图片文件内包含的文字以及字体信息等,支持复制,粘贴,如下图所示:
Mini Ocr同样可以作为一款提取图片中的文字工具来使用!
202210300453519235210003
5、完成之后,点击保存,即可将目标文件中的文字信息导出来!
202210300453522068640004

官方介绍

知识兔不同于商业0cr软件,本软件是免费的,可以自由使用。第二个不同之处,本软件的识别对象是屏幕出现的“显示汉字“而不是针对扫描仪扫出来的“打印汉字”。二者有什么不同呢?最重要的一点: 扫描出来的打印汉字的高度和宽度一般都在30多个像素点之  I上,这是我用画图软件,打开某个商业0cr的s 1es\s 1e)tif,然后一点一点数出  ’来的。从文件名和目录名的中文含意可以看出,这个点数应该是一个典型值。那么,如果用商业0cr识别屏幕上出现的小五号字,汉字的高度是12个像素点,会出现什么情况呢?
测试方法:用记事本随便写几行汉字,设置字体为小五号字。这大概是看着还算舒服的最小号的汉字字体了(高度是12个像素点),如果再小,字体就很难看了。然后,按拷屏键PrtSc,把屏幕的图像拷贝、粘贴到画图软件中,修剪尺寸后,保存为b 的格式。然后,我找了两个国内最著名的0cr软件进行测试,结果让人大吃一惊,识别率几乎为零.把图像放大两倍,再测试,结果仍然很不理想,大概也只有百分之二三十的样子。

更新日志

知识兔v1.0
1、重新优化英文识别的算法;
2、对英文粘连的切分算法进行调整;
3、移植进入Linux

下载体验

请输入密码查看内容!

如何获取密码?

 

点击下载