Articles of ocr

在Tesseract中识别数字的麻烦 – android

我希望有人能告诉我为什么这是我的Tesseract无法识别一些数字图像,如果有什么我可以做的。 一切都按照testing工作,因为它只是我需要的数字,我以为我可以用英文模式来pipe理,直到我不得不从7分段显示也开始。 虽然我对附加图像有很多麻烦,但是我想知道是否应该开始研究自己的识别algorithm,或者如果我可以为Tesseract创build自己的数据集,然后才能工作,是否有人知道在哪里限制在于Tesseract? 尝试的东西:试图设置psm one_line,one_word,one_char(和砍掉图片)。 用one_line和one_word没有显着的变化。 与one_char它确实认识到了一点点,但有时,由于大间距它附加了一个额外的数字,然后拧了起来,如果你看看附加的图像 那么结果是04.我也试图自己做二进制化,这导致了较差的认识,并且非常消耗资源。 我试图反转图片,这对tesseract完全没有任何影响。 我已经附上了我需要的照片,等等,待处理。 关于图像的解释: 是一个tesseract无法识别的图像,尽pipe它已经被用来在工作图像周围创build应用程序的便利性。 是与image_seven匹配的现实生活形象。 但它不能识别这一点。 是另一个图像,我想它承认,是的,我知道它不能被skrewed,我做了unskrew(认为skrew是这里的术语==“直”)它testing时。

在Eclipse中将Tess4J作为库包含在Java项目中

我有一个空的和干净的Eclipse Java项目。 如何使用Tess4J作为我想要开发的Web服务的库? 它甚至有可能使用它作为一个Android项目的图书馆? (会很快捷)有一个关于.tif与我碰到的android的问题。 Tess4J是本地代码的包装,因为tesseract–ocr是用C / C ++编写的。 我到目前为止。 但是如何将这个包装器包含到我的项目中呢? 我已经GOOGLE了很多,直到我已经决定放弃tesseract.Net ,因为这个项目是严重维护/logging,将迫使我的C#(这将是好的),但我没有设法得到它的工作,所以我不得不默认到C / C ++(这是不好的);) 我现在有点迷路了,所以任何帮助都是值得欢迎的。 问候。 编辑:按照这里提到的步骤(从nguyenq回答) 1:新的Eclipse工作区 2:创build一个名为lib的新目录 3:将\Tess4J\dist\tess4j.jar , \Tess4J\lib\jna.jar和\Tess4J\lib\jai_imageio.jar到lib (2) 4:在Eclipse中创build一个新的Java项目 5:在项目属性(4)中,我将(3)中的.jars添加到Java构buildpath中作为库下的外部jar 6:我将dir \tessdata和libtesseract302.dll复制到项目的根目录dir \workspace\project\ 7:我创build了一个新的类Main并实例化了一个Tesseract1 tesseract = new Tesseract1(); 供testing用 8:我运行的应用程序,但引发了一个exception: Exception in thread "main" java.lang.UnsatisfiedLinkError: Unable to load library 'libtesseract302' Module not found EDIT2: 7.1:我创build了一个新的类Main并实例化了Tesseract tesseract = new […]

使用Tesseract进行手写识别

我只是想知道,如果大写字母都用在自己的小盒子里,那么手写识别的准确程度如何呢? 我知道你可以训练它来识别自己的笔迹,但在我的情况是我需要跨越多个笔迹使用它。 任何人都可以指向正确的方向吗? 非常感谢。

Android OCR tesseract:使用来自Pixa对象的数据来显示边界框

我目前在Android上玩OCR。 因此,我写了一个带有Camera预览的小应用程序,现在我正在从我的onPreviewFrame方法提供tessearact工具(tess-two)图像。 现在我想在我的相机预览中显示来自OCR的边界的六边形。 TessBaseAPI提供了返回字符/单词布局框的方法。 返回的对象的types是Pixa,就像tess-2提供的leptonica库一样。 所以我的问题是: 我如何获得可用的坐标,我可以使用从我的相机预览从getCharacters()返回的Pixa对象或从TessBaseAPI getWords()预览的边界框? GetAPharacters()和getWords()在BaseAPI中 leptonicas Pixa类 重要: 由于预览只支持图像格式是YUV N21和我已阅读tess-API要求ARGB_8888位图我远离我的onPreviewFrame方法之前,我将位图提供给TessAPI之前有以下解决方法:(我也旋转由于我以纵向方向使用相机,但顺时针旋转90度,但相机预览帧进入横向) //byte[] bmpdata <- the image in a byte array (NV21 Imageformat) in onPreviewFrame YuvImage yuvimage = new YuvImage(bmpdata,ImageFormat.NV21,width,height,null); ByteArrayOutputStream outStream = new ByteArrayOutputStream(); Rect rect = new Rect(0, 0, width, height); yuvimage.compressToJpeg(rect, 100, outStream); Bitmap bmp = BitmapFactory.decodeByteArray(outStream.toByteArray(),0,outStream.size()); Matrix mtx = […]

Android:如何提高由tesseract ocr检索的图像中的数字?

我做了一个简单的应用程序,读取图像和检索数字图像与android的文本。 但问题是精确度只有60%左右,一些不必要的噪音也显示出来。 我确实认为准确度不能达到100%,但我相信必须有一种方法来改善它。 但是,因为我是一个业余爱好者,我觉得很困难。 我search了谷歌周围,但无法获得一个坚实的信息。 我想从东方幸运的门票,如下图所示读取596,00和012345号码。

光学字符识别Android与OpenCV

我目前正在研究一个涉及Android的光学字符识别的项目,真的需要一些在该领域有经验的人的指点。 我被告知要通过安装OpenCV(使用Android 设置OpenCv )并从那里开始。 从那以后,我build立了OpenCV,并提供了所有的示例( OpenCV android示例 )以及随附的教程。 我的问题是,我无法从这里find一个坚实的方向,我发现这里有一个相关的问题,其答案指向一个教程,但我不确定它是否会与Android的工作。 我基本上坚持试图在继续使用OpenCV或尝试其他我一直在阅读的工具(如tesseract或纯java 实现)之间进行select 。 任何意见的方向select将不胜感激,谢谢,Celic。 TL; DR 需要关于Android中最好的光学字符识别实现的build议

自定义字典为Tesseract

我目前正在使用tesseract OCR的Android项目。 我希望通过添加一个字典来调整给用户的结果。 根据http://code.google.com/p/tesseract-ocr/wiki/FAQ ,最好的方法是去 用你自己的单词列表replacetessdata / eng.user-words,格式相同 – UTF8文本,每行一个单词。 但是,tessdata文件夹中没有eng.user-words文件,我假设如果我只是用它的字典创build一个文本文件,它将永远不会被使用.. 有没有人有类似的经验,知道该怎么办? 任何build议将是一个很大的帮助。

在Android上将图片翻译为文字?

我知道谷歌护目镜将把图片翻译成文本。 我想要做的是让用户拍照(没问题),将图片翻译成文本(?),然后对文本进行一些处理(没问题)。 Android上有任何API允许这个? 或者有没有什么办法与谷歌护目镜进行编程沟通? 我讨厌有用户使用护目镜,然后select与我的应用程序保存的文件…..

如何执行文件的自动裁剪使用相机识别图像?

我想制作一个像凸轮扫描仪的应用程序来裁剪文件。 但我需要像我的两个图像相同的function.. 显示图像的第一张图片 第二个图像识别这样的拍摄图像部分 我越来越多的研究,但没有得到任何performance,所以我问这里是否有人告诉我.. 谢谢

手写识别API的android应用程序

有没有什么好的手写识别API来帮助在Android平台上开发应用程序? 谷歌已经发布(约2012年7月http://www.google.com/insidesearch/features/search/handwritinginput/index.html )function使用手写进行search触摸屏设备它看起来不错,是否有可能得到访问这些API用于Android应用程序?