Articles of ocr

如何在Android中使用Tesseract?

我在网上搜了几个小时。 我得到了许多答案,说我们需要使用NDK等来为WINDOWS的“Tesseract”。 但是我没有逐步/正确解释安装NDK时应该做什么。 如何获取.so文件? 我已经完成了NDK和Cygwin的安装。 为了检查它是否正确完成,我输入make -v并给出了预期的输出。 任何使用过“Tesseract”的人都可以告诉我他们是如何做到的吗? (我已下载“Mezzofanti”,但在那里我没有find任何“Tesseract”文件。)

适用于OCR的Google Drive SDK

我刚刚在此链接上设置了适用于Android的quickstart google drive sdk应用程序 我正在尝试上传图像,然后对它们进行OCR。 Android快速入门上的示例应用程序运行正常,但是当我尝试将OCR的布尔值设置为true时,我得到以下IOException: 07-29 03:33:01.172: D/OCR_SERVICE(22602): Error 2: 400 Bad Request 07-29 03:33:01.172: D/OCR_SERVICE(22602): { 07-29 03:33:01.172: D/OCR_SERVICE(22602): “code”: 400, 07-29 03:33:01.172: D/OCR_SERVICE(22602): “errors”: [ 07-29 03:33:01.172: D/OCR_SERVICE(22602): { 07-29 03:33:01.172: D/OCR_SERVICE(22602): “domain”: “global”, 07-29 03:33:01.172: D/OCR_SERVICE(22602): “message”: “Bad Request”, 07-29 03:33:01.172: D/OCR_SERVICE(22602): “reason”: “badRequest” 07-29 03:33:01.172: D/OCR_SERVICE(22602): } 07-29 03:33:01.172: D/OCR_SERVICE(22602): […]

将图片翻译为Android上的文字?

我知道谷歌护目镜会将图片翻译成文字。 我想要做的是让用户拍照(没问题),将图片翻译成文本(?),然后对文本进行一些处理(没问题)。 android上有没有允许这个的API? 或者有任何方式与谷歌护目镜进行程序化沟通? 我不想让用户使用护目镜然后用我的应用程序选择保存的文件…..

使用Tesseract进行手写识别

我只是想知道如果在一个表单中用自己的小盒子中的大写字母使用手写识别,那么tesseract的精确度是多么准确。 我知道你可以训练它来识别你自己的笔迹,但我的问题是我需要在多个笔迹中使用它。 谁能指出我正确的方向? 非常感谢。

Android应用程序的手写识别API

有没有好的手写识别API来帮助在Android平台上开发应用程序? Google已经发布了(2012年7月左右http://www.google.com/insidesearch/features/search/handwritinginput/index.html )一项function,可以在触摸屏设备上使用手写进行搜索,看起来很棒,是否有可能获得访问这些API以在Android应用中使用?

如何执行文档自动裁剪使用相机识别图像?

我想制作一个类似凸轮扫描仪的应用程序来裁剪文档。 但我需要像我的两个图像一样的function.. 第一张图像显示相机拍摄的图像.. 第二个图像像这样识别捕获的图像部分。 我研究得越来越多,但没有得到任何外出,所以,我在这里问,是否有任何人这样做告诉我.. 谢谢

在Tesseract中识别数字的麻烦 – android

我希望有人能告诉我为什么这是我的Tesseract无法识别一些数字图像,如果有什么我可以做的。 一切都按照testing工作,因为它只是我需要的数字,我以为我可以用英文模式来pipe理,直到我不得不从7分段显示也开始。 虽然我对附加图像有很多麻烦,但是我想知道是否应该开始研究自己的识别algorithm,或者如果我可以为Tesseract创build自己的数据集,然后才能工作,是否有人知道在哪里限制在于Tesseract? 尝试的东西:试图设置psm one_line,one_word,one_char(和砍掉图片)。 用one_line和one_word没有显着的变化。 与one_char它确实认识到了一点点,但有时,由于大间距它附加了一个额外的数字,然后拧了起来,如果你看看附加的图像 那么结果是04.我也试图自己做二进制化,这导致了较差的认识,并且非常消耗资源。 我试图反转图片,这对tesseract完全没有任何影响。 我已经附上了我需要的照片,等等,待处理。 关于图像的解释: 是一个tesseract无法识别的图像,尽pipe它已经被用来在工作图像周围创build应用程序的便利性。 是与image_seven匹配的现实生活形象。 但它不能识别这一点。 是另一个图像,我想它承认,是的,我知道它不能被skrewed,我做了unskrew(认为skrew是这里的术语==“直”)它testing时。

在Eclipse中将Tess4J作为库包含在Java项目中

我有一个空的和干净的Eclipse Java项目。 如何使用Tess4J作为我想要开发的Web服务的库? 它甚至有可能使用它作为一个Android项目的图书馆? (会很快捷)有一个关于.tif与我碰到的android的问题。 Tess4J是本地代码的包装,因为tesseract–ocr是用C / C ++编写的。 我到目前为止。 但是如何将这个包装器包含到我的项目中呢? 我已经GOOGLE了很多,直到我已经决定放弃tesseract.Net ,因为这个项目是严重维护/logging,将迫使我的C#(这将是好的),但我没有设法得到它的工作,所以我不得不默认到C / C ++(这是不好的);) 我现在有点迷路了,所以任何帮助都是值得欢迎的。 问候。 编辑:按照这里提到的步骤(从nguyenq回答) 1:新的Eclipse工作区 2:创build一个名为lib的新目录 3:将\Tess4J\dist\tess4j.jar , \Tess4J\lib\jna.jar和\Tess4J\lib\jai_imageio.jar到lib (2) 4:在Eclipse中创build一个新的Java项目 5:在项目属性(4)中,我将(3)中的.jars添加到Java构buildpath中作为库下的外部jar 6:我将dir \tessdata和libtesseract302.dll复制到项目的根目录dir \workspace\project\ 7:我创build了一个新的类Main并实例化了一个Tesseract1 tesseract = new Tesseract1(); 供testing用 8:我运行的应用程序,但引发了一个exception: Exception in thread "main" java.lang.UnsatisfiedLinkError: Unable to load library 'libtesseract302' Module not found EDIT2: 7.1:我创build了一个新的类Main并实例化了Tesseract tesseract = new […]

使用Tesseract进行手写识别

我只是想知道,如果大写字母都用在自己的小盒子里,那么手写识别的准确程度如何呢? 我知道你可以训练它来识别自己的笔迹,但在我的情况是我需要跨越多个笔迹使用它。 任何人都可以指向正确的方向吗? 非常感谢。

Android OCR tesseract:使用来自Pixa对象的数据来显示边界框

我目前在Android上玩OCR。 因此,我写了一个带有Camera预览的小应用程序,现在我正在从我的onPreviewFrame方法提供tessearact工具(tess-two)图像。 现在我想在我的相机预览中显示来自OCR的边界的六边形。 TessBaseAPI提供了返回字符/单词布局框的方法。 返回的对象的types是Pixa,就像tess-2提供的leptonica库一样。 所以我的问题是: 我如何获得可用的坐标,我可以使用从我的相机预览从getCharacters()返回的Pixa对象或从TessBaseAPI getWords()预览的边界框? GetAPharacters()和getWords()在BaseAPI中 leptonicas Pixa类 重要: 由于预览只支持图像格式是YUV N21和我已阅读tess-API要求ARGB_8888位图我远离我的onPreviewFrame方法之前,我将位图提供给TessAPI之前有以下解决方法:(我也旋转由于我以纵向方向使用相机,但顺时针旋转90度,但相机预览帧进入横向) //byte[] bmpdata <- the image in a byte array (NV21 Imageformat) in onPreviewFrame YuvImage yuvimage = new YuvImage(bmpdata,ImageFormat.NV21,width,height,null); ByteArrayOutputStream outStream = new ByteArrayOutputStream(); Rect rect = new Rect(0, 0, width, height); yuvimage.compressToJpeg(rect, 100, outStream); Bitmap bmp = BitmapFactory.decodeByteArray(outStream.toByteArray(),0,outStream.size()); Matrix mtx = […]