Articles of ocr

Tesseract自定义词典

我目前正在使用tesseract OCR开发一个android项目。 我希望通过添加字典来微调给用户的结果。 根据http://code.google.com/p/tesseract-ocr/wiki/FAQ ,最好的解决方法是 将tessdata / eng.user-words替换为您自己的单词列表,格式相同 – UTF8文本,每行一个单词。 但是tessdata文件夹中没有eng.user-words文件,我假设如果我只用它的字典制作一个文本文件,它将永远不会被使用.. 有没有人有类似的经历,知道该怎么办? 任何建议都会有很大的帮助。

使用OpenCV的Android光学字符识别

我目前正在开发一个涉及Android中光学字符识别的项目,并且确实需要一些在该领域有一些经验的人的指示。 有人告诉我开始使用Android设置OpenCV(使用Android 设置OpenCv )并从那里开始。 从那时起,我已经设置了OpenCV并拥有所有样本( OpenCV android示例 )和随附的教程。 我的问题是我找不到一个可靠的方向从这里进入,我在这里find一个相关的问题,其答案指向一个教程,但我不确定它是否适用于Android。 我基本上一直试图在继续使用OpenCV或尝试其他我正在阅读的工具(如tesseract或纯java 实现)之间进行选择 。 任何关于选择方向的建议都将非常感谢,谢谢,Celic。 TL; DR 需要有关Android中最佳光学字符识别实现的建议

Android:如何改善tesseract ocr检索到的图像中的数字?

我做了一个简单的应用程序,读取图像并使用android检索数字图像作为文本。 但问题是精度仅为60%左右,并且也会出现一些不需要的噪音。 我确实认为准确度不可能达到100%,但是,我认为必须有一种方法来改进它。 但是,既然我是业余爱好者,我觉得很难。 我搜索了谷歌,但无法获得可靠的信息。 我想从东方幸运票中读取数字596,00和012345,如下图所示。

OCR库识别仪表设备上的数字

我需要OCR库(最好是Java),它能够确定在仪表设备上可视化的数字。 请看图片。 我已经在Java中尝试了一些库,但他们无法确定这种字体。 更新1: Tesseract和Asprise库无法执行此任务

是否有针对Android和iOS的OCR开源库或sdk(免费)?

我正在为Android和iOS应用程序寻找OCR开源库或sdk(免费).. 我将扫描名片以提取内容。 拉出的内容将存储为云端,电话和电子邮件帐户选择中的联系人。 任何资源都非常感谢。

使用Android相机的简单OCR应用程序

可能重复: android OCR? 我想要构建一个应用程序,它具有使用相机的OCR扫描仪,并从纸张中检测文本并转换为常规文本。 一个简单的程序。 我怎么能这样做? 什么是最简单的方法?

无法加载lept从加载器findLibrary返回null?

我正在研究OCR (光学字符识别)我从github获得了一个示例项目。对于这个项目我正在使用tess-test库项目并且项目构建并成功执行但是每当调用TessBaseAPI时,应用程序停止不幸……它显示以下日志错误 12-20 18:27:18.791: E/AndroidRuntime(24466): java.lang.ExceptionInInitializerError 12-20 18:27:18.791: E/AndroidRuntime(24466): at com.datumdroid.android.ocr.simple.SimpleAndroidOCRActivity.onPhotoTaken(SimpleAndroidOCRActivity.java:211) 12-20 18:27:18.791: E/AndroidRuntime(24466): at com.datumdroid.android.ocr.simple.SimpleAndroidOCRActivity.onActivityResult(SimpleAndroidOCRActivity.java:135) 12-20 18:27:18.791: E/AndroidRuntime(24466): at android.app.Activity.dispatchActivityResult(Activity.java:5293) 12-20 18:27:18.791: E/AndroidRuntime(24466): at android.app.ActivityThread.deliverResults(ActivityThread.java:3315) 12-20 18:27:18.791: E/AndroidRuntime(24466): at android.app.ActivityThread.handleSendResult(ActivityThread.java:3362) 12-20 18:27:18.791: E/AndroidRuntime(24466): at android.app.ActivityThread.access$1100(ActivityThread.java:141) 12-20 18:27:18.791: E/AndroidRuntime(24466): at android.app.ActivityThread$H.handleMessage(ActivityThread.java:1282) 12-20 18:27:18.791: E/AndroidRuntime(24466): at android.os.Handler.dispatchMessage(Handler.java:99) 12-20 18:27:18.791: E/AndroidRuntime(24466): at android.os.Looper.loop(Looper.java:137) 12-20 18:27:18.791: E/AndroidRuntime(24466): at […]

数字识别的建议

我正在编写一个Android应用程序来从图片中提取数独谜题。 对于9×9 Sudoku网格中的每个单元格,我需要确定它是否包含数字1到9之一或是空白。 我从像这样的Sudoku开始: 我使用OpenCV预处理数独,以提取各个数字的黑白图像,然后通过Tesseract将它们放入。 但Tesseract有一些限制: Tesseract很大,包含许多我不需要的function(即全文识别),并且需要英语培训数据才能运行,我认为必须将其放到设备的SD卡上。 至少我可以告诉它只使用tesseract.setVariable(“tessedit_char_whitelist”, “123456789”);查找数字tesseract.setVariable(“tessedit_char_whitelist”, “123456789”); Tesseract经常将单个数字误解为一串数字,通常包含换行符。 它有时也只是简单地弄错了。 以下是上述数独的几个例子: 我有三个问题: 有什么方法可以克服Tesseract的局限性吗? 如果没有,那么检测在Android上实现的个别数字(不是k-最近邻居)的有用, 准确的方法是什么 – 这可以是免费的库或DIY解决方案。 如何改进预处理以定位该方法? 我考虑过的一种可能性是使用细化算法,正如本文所建议的那样,但我不打算去实现它,除非它会有所作为。

如何在Android中使用Tesseract?

我在网上搜了几个小时。 我得到了许多答案,说我们需要使用NDK等来为WINDOWS的“Tesseract”。 但是我没有逐步/正确解释安装NDK时应该做什么。 如何获取.so文件? 我已经完成了NDK和Cygwin的安装。 为了检查它是否正确完成,我输入make -v并给出了预期的输出。 任何使用过“Tesseract”的人都可以告诉我他们是如何做到的吗? (我已下载“Mezzofanti”,但在那里我没有find任何“Tesseract”文件。)

适用于OCR的Google Drive SDK

我刚刚在此链接上设置了适用于Android的quickstart google drive sdk应用程序 我正在尝试上传图像,然后对它们进行OCR。 Android快速入门上的示例应用程序运行正常,但是当我尝试将OCR的布尔值设置为true时,我得到以下IOException: 07-29 03:33:01.172: D/OCR_SERVICE(22602): Error 2: 400 Bad Request 07-29 03:33:01.172: D/OCR_SERVICE(22602): { 07-29 03:33:01.172: D/OCR_SERVICE(22602): “code”: 400, 07-29 03:33:01.172: D/OCR_SERVICE(22602): “errors”: [ 07-29 03:33:01.172: D/OCR_SERVICE(22602): { 07-29 03:33:01.172: D/OCR_SERVICE(22602): “domain”: “global”, 07-29 03:33:01.172: D/OCR_SERVICE(22602): “message”: “Bad Request”, 07-29 03:33:01.172: D/OCR_SERVICE(22602): “reason”: “badRequest” 07-29 03:33:01.172: D/OCR_SERVICE(22602): } 07-29 03:33:01.172: D/OCR_SERVICE(22602): […]