Overview
Tesseract的OCR引擎最先由HP实验室于1985年开始研发,至1995年时已经成为OCR业内最准确的三款识别引擎之一。然而,HP不久便决定放弃OCR业务,Tesseract也从此尘封。 数年以后,HP意识到,与其将
Tesseract束之高阁,不如贡献给开源软件业,让其重焕新生–2005年,Tesseract由美国内华达州信息技术研究所获得,并求诸于Google对 Tesseract进行改进、消除Bug、优化工作。
Tesseract目前已作为开源项目发布在Google Project,其项目主页在这里查看。为了方便起见,我们直接使用apt-get进行安装, 想自己编译的可参考官方
文档配置编译环境进行编译。
Environment
|
|
Steps:
1.安装tesseract-ocr以及相关依赖库:
|
|
2.根据官方API文档编译第一个demo出来,验证开发环境的正确性:
|
|
3.如果没有什么错误的话会生成tesseract,执行该应用:
|
|
这个Demo主要是将/usr/src/tesseract-3.02/phototest.tif这幅图片上的文字通过tessert-ocr的API转化为文本,然后打印到终端。
Notice
其他发行版的Linux也可参考本文进行配置Tessert-OCR开发环境。可能会遇到的问题汇总:
编译错误:
1.未正确安装tesseract-ocr的开发库(本文中提到的是:libtesseract-dev)
|
|
2.未正确安装leptonica的开发库(本文中提到的是:libleptonica-dev)
|
|
链接错误:
1.未正确链接libtesseract
|
|
2.未正确链接libleptonica
|
|
运行错误:
1.图片文件位置不正确:
|
|
根据图片位置修改代码中的文件路径:1Pix *image = pixRead("/usr/src/tesseract-3.02/phototest.tif");
若要下载本文中的代码可执行以下命令(请确保正确安装了git):
|
|
然后:
|
|