什么是OCR文字辨认技能
OCR英文全称是Optical Character Recognition,中文叫做光学字符辨认。它是使用光学技能和计算机技能把印在或写在纸上的文字读取出来,并转换成一种计算机能够承受、人又可以了解的格式。
OCR字符辨认技能的使用场景
OCR字符辨认技能广泛使用于银行收据、文献资料录入和处理范畴。适合于银行、税务等行业大量收据表格的自动扫描辨认及长期存储。在机器视觉范畴,OCR同样具有多方面的使用,经过工业相机、工业镜头拍照文字图画,运用机器视觉软件进行相应处理以获取咱们需求的信息,常见的使用有:
1、仪器仪表上的数据读取,如居民生活中得到水表、气表、电表的数值读取;
2、产品的日期、批号读取,获得产品的过期信息及可追溯信息;
3、智能交通的车牌辨认,获取违章车辆的信息。
机器视觉方面的OCR使用
1、检测条码/字符印刷缺点、完好度
2、检测条码/字符的对错、是否漏印
3、检测物体的方向是否正确
4、静态或动态检测
5、OK/NG产品体系输出相应控制信号。
对印刷外表字符的漏印、对错、缺点、有无、偏移度等进行辨认检测,断定被检产品是否合格,并输出检测成果和相应信号。
OCR文字辨认常见使用
文字辨认一些目前的使用已经是比较成熟了:比方汉王OCR,百度OCR,阿里OCR等等。其实咱们自己也能感遭到,OCR技能确实也在改变着咱们的生活:比方一个手机APP就能帮忙扫描手刺、身份证,并辨认出里边的信息;汽车进入停车场、收费站都不需求人工登记了,都是用车牌辨认技能;咱们看书时看到不明白的题,拿个手机一扫,APP就能在网上帮你找到这题的答案。这都是于基于OCR技能的使用。
OCR技能的发展
在一些简略环境下OCR的精确度已经比较高了(比方电子文档),但是在一些杂乱环境下的字符辨认,在当今还没有人敢说自己能做的很好。现在我们都很少会把目光还放在怎么对电子文档的文字辨认该怎么进一步提高精确率了,因为他们把目光放在更有挑战性的范畴。OCR传统办法在应对杂乱图文场景的文字辨认显得力不从心,越来越多人把精力都放在研讨怎么把文字在杂乱场景读出来,并且读得精确作为研讨课题,用学界术语来说,就是场景文本辨认(文字检测+文字辨认)。