OCR技术发展三大趋势_米乐m6官方网站在线登录-M6米乐官网

米乐m6官方网站:OCR技术发展三大趋势

发布时间:2023-11-24 16:45:37 来源:m6米乐在线登录 作者:M6米乐官网 分类:产品中心

  扫一扫就能识别文字,这是近年来出现在很多应用中的新功能。比如,输入银行卡号时,直接用cal Charr Recognition)。 OCR 是光学字符识别(Optical Character Recognition)的缩写,指利用机器将图像中手写体或印刷体的文本转换为计算机可以直接处理的格式。作为领域的重要分支,OCR 典型应用是通过图像文字识别实现信息录入。同时,由于文字和符号包含丰富的语义信息,基于 OCR 提取文字信息继而做多元化的分析,可以帮助机器更好地理解图像。

  9 月 28 日,在工业与信息化部、北京市人民政府、国际电信联盟 ITU-T 指导的 2020AIIA大会上,主办方正式对外发布国内首份智能文字识别(OCR)能力测评与应用白皮书。 白皮书从 OCR 发展背景、技术沿革、产业高质量发展现状、技术标准化、发展的新趋势等多重维度,对当前国内 OCR 产业进行了一次详细梳理,全面助推 OCR 技术产业化加速落地及可持续发展。

  据了解,白皮书由中国信息通信研究院、中国人工智能产业发展联盟、腾讯公司有关部门联合起草。

  借助人工智能技术,近年来 OCR 性能的不断的提高为产业数字化催生出的更复杂的 OCR 应用场景提供了坚实支撑。同时,覆盖手机、电子科技类产品以及云服务在内的更加多样化的服务载体,进一步加快了 OCR 的普及,持续向社会生产生活的更多领域渗透。 尤其是 2020 年 4 月,发改委明确将AI基础设施列入 “新基建” 范围,作为AI应用中最接 “地气”,商业推广较为成熟的领域,OCR 产业在“新基建” 背景下无疑将迎来新的发展机遇,有关技术也将迎来新一轮的变革。 报告说明,OCR 技术未来发展的三大方向最重要的包含一体化的端到端 OCR 模型、兼具高性能高效率的 OCR、从感知到认知的智能 OCR。 详细来说,构建一体化的端到端网络,同时对文字检测和识别进行训练,将成为 OCR 技术发展的重要趋势之一。端到端的网络设计不仅仅可以减少重复计算,又可提升特征的质量,促进任务性能的改善。 同时,大量的 OCR 应用需要在资源受限的移动端设备上运行,当前移动端 OCR算法大多以牺牲一定的算法精度来换取工作速度,针对移动电子设备设计兼顾性能和效率的轻量 OCR 模型将是未来发展的重要方向。 另外,从感知到认知的智能 OCR 来说,OCR 技术通常从计算机视觉领域出发,未来与自然语言处理技术、知识图谱等更广领域的交叉融合,通过语义及知识的深度挖掘提升 OCR 性能是重要趋势。

  此外,在 OCR 中引入强化学习和元学习等新的学习范式,让机器自主学习怎么样识别文字,也将成为研究热点。 市场规模达 133.81 亿美元,OCR 成科技巨头标配 目前,OCR 技术已在金融、保险、医疗、交通、教育等诸多行业有了深入成熟的应用。未来随着传统行业的数字化转型,OCR 应用场景范围和场景将进一步扩展,市场规模将进一步增大。有权威机构预测,2025 年全球 OCR 市场规模将达到 133.81 亿美元。 早期受限于技术发展水平,OCR厂商通常从特定应用切入,例如车牌识别系统等,形成了一系列专用设备。近年来,慢慢的变多的终端设备及应用均嵌入了 OCR 技术,并逐渐形成了从基础设施、基础能力到终端应用的完整产业链生态,也衍生出了卡证、票据等一系列细分 OCR 能力,通过组合的方式服务于各个行业。

  图 OCR 产业生态图 显而易见,OCR 技术逐渐 “下沉” 为一项基本的能力,为上层不同的业务应用提供底层技术支撑。科技巨头和云计算厂商正在纷纷加速布局 OCR,在满足自身内部业务需求的同时,不断对外开放先进的 OCR 能力,OCR 已然成为科技巨头能力标配。 多行业场景成熟落地,首次发布OCR评测标准 在具体的落地应用层面,目前卡证识别、票据识别等标准场景文字识别已经相对成熟,手写文字识别在教育、物流等行业的应用也在逐步扩大。复杂动态场景下的 OCR 技术和应用成为近两年的热门研究方向,比如在无人驾驶机器人等场景利用 OCR 对视场中出现的文字进行识别等。在此次发布的白皮书中,腾讯云也公布了其多项OCR领域的典型落地案例。

  值得一提的是,为全面降低 OCR 相关领域的应用门槛,防止鱼龙混杂局面,白皮书也首次公布 OCR 评测标准和规范。 2020 年 4 月,中国人工智能产业发展联盟制定了《OCR 服务智能化分级技术方面的要求和评估方法》,规定了 OCR 服务在功能、性能、安全等方面的技术方面的要求以及评估方法。7 月,OCR 服务要求及评估方法在国际电信联盟 ITU-T SG16 组成功立项,标志着深度学习背景下的 OCR 评测方法已经逐渐被国际标准组织所接受。 目前,由中国人工智能产业发展联盟指导,腾讯云开发的天鉴 OCR 服务引擎自动化评测平台,不仅仅可以为 OCR 技术供给方提供技术测试服务,也将发布 OCR 技术或产品的测试结果,为需求方提供客观公正的选型依据。