您好!欢迎访问亚博ag到账速度快的!
专注精密制造10载以上
专业点胶阀喷嘴,撞针,精密机械零件加工厂家
联系方式
陈小姐:13899999999
周先生:13988888888
您当前的位置: 主页 > 新闻动态 > 常见问题 >

常见问题

Amazon研究人员用AI提高曲线文本识别,测试准确度超过83%

更新时间  2021-01-30 01:23 阅读
本文摘要:光学字符识别(OCR )是一种可以将手写和打印机文本的图像切换为机器可读文本,追溯到70年代初的技术。但是,OCR算法很难识别长时间不与水平面平行的字符,因此Amazon的开发者开发了一种叫做“TextTubes”的技术。这是自然图像中曲线文本的检测器,可以把文本模型化为以其轴为中心的管状。 在阐述他们工作的论文中,合作者主张他们的方法超过了标准化的OCR标准下最先进的设备结果。

亚博ag取款快速

光学字符识别(OCR )是一种可以将手写和打印机文本的图像切换为机器可读文本,追溯到70年代初的技术。但是,OCR算法很难识别长时间不与水平面平行的字符,因此Amazon的开发者开发了一种叫做“TextTubes”的技术。这是自然图像中曲线文本的检测器,可以把文本模型化为以其轴为中心的管状。

在阐述他们工作的论文中,合作者主张他们的方法超过了标准化的OCR标准下最先进的设备结果。【图像来源: venturebeat所有者: venturebeat】正如研究者所说明的那样,场景文本一般分为文本检测和文本识别两个倒数的任务。第一个是用于确定文字、单词、行作为上下文的线索,第二个是mRNA的内容。

两者都说容易一起做。自然环境中的文本不仅受到变形的影响,也不受视点变化和字体的影响。这个团队的解决办法是利用文本参照框架的“管状”表现形式,利用目标文本一般用大小相近的字符串连接,捕捉很多偏差。与为了更容易重叠、容易产生噪声的矩形和四边形捕获文本信息的以往方法相比,作为数学函数被公式化,需要训练机器学习场景文本检测器。

研究者用CTW-1500评价了TextTubes的性能。CTW-1500是一组数据集,由从自然场景和图像库收集的1500张图像(每个图像至少一个曲线实例)和最多10000个文本实例组成。同时,用包括约1255次训练图像、300个测试图像、一个或多个曲线文本实例的Total-Text展开了评价。

他们的报告显示,他们在CTW-1500上以83.65%的精度获得了业界领先的结果,但最类似的方法的精度是75.6%。“建模一个实例的中间轴和平均半径……可以捕获关于整个实例的信息”这篇论文的年度出版人这样写道。

“在由Total-Text这样的一个单词构成的数据集中,我们的模型需要构建最先进的设备性能。对于像CTW-1500这样具有行级注释的数据集,必须更好地捕获实例中每个单词的文本信息。》如果有一天TextTubes需要开始使用,对强烈依赖OCR技术开展业务的企业来说,这可能是个好消息。据估计,多达80%的数字过程中还留有纸张。

亚博ag到账速度快的

大约97%的中小企业被用于纸质支票。根据Grand View Research的数据,这可能是预计到2025年OCR解决方案市场价值将超过138.8亿美元的理由。

((公众号: ) ) via VB原创文章,刊登许可证禁令。以下,听取刊登的心得。


本文关键词:Amazon,研究人员,用,提高,曲线,文本,识别,测试,亚博app有信誉的

本文来源:亚博ag到账速度快的-www.hootonwoldokrent.com