IT之家5月17日消息,继上线语音速记功能后,网易旗下产品有道云笔记又上线了另一实用的功能——文档OCR(即文字识别)。据悉,新上线的OCR功能在原有的扫描功能进行了升级,能够帮助用户轻松识别图片、PDF等扫描文档中的文字,并将其转化成可编辑的文档。
如果你还不了解新功能OCR究竟能为你做什么,那你一定遇到过以下这些情况,而OCR功能就是对这些“症结”的那款“灵丹妙药”:
· 工作或者科研学习中,要应对大量的纸质文件、书刊杂志、PDF格式的电子资料,很难对这些格式的资料进行编辑和整理
· 读书时,看到不错的文章段落想要做书摘笔记,但又懒得去打字或是手抄整理
· 在微信、微博等内容平台看到有价值的图片内容会随手保存mark,或是用截屏把手机页面内容保存到相册,但这些图片信息散乱在手机各处,很难进行归纳、整理和检索
以上难题,只需要5秒就能搞定!
那么,如何用OCR识别功能将纸质资料、图片和PDF文件,转换为可以自由编辑的文本格式呢?
「纸质文档」OCR识别
把纸书、合同等纸质文件、甚至墙体海报,转换成可编辑的文本格式,只需三步:
step1:智能扫描
将有道云笔记升级为最新版后,点击加号按钮,新建一篇“文档扫描”。
接下来就是见证实力的时刻,扫描过程中无需任何人工操作,软件可以自动、精准识别扫描图像的边框,去除扫描区域以外的多余背景,并且矫正偏斜,稳!准!狠!地将资料扫描进来。
如果对自动扫描结果不够满意,还可以选择手动调节模式进行微调。
在扫描过程中,请尽量将文字摆正,尽量剔除图片中无关的部分,这样可以大大提高文字识别的准确度啊~
step2:扫描图片滤镜美化
扫描后的图片会自动调节亮度和对比度,可以便捷的设置为增强或黑白模式,让图片更清晰。
step3:OCR识别,提取图片内文字
在进行OCR之前,请先将扫描文档进行同步保存。选择需要进行文字识别的图片后,点击底部的“识别”按钮,就能将这张扫描图片内的文字识别出来并转换成一篇文字笔记。
识别出的文本会直接保存到有道云笔记内,多平台同步,你可以在手机版、PC端、网页端等任意平台的有道云笔记内进行修改、编辑、整理。
在扫描图片足够清晰的情况下,文本识别的准确率可以达到95%以上。
原图片
识别文字
「图片」OCR识别
如何将那些“锁在”图片里的文字提取出来?我们用一张hin长(包含了2000多字内容)的微博长图来为大家演示图片OCR的用法和文字识别效果。
首先,进入有道云笔记,选择“上传图片”,将要识别处理的图片同步保存到有道云笔记。
然后,在页面底部找到“更多”按钮,点击“文本识别OCR”,就可以看到长图内的文字被完美识别出来了!
虽然网络图片的分辨率不是很高,并且单张图片文字内容较多,但是文字识别效果一点不含糊。
图片 ←→ 识别文本
「PDF文档」OCR识别
除扫描文档、图片外,有道云笔记(限会员)还可以PDF文本识别服务,PDF轻松转Word!
将PDF文档上传到有道云笔记,并完成同步后,点击底部的“OCR”按钮,经过几秒的等待后(视PDF文档大小而定),就可以看到PDF内的文字被识别出来,轻松转化为可以自由编辑的笔记格式。
PDF文档
识别文本
目前双栏布局PDF文档的文本识别支持度较差,暂时建议选择一栏布局的PDF文档进行OCR识别。
另外,你还可以通过有道云笔记微信公众号使用图片OCR功能!只要在微信对话框内把图片发给云笔记,就能为你将图片识别成文字。就像这样↓
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。