如何把扫描的字酿成word
巧用Office 2003实现OCR文字输入 为了迎接市里的事情验收,率领拿来了很多存档文件,要求小王在三天内摘录并形成讲述文档。
看着厚厚的质料小王发愁了,抖客教程网,这时有人提醒:你的条记本电脑不是刚装上Office 2003吗,内里的Microsoft Office Document Imaging不错。它是一个光学字符识别(OCR)软件,可以用扫描仪扫入纸文档中的汉字,用它,摘录文件的速度可快多了。
○ 操纵筹备 局里只有一台较量旧的F1210扫描仪,小王把它毗连到条记本电脑的并口,接通电源今后安装扫描仪驱动措施。单击“开始”-->“所有措施”-->“Microsoft Office东西”中的“Microsoft Office Document Imaging”,将纸文档放入扫描仪,筹备将个中的汉字输入Word。
○ 扫描配置 打开Microsoft Office Document Imaging窗口今后,单击东西栏中的“扫描新文档”按钮,即可看到如图1所示的对话框。首先单击个中的“扫描仪”按钮打开选择扫描仪对话框,查察当前扫描仪的型号是否在内里。
假如对话框或下拉列表中没有当前扫描仪,就要查抄驱动措施安装和电源毗连是否正确。 接下来要按照文档的特点选择扫描预设。
假如是彩色纸张上的玄色或彩色文本,可能是白色纸张上的彩色文本,可以选择“将彩色页面扫描为利害图片”;对常见的白色纸张上的玄色文本而言,可以选择“利害模式”或“灰度模式”。 Microsoft Office Document Imaging提供的扫描预设成果可以满意大大都文档的要求。
假如文档利用的字体太小,可能由于纸张等缘故导致文字不太清楚,就得适当调解扫描预设中的判别率。用户只要选中要调解的某种扫描预设,单击图1中的“预设选项”按钮打开菜单,选择个中的“编辑所选预设”,就可以看到“预设选项”对话框的“通例”选项卡。
单击个中的“高级”按钮打开如图2所示的对话框,可将默认的判别率(DPI)值由200修改为300。当扫描文档中的文字是彩色或具有彩色配景时,选中图2中的“自动配置比拟度,生存为单色”,让扫描的图像具有较高的比拟度,这样可以得到更好的文字识别结果。
除此之外,“预设选项”对话框尚有三个选项卡。个中“页面”选项卡配置扫描仪的幅面,常见的A4扫描仪应该选择“A4”(默认);“输出”选项卡可以配置扫描文件的生存位置,还可以配置扫描文件的定名方法,可以按照本身的需要举办调解;“处理惩罚”选项卡控制OCR的事情配置,一般回收个中的默认值就可以了。
○ 扫描文档 文档放入扫描仪今后,按照其特点选择图1中的某一个扫描预设方法,单击“扫描”按钮开始扫描文档。与大大都OCR软件差异,Microsoft Office Document Imaging扫描竣事即开始文字识别,完成后即可在窗口中显示功效。
该窗口分为“缩略图窗格”和“页面窗格”阁下两部门。假如用户持续扫描了多页文档,缩略图窗格显示各页的缩略图,页面窗格显示当前文档的图像。
假如用户有多页文档需要扫描和识别,可以在一页扫描竣事后再次扫描下一页,完成后会弹出一个对话框。单击“继承”按钮可以放入下一页文档,继承举办扫描,但不识别和生存当前文档;单击“完成”按钮则遏制扫描,执行识别并生存文件。
再次扫描新文档时只要将它放入扫描仪,单击图1中的“扫描”按钮即可;单击“打消”按钮会遏制扫描,不举办识别也不生存文件。 发起把“换页提示”也勾选上,这样可以一次用扫描仪扫描完诺干张纸质文件,然后统一识别转化成word文档,提高事情效率 小提示 Microsoft Office Document Imaging具有自动旋转成果,文档放入扫描仪时无论位置正、倒都可以,软件在扫描进程中会自动识别并旋转到正确的方位。
○ 获取文本 从外貌上看,页面窗格显示的是文档图像。其实否则,被识此外文本已经被埋没在层中了(与文档图像疏散)。
我们可以采纳两种方式获取该层中的文本。 假如需要某页文档中的部门文字,只要按下东西栏中的“选择”按钮,拖动光标选中页面窗格中需要的文本,单击鼠标右键选择快捷菜单中的“复制”,就可以将这部门文本放入剪贴板,再粘贴到讲述文档中编辑了。
假如单击东西栏中的“将文本发送到Word”按钮,软件就会自动新建一个Word文档,将所选中的识别文字放入个中。以上操纵完成后,在页面窗格中的任意位置单击鼠标,就可以打消已经选中的文本,再次获取其它位置的文本了。
(页面中既有文字又有图片,可能既有文字也有表格边框,识别结果大概会受到影响,发起先选中文字,再识别) 当需要某页或几页文档中的所有文本时,可以直接打开东西栏中的“将文本发送到Word”按钮,选择添加到Word的文本范畴以及输出书式和生存位置。完成后单击“确定”按钮,即可在指定位置自动生存一个htm文档。