- ·上一篇教育:Mac怎么访问Windows共享文件
- ·下一篇教育:怎么样可以把pdf格式的文档转换成word文档打印下来[围观]
怎么把扫描的文件的文字变成word格式
1.怎么把扫描的文件的文字变成word格式
使用Microsoft Office Document Imaging就行了。Document Imaging 是扫描印刷文档并将其转换为数字图像以存储在 CD、DVD 或其他磁盘介质的过程。通过使用 Microsoft Office Document Imaging,您可以扫描印刷文档并将其转换为数字图像,并以Tag 图像文件格式 (TIFF) (标记图像文件格式 (TIFF):一种基于标记的高分辨率图形格式。标记图像文件格式 (TIFF) 是数字图片的通用交换格式。) 或 Microsoft Office Document Imaging 格式 (MDI) (Microsoft Document Imaging 格式 (MDI):一种高分辨率的基于标记的图形格式,该格式基于的是用于数字图形的标记图像文件格式 (TIFF)。) 保存到计算机硬盘、网络服务器、CD 或 DVD 上。Microsoft Office Document Imaging 还使您能够执行光学字符识别 (OCR) (OCR:将文本图像(如扫描的文档)转换为实际的文本字符。也称为文本识别。)操作,该操作可作为文档扫描的一部分或处理 TIFF 或 MDI 文件的步骤。通过执行 OCR,您可以从扫描图像或传真中将识别的文本复制到 Microsoft Word 文档或其他 Office 程序文件中。
2.真题扫描版怎样变为word版
首先你得先把这些打印稿或文件通过扫描仪扫到电脑上去,一般单位都有扫描仪,如果没有也没关系,用数码相机拍也行,拍成图片放到WORD里面去,不过在些 之前,你还得装一下WORD自带的组件,03和07的都行。
点开始-程序-控制面板-添加/删除程序,找到Office-修改 找到Microsoft Office Document Imaging 这个组件,Microsoft Office Document Imaging Writer 点在本机上运行,安装就可以了。 将扫描仪安装好,接下来从开始菜单启动“Microsoft Office/ Microsoft Office 工具/Microsoft Office Document Scanning”即可开始扫描。
提示:Office 2003默认安装中并没有这个组件,如果你第一次使用这个功能可能会要求你插入Office2003的光盘进行安装。 由于是文字扫描通常我们选择“黑白模式”,点击扫描,开始调用扫描仪自带的驱动进行扫描。
这里也要设置为“黑白模式”,建议分辨率为300dpi。扫 描完毕后回将图片自动调入Office 2003种另外一个组件“Microsoft Office Document Imaging”中。
点击工具栏中的“使用OCR识别文字”按键,就开始对刚才扫描的文件进行识别了。按下“将文本发送到Word”按键即可将识别出来的文字转换到 Word中去了。
如果你要获取部分文字,只需要用鼠标框选所需文字,然后点击鼠标右键选择“将文本发送到Word”就将选中区域的文字发送到Word中了。 。
3.有没有一个软件能将扫描内容转为一个文档?被请告知怎样用?
你说的软件应该叫做OCR,可以将扫描的文字转换为文档,解决了很多打字压力问题。
试试功能优化后更加人性化便捷的尚书7文字识别 软件介绍: 本软件系统是应用OCR(Optical Character Recognition)技术,为满足书籍、报刊杂志、报表票据、公文档案等录入需求而设计的软件系统。 目前,许多信息资料需要转化成电子文档以便于各种应用及管理,但因信息数字化处理的方式落后,不但费时费力,而且资金耗费巨大,造成了大量文档资料的积压,因此急需一种快速高效的软件系统来满足这种海量录入需求。
本软件系统正是适用于个人、小型图书馆、小型档案馆、小型企业进行大规模文档输入、图书翻印、大量资料电子化的软件系统。 ●识别字符 简体字符集:国标GB2312-80的全部一、二级汉字6800多个。
纯英文字符集。 简繁字集:除了简体汉字外,还可以混识台湾繁体字5400多个以及香港繁体字和GBK汉字。
●识别字体种类 能识别宋体、仿宋、楷、黑、魏碑、隶书、圆体、行楷等一百多种字体,并支持多种字体混排。 ●识别字号 初号 小六号字体。
●表格识别 可以自动判断、拆分、识别和还原各种通用型印刷体表格。 ●可支持繁体WINDOWS系统 使用方法: 首先,尚书七号将整个OCR的过程明确化了,通过程序的菜单,我们就能够知道整个OCR的过程,主要分为:“文件”、“编辑”、“识别”、“输出”等步骤。
在文件菜单中,您可以调用扫描仪,或者选择将已经扫描好的图像文件打开。得到图像文件后,用户的工作,就是“编辑“菜单里面所提示的“图像页面的处理”,其中包括图像页的倾斜校正(提供自动和手动实现方法)及旋转等功能。
处理完毕后,就可以进入“识别过程”,该过程核心是“版面分析”。 现在尚书七号的自动版面分析功能很强,面对报纸杂志等复杂情况的版面,也能保持很高的分析正确率。
不再需要以往尚书六号里面那样的建议手工划识别范围。也正是这点,大大降低了使用者的工作量。
为了方便用户的使用,在“识别”菜单下,也提供了用户在自动版面分析后,通过修改识别范围框的属性,来决定需要识别否的功能。 当然,用户还是可以习惯的按尚书六号那样,自己来设定识别区域。
当用户设置好后,就可以直接点击“开始识别”的按钮进行文字识别了。 自动识别完毕,识别结果的“文本窗口”都会弹出,这个窗口能够提供识别结果的校对,为了校对的方便,尚书七号增加了光标跟随显示原图像行的校对方法。
这样提供校对的方法,一眼就能够看到图像原文和识别出文本的差别,方便了用户,降低了用户校对的工作疲劳感。当检查过后确认没有错误,用户就可以选择识别结果的“输出”了,指定的文件格式有:RTF、HTML、XLS、TXT,用户这里可以根据自己的需要选择对应的格式。
如果用户是想得到类似原文的识别结果,请选择RTF格式。 把RTF格式输出的文件用WORD打开后,会发现几乎保留了原文的所有痕迹,包括原来页面中的彩色图像,都已经保留在WORD中了。
识别结束后,存为RTF格式保存,过上面的正确使用习惯,我们便可利用尚书七号或其他OCR软件大幅度提高工作的效率。 此外,多数OCR软件同尚书七号一样,均提供有多图像页面的处理功能。
用户就可以放心的将好几页的文章,统一进行版面处理(只要选择“识别”菜单下的“选择全部文件”就可以做到批处理),识别的结果输出在同一个文件当中,更便于管理和保存。 另外根据笔者较长时间的使用经验,总结得出的一个技巧与各位分享,希望能对各位有所帮助。
如无特殊需求,一般用户只要在扫描驱动软件中,设定分辨率是300dpi,不管是彩色、256阶灰度还是黑白两值,尚书七号或其他OCR软件都可以轻松的识别,且效果最为理想。同时,如果用户只是需要黑白文档,在彩色、256阶灰度方式的扫描,尚书七号也可以自动的转化成黑白两值图做识别,这样的识别效果会更好。
(这个还真不错,虽然是帮你,但是也给我找到了一个好的扫描文字软件,呵呵。)
4.如何将扫描文件转换成word可编辑文档
所需工具:OneNote2013,word。
1.一般扫描文件都是图片格式,可以使用转化软件还原其中的文字,图片则无法还原,为便于操作,这里用系统自带的OneNote2013.以下图为例讲解步骤,注意图片要求清晰,字体为常见字体,不能是特殊字体,更不能是手写的,表格转换后只有文字,会失去格式。
2.打开OneNote2013新建一个笔记,然后执行插入-图片命令插入图片。
3.最准图片按右键-点击复制图片中的文字,此时文字内容已复制到剪贴板。
4.打开word右键粘贴即可,粘贴后需要校对下内容,一般有个别字体转换出错,最后保存即可。
