如何将古籍黄底黑字图片转化白底黑字的图片

栏目:古籍资讯发布:2023-08-03浏览:1收藏

如何将古籍黄底黑字图片转化白底黑字的图片,第1张

放到PS中,用魔棒工具选择空白区域,就会全部选择到黄底部分,然后按Ctrl+Delete键,填充白色,填充完后按Ctrl+D键取消选区;再用魔棒工具选择任一文字,就会把全部的文字选择到,然后按Alt+Delete填充黑色,填充完后按上面说过的键取消选区,搞定。

1 怎样利用扫描仪,把书本上的文字转换成WORD文件

方法一、最简单的方法是选择一键OK的机器,直接选择带有这个快捷按键功能的机器,按一下即可转换到Word或者是Excel格式。

还有一种方法是选择汉王的软件有个文本王的版本,直接扫描进去后,选择插入WORD的图标,即可转换,明基的扫描仪最低端的机器都有配的。方法二、首先将扫描仪安装好,接下来启动“Microsoft Office/ Microsoft Office 工具/Microsoft Office Document Scanning”即可开始扫描。

提示:Office 2003默认安装中并没有这个组件,如果你第一次使用这个功能可能会要求你插入Office2003的光盘进行安装。 由于是文字扫描通常我们选择“黑白模式”,点击扫描,开始调用扫描仪自带的驱动进行扫描。

这里也要设置为“黑白模式”,建议分辨率为300dpi。扫描完毕后回将自动调入Office 2003种另外一个组件“Microsoft Office Document Imaging”中。

点击工具栏中的“使用OCR识别文字”按键,就开始对刚才扫描的文件进行识别了。按下“将文本发送到Word”按键即可将识别出来的文字转换到Word中去了。

如果你要获取部分文字,只需要用鼠标框选所需文字,然后点击鼠标右键选择“将文本发送到Word”就将选中区域的文字发送到Word中就行了。建议安装Office的时候选择将其附加程序完全安装 然后在XP系统下。

扫描仪连接后,双击扫描仪,会出来一个 Microsoft Office Documents Scanning 的提示 选用它来扫描。待扫描完成后上方有个带word图标的按钮按一下。

就会发现你扫描的文字已经存在于word中了只不过他存出来是web格式的doc文档。再做简单的转化就行了这个微软的OCR识别效果相当好,而且对于像书一样的一次可以扫描左右两页并且它可以自动将这两页按页码顺序排布下来。

以上是在windows XP + Office 2003下运行通过 方法三、用扫描仪扫描,并用OCR软件进行识别,输出成文本,粘贴到WORD就行了。OCR软件推荐尚书OCR、汉王OCR。

用扫描议扫为Adobe Acrobat Reader 简体中文版的文件,再用快照,粘出来就行了,文字还是文字,还是,也可以直接转换用扫描仪扫描,并用OCR软件进行识别,输出成文本,粘贴到WORD就行了。举个例子:以中晶扫描仪的识别软件-尚书OCR为例,将书本放到扫描仪的平板时,最好将书本夹角有文字处尽量贴向平板!以保证文字扫描时不会扭曲,可保证识别时的正确率!将文字区域扫描到尚书OCR软件以后,先确认左上角“文件”菜单下的系统配置是识别简体中文或者纯英文(注:繁体识别率会有所下降!)。

然后做下倾斜校正(在“编辑”菜单下),如果文字区域明显倾斜,有可能识别出来是乱码或错误信息! 校正完成后,版面分析,工具栏上有图标,然后识别!最后点“输出”菜单输出到指定格式,选择“RTF”格式,这个保存出来就是Word文档了!方法四、安装OCR软件,在使用OCR软件识别前,可用用处理软件(例如:photoshop)处理一下,转换成黑白模式,并适当加大对比度,可以大大提高识别率。 文字提取(OCR)图解教程 或Microsoft Office Document Imaging(office2003中内含) OFFICE中有一个组件document image,功能一样的强大。

不仅扫描的文字,连数码相机拍的墙上的宣传告示上的字都能提取出来。第一步 打开带有文字的或电子书籍等,找到你希望提取的页面,按下键盘上的"ALT+打印屏幕键(PrintScreen)"进行屏幕取图,或者用其他抓图软件。

保存成tif格式。第二步 我们需要安装“Microsoft Office Document Imaging”的组件,点“开始→程序→Microsoft Office→Microsoft Office 工具 ”,在 “Microsoft Office 工具” 里点“ Microsoft Office Document Imaging” 然后打开,找到OCR识别工具(像眼睛),点击此工具,开始安装,这个时候就需要你把光盘(或虚拟光驱)的office安装文件。

第三步 用 Microsoft Office Document Imaging打开,用OCR工具(图中红色筐圈部分)选取你要提取的文字,然后点右键,选择-复制到word或者记事本。 或用摄像头作扫描仪输入文字:我们平时使用的摄像头大家好象只用作聊天了吧 其实它的作用也是很广泛的好多的朋友在写论文,资料的时候总是要用一些书上的资料总是到打印社进行扫描打印,其实我们的摄像头就可以解决这个问题一,安装Microsoft office 2003 (仅以office 2003为例。

其它版本office均可) 二,打开“开始→Microsoft office→Microsoft office工具→Microsoft office Document scannging”,如果该项未安装,系统则会自动安装。此时会弹出扫描新文件对话框,单击[扫描仪]按钮,在弹出的对话框中选中摄像头,并选中“在扫描前显示扫描仪驱动”复选框,再选中“黑白模式”,并选中“换页提示”和“扫描后查看文件”两项。

三,再单击[扫描]按钮即可进行扫描,在扫描过程中会弹出一个对话框,选中[格式]按钮,在“输出大小”中选择600480分辨率,然后将文稿放平,反复调节摄像头的焦距和位置,使画面达到最佳效果,点击[捕获]按钮即可得到画面,该会显示在“。

用office 的Document Imaging OCR文本识别功能,能从扫描文件中识别文字转换成文本或word格式文件;

从开始-程序-office-打开软件

先打开扫描的Tag图像文件格式的文件,点 工具-‘使用OCR识别文本’识别出来,然后另存为文本文件。

这种标点叫开明制标点,一般在方正书版软件中可以自动处理。在word中通过特殊方法,也可以做到。

将需要处理的标点罗列出来,这里仅以常见的几种标点为例:

打开查找对话框

查找:[“”,。]

展开“高级”,勾选”使用通配符“,勾选”突出显示所有在该范围找到的项目“,点”查找全部“(2007版以上点”主文档“)

关闭查找对话框,这里所有被查找到的字符处于被选中状态,不可在页面区域点击鼠标,否则所选字符即被放弃。下面有两个选择:

第一是选”格式“菜单中的“更改大小写”--半角。当然,不进行前面的查找,也可以直接选择全文后执行此操作。这种方法是将除句号之外的标点处理为半角,不够美观。

第二是选“格式”菜单--“字体”,选“字符间距”标签,在“间距”中选择“紧缩,并在其磅值栏填选2。

这种方法相对美观。见以下动图。

清华大学图书馆

访问入口:《中国基本古籍库》(全文网络版) (校内服务器,无需登录出校)

(自己百度,给你地址是跳出的,会被贴吧屏蔽)   

简要介绍:《中

国基本古籍库》是综合性大型古籍数据库,共收录自先秦至民国(公元前11世纪至公元20世纪初)历代典籍及各学科基本文献1万种、16万余卷,选用版本

12,500个、20万余卷。每种典籍均制成数码全文,并附所据版本及其它重要版本之原版影像。合计全文17亿字、影像1千万页,数据总量约320G。其

收录范围涵盖全部中国历史与文化,是世界目前最大的中文数字出版物,也是中国有史以来最大的历代典籍总汇。

利用《中国基本古籍库》检索系统,用户可通过多个检索路径进行全方位的快速海量检索,完成校勘、标注、分类、版面调整、编辑、拷贝、打印等多项数字化古籍

整理作业。

 特别提示:

1下载与安装客户端安装程序:

  用户在首次使用时需安装 客户端软件。

  方法是:下载后解压缩、安装,然后重新启动计算机。点击桌面上的客户端应用程序,输入用户名称和密码即可使用。

  用户名称:thlib 密码:thlib 服务器IP地址:166111120208

  2《中国基本古籍库》当前只有5个并发用户数,请检索后尽快退出,以便其他用户登录。

  3适用于中、英、日、韩等多语种Windows2000/2003/XP/Vista/2008/Windows7操作系统。要求1024×768×16以上显示模式。

  4在使用过程中可以点击“帮助”了解各功能的详细介绍。

热门文章
    确认删除?
    回到顶部