如何给书进行快速扫描
在工作中,要是能把纸上有用的文字快速输入到电脑中,不用打字录入便可以大大提高工作效率该有多好呀!随着科技的发展,这个问题在不断的解决,例如,现在市场上的扫描仪就带有OCR软件,可以把扫描的文字转换到电脑中进行编辑。但是,对于平常人来说,大多数人都是即不想多花钱购买不常用的设备,又不想费力气打字录入,下面给大家说说操作方法。
步骤 :
1、在电脑中安装 doPDF和AJViewer
2、用数码相机把需要的文字拍下来(相机和照像水平就不多谈了。照片效果越好,可以大大缩小转换文字的误差率)
例如:
3、在word中插入你用数码相机照的书上的文字(打开word——插入菜单————来自文件——选择照片——插入)
4、在word中选择文件菜单——打印——在打印机选项中选择doPDF——确定——点击“浏览”选项——选择文件保存的位置和填写文件名称——保存——确定
5、按照上面的步骤,电脑会自动打开AJViewer软件,若没有自动打开该软件,可以自己打开AJViewer软件,然后在AJViewer中打开刚刚转换的PDF文件。
6、选择AJViewer中的,然后在需要的文字部分拖动鼠标画出虚线。
7、点击发送到word按钮,就可以转换成word文件了。可以编辑了。
第6、7步骤如下:
要点提示 :
1、照片一定要平整,最好对比强烈。(最最关键的部分)
2、用doPDF生成PDF文件不只一种用法,你也可以选择其它更好、更便捷的方法,这里只提供我本此的实验软件。
3、如果熟练的使用我的方法,用不了一分钟就可以转出若干的文字,大大提高了工作效率。
4、切记:输出的文字一定要校对呀!
海外古籍数字化回归:如何做到“为天下人所用”?
南方周末
原创
2021-6-2 00:09 · 《南方周末》官方账号
陈力和何梦超讨论古籍数字化方法。 (达摩院供图/图)
流散海外八十多年后,文澜阁本《四库全书》中的《宋百家诗存》重现大众视野。
在扫描影像中,这本中国古籍上的水浸、虫噬、霉变历历可见,每一处都是历史的风霜。1790年左右,《宋百家诗存》随《四库全书》入藏杭州文澜阁,清咸丰年间在太平军入杭后散失,1861年左右被嘉业堂收藏。抗战时期,部分嘉业堂藏书流落到了上海,可能被日本人收购,并于1949年辗转到了美国,如今藏于加州大学伯克利分校东亚图书馆。
东亚图书馆收藏了大量中国古籍善本,截至2021年5月18日,其中二十万页被扫描影像、读取文字,以数字化形式回归祖国。
这是海外古籍回归项目“汉典重光”的成果之一。这批数字化古籍善本中既有宋元本,也有明清至民国时期著名学者的稿本、抄本,其中一些是以前很少有人见过的珍贵藏本,比如清文澜阁本《宋百家诗存》。
古籍流散海外的原因多种多样,实体回归几乎是不可能的,比较可行的办法是数字化回归。
此前的古籍数字化平台,大多是展示扫描后的古籍,读者只能在这些平台阅读,无法就书中内容进行检索分析。此次汉典重光的数字化团队不仅将古籍扫描,还将扫描下来的识别转化成了电子文字。搜索某一字词,可以跳转到字词所在书本的具体章节段落。
这些古籍资源将向公众免费开放。阿里达摩院院长张建锋表示,汉典重光古籍数字化平台将被捐赠给权威公共机构长期运营。
“让蒙尘的古籍重焕新生”
四川大学历史文化学院教授陈力是汉典重光项目的古籍专家。陈力的父亲是教历史的,1977年,陈力作为恢复高考的第一届考生,填报的所有志愿都与历史、中文、图书馆相关,最后被省内第一志愿四川大学历史系录取,从此“一辈子都在做这个”,对古籍积累下一份深厚的感情。
在汉典重光项目之前,陈力已经参与过古籍数字化项目。他曾经在国家图书馆工作18年,其中一半的时间分管古籍,经手过哈佛大学燕京图书馆的一个古籍数字化回归项目。2009年,燕京图书馆馆长郑炯文专门从美国飞到中国商量相关事宜,目录都筛选完成了,也做完了一部分书的扫描,但项目最终因为资金、技术等没能达到预期而搁浅。
这次未竟的合作在某种程度上成为汉典重光项目的起源。在哈佛大学访问期间,高晓
这种标点叫开明制标点,一般在方正书版软件中可以自动处理。在word中通过特殊方法,也可以做到。
将需要处理的标点罗列出来,这里仅以常见的几种标点为例:
打开查找对话框
查找:[“”,。]
展开“高级”,勾选”使用通配符“,勾选”突出显示所有在该范围找到的项目“,点”查找全部“(2007版以上点”主文档“)
关闭查找对话框,这里所有被查找到的字符处于被选中状态,不可在页面区域点击鼠标,否则所选字符即被放弃。下面有两个选择:
第一是选”格式“菜单中的“更改大小写”--半角。当然,不进行前面的查找,也可以直接选择全文后执行此操作。这种方法是将除句号之外的标点处理为半角,不够美观。
第二是选“格式”菜单--“字体”,选“字符间距”标签,在“间距”中选择“紧缩,并在其磅值栏填选2。
这种方法相对美观。见以下动图。
推荐赛数OS Q非接触式扫描仪。赛数OS Q非接触式扫描仪相较于赛数前代扫描仪,在扫描质量和效率上都实现了极大的突破,它可以用短短几秒扫描一张A0幅面档案(600 ppi),同时实现极高的扫描质量,在扫描件上可以清晰地辨别出图中细节的笔触。此外,赛数OS Q非接触式扫描仪在极低到较强的光线下均能正常工作。
我们在生活、工作、学习中常常需要把书本和装订好的文件扫描出来,然后再打印或存成PDF来传阅。通常的扫描仪都比较慢,或者扫出来有黑色的边缝。有什么方法可以快速扫描呢?
准备工作
完成电脑和扫描仪的相关连接,并打开扫描仪。
书本放置
将书本放置在黑色软垫上。
软件设置
打开软件,点击开始扫描,根据需求选择色彩模式和纸张处理模式。
开始扫描
点击扫描按键,扫描时会出现激光线。在激光线消失后,翻页扫描下一页。(录屏软件不好,没有录到激光线)
后期处理
扫描完成后,关闭扫描窗口查看效果。根据自己的需要做批量调整。(比如这里做了批量裁剪)
生成PDF
将要打包的文件全选,并在软件界面选择文档输出。根据需要选择生成文件的格式。
完工
1、首先可以在电脑上安装一个pdf文件识别软件,又称ocr文字识别软件。软件被安装完成之后,双击软件图标将其打开,将软件打开至操作界面。
2、点击“从PDF读取”按钮,找到文件在电脑中的存储位置,将文件打开在软件页面上。
3、文件打开完成之后,为了识别之后的文件排版不会错乱,这里先点击“纸面解析”选项,然后文件上会按照段落出现红色的框框。
4、接着点击识别选项,稍等一会文件就会被识别出来,如果没有被识别出来的文字,会用红色标注出来,可以直接在上面进行修改。
5、最后,没有其他的问题的话,可以点击“保存为word”选项即可,然后对文件进行查看。完成效果图。
如何给书进行快速扫描
本文2023-10-03 08:36:32发表“古籍资讯”栏目。
本文链接:https://www.yizhai.net/article/92470.html