国外古书能否全部扫描成电子版
海外古籍数字化回归:如何做到“为天下人所用”?
南方周末
原创
2021-6-2 00:09 · 《南方周末》官方账号
陈力和何梦超讨论古籍数字化方法。 (达摩院供图/图)
流散海外八十多年后,文澜阁本《四库全书》中的《宋百家诗存》重现大众视野。
在扫描影像中,这本中国古籍上的水浸、虫噬、霉变历历可见,每一处都是历史的风霜。1790年左右,《宋百家诗存》随《四库全书》入藏杭州文澜阁,清咸丰年间在太平军入杭后散失,1861年左右被嘉业堂收藏。抗战时期,部分嘉业堂藏书流落到了上海,可能被日本人收购,并于1949年辗转到了美国,如今藏于加州大学伯克利分校东亚图书馆。
东亚图书馆收藏了大量中国古籍善本,截至2021年5月18日,其中二十万页被扫描影像、读取文字,以数字化形式回归祖国。
这是海外古籍回归项目“汉典重光”的成果之一。这批数字化古籍善本中既有宋元本,也有明清至民国时期著名学者的稿本、抄本,其中一些是以前很少有人见过的珍贵藏本,比如清文澜阁本《宋百家诗存》。
古籍流散海外的原因多种多样,实体回归几乎是不可能的,比较可行的办法是数字化回归。
此前的古籍数字化平台,大多是展示扫描后的古籍,读者只能在这些平台阅读,无法就书中内容进行检索分析。此次汉典重光的数字化团队不仅将古籍扫描,还将扫描下来的识别转化成了电子文字。搜索某一字词,可以跳转到字词所在书本的具体章节段落。
这些古籍资源将向公众免费开放。阿里达摩院院长张建锋表示,汉典重光古籍数字化平台将被捐赠给权威公共机构长期运营。
“让蒙尘的古籍重焕新生”
四川大学历史文化学院教授陈力是汉典重光项目的古籍专家。陈力的父亲是教历史的,1977年,陈力作为恢复高考的第一届考生,填报的所有志愿都与历史、中文、图书馆相关,最后被省内第一志愿四川大学历史系录取,从此“一辈子都在做这个”,对古籍积累下一份深厚的感情。
在汉典重光项目之前,陈力已经参与过古籍数字化项目。他曾经在国家图书馆工作18年,其中一半的时间分管古籍,经手过哈佛大学燕京图书馆的一个古籍数字化回归项目。2009年,燕京图书馆馆长郑炯文专门从美国飞到中国商量相关事宜,目录都筛选完成了,也做完了一部分书的扫描,但项目最终因为资金、技术等没能达到预期而搁浅。
这次未竟的合作在某种程度上成为汉典重光项目的起源。在哈佛大学访问期间,高晓
1 怎样利用扫描仪,把书本上的文字转换成WORD文件
方法一、最简单的方法是选择一键OK的机器,直接选择带有这个快捷按键功能的机器,按一下即可转换到Word或者是Excel格式。
还有一种方法是选择汉王的软件有个文本王的版本,直接扫描进去后,选择插入WORD的图标,即可转换,明基的扫描仪最低端的机器都有配的。方法二、首先将扫描仪安装好,接下来启动“Microsoft Office/ Microsoft Office 工具/Microsoft Office Document Scanning”即可开始扫描。
提示:Office 2003默认安装中并没有这个组件,如果你第一次使用这个功能可能会要求你插入Office2003的光盘进行安装。 由于是文字扫描通常我们选择“黑白模式”,点击扫描,开始调用扫描仪自带的驱动进行扫描。
这里也要设置为“黑白模式”,建议分辨率为300dpi。扫描完毕后回将自动调入Office 2003种另外一个组件“Microsoft Office Document Imaging”中。
点击工具栏中的“使用OCR识别文字”按键,就开始对刚才扫描的文件进行识别了。按下“将文本发送到Word”按键即可将识别出来的文字转换到Word中去了。
如果你要获取部分文字,只需要用鼠标框选所需文字,然后点击鼠标右键选择“将文本发送到Word”就将选中区域的文字发送到Word中就行了。建议安装Office的时候选择将其附加程序完全安装 然后在XP系统下。
扫描仪连接后,双击扫描仪,会出来一个 Microsoft Office Documents Scanning 的提示 选用它来扫描。待扫描完成后上方有个带word图标的按钮按一下。
就会发现你扫描的文字已经存在于word中了只不过他存出来是web格式的doc文档。再做简单的转化就行了这个微软的OCR识别效果相当好,而且对于像书一样的一次可以扫描左右两页并且它可以自动将这两页按页码顺序排布下来。
以上是在windows XP + Office 2003下运行通过 方法三、用扫描仪扫描,并用OCR软件进行识别,输出成文本,粘贴到WORD就行了。OCR软件推荐尚书OCR、汉王OCR。
用扫描议扫为Adobe Acrobat Reader 简体中文版的文件,再用快照,粘出来就行了,文字还是文字,还是,也可以直接转换用扫描仪扫描,并用OCR软件进行识别,输出成文本,粘贴到WORD就行了。举个例子:以中晶扫描仪的识别软件-尚书OCR为例,将书本放到扫描仪的平板时,最好将书本夹角有文字处尽量贴向平板!以保证文字扫描时不会扭曲,可保证识别时的正确率!将文字区域扫描到尚书OCR软件以后,先确认左上角“文件”菜单下的系统配置是识别简体中文或者纯英文(注:繁体识别率会有所下降!)。
然后做下倾斜校正(在“编辑”菜单下),如果文字区域明显倾斜,有可能识别出来是乱码或错误信息! 校正完成后,版面分析,工具栏上有图标,然后识别!最后点“输出”菜单输出到指定格式,选择“RTF”格式,这个保存出来就是Word文档了!方法四、安装OCR软件,在使用OCR软件识别前,可用用处理软件(例如:photoshop)处理一下,转换成黑白模式,并适当加大对比度,可以大大提高识别率。 文字提取(OCR)图解教程 或Microsoft Office Document Imaging(office2003中内含) OFFICE中有一个组件document image,功能一样的强大。
不仅扫描的文字,连数码相机拍的墙上的宣传告示上的字都能提取出来。第一步 打开带有文字的或电子书籍等,找到你希望提取的页面,按下键盘上的"ALT+打印屏幕键(PrintScreen)"进行屏幕取图,或者用其他抓图软件。
保存成tif格式。第二步 我们需要安装“Microsoft Office Document Imaging”的组件,点“开始→程序→Microsoft Office→Microsoft Office 工具 ”,在 “Microsoft Office 工具” 里点“ Microsoft Office Document Imaging” 然后打开,找到OCR识别工具(像眼睛),点击此工具,开始安装,这个时候就需要你把光盘(或虚拟光驱)的office安装文件。
第三步 用 Microsoft Office Document Imaging打开,用OCR工具(图中红色筐圈部分)选取你要提取的文字,然后点右键,选择-复制到word或者记事本。 或用摄像头作扫描仪输入文字:我们平时使用的摄像头大家好象只用作聊天了吧 其实它的作用也是很广泛的好多的朋友在写论文,资料的时候总是要用一些书上的资料总是到打印社进行扫描打印,其实我们的摄像头就可以解决这个问题一,安装Microsoft office 2003 (仅以office 2003为例。
其它版本office均可) 二,打开“开始→Microsoft office→Microsoft office工具→Microsoft office Document scannging”,如果该项未安装,系统则会自动安装。此时会弹出扫描新文件对话框,单击[扫描仪]按钮,在弹出的对话框中选中摄像头,并选中“在扫描前显示扫描仪驱动”复选框,再选中“黑白模式”,并选中“换页提示”和“扫描后查看文件”两项。
三,再单击[扫描]按钮即可进行扫描,在扫描过程中会弹出一个对话框,选中[格式]按钮,在“输出大小”中选择600480分辨率,然后将文稿放平,反复调节摄像头的焦距和位置,使画面达到最佳效果,点击[捕获]按钮即可得到画面,该会显示在“。
1 什么软件可以听古诗和文言文
听古诗和文言文可以用蜻蜓fm这个软件。
蜻蜓fm是一款广播收听应用,全面收录中国大陆、港澳台地区、海外地区的广播电台。蜻蜓fm已与数百个电台、DJ合作,拥有十三个分类、六大功能、三大特色,为广大广播迷朋友打造跨地域收听广播的完美体验。
特色功能:
1详细的节目单和电台信息,让您实时了解节目内容并制订收听计划。
2与主播亲密接触,近距离互动,跟随DJ一起high。
3关注电台、节目的每日话题,更好的参与讨论,优秀评论会被主播选上节目。
2 学习语文包括古诗、文言文的软件有哪些1、:致力于为全国中小学生提供全学段的学习辅导服务,截至目前,用户量突破3亿,是中小学在线教育领军品牌。
2、古文学习app软件官网:是一款线上学习软件,为中小学生等提供丰富的古文学习资源,论语、三字经、史记等超多耳熟能详的古代文学作品。
3、文言文大全下载(文言文阅读理解软件):是一款文言文学习软件,通过文言文大全app你可以更好的学习文言文,对于非有需要的朋友来说非常的不错。 软件功能齐全,可找到各种你想要找的古诗词。
4、经典文言文app:经典文言文app是一款为学生打造的文言文学习应用,用户下载经典文言文app可以在线学习文言文,还有注释详解,收录了古文观止上的经典文言。
5、文言文 184app:覆盖了小学,初中,高中的教材内容,简单明了的注解译文,典雅的视觉风格,方便你按阶段进行学习理解和背诵。其次,文言文收录了古文观止这部经典之作。
这个要考积累的,不管什么软件,持之以恒就一定会有效果,可以都下载一下,看看自己喜欢那种模式,这样才能事半功倍。
3 朗读古诗词的软件有哪些朗读古诗词的软件有:一、古诗词典这是一款拯救文艺退化症的古诗词应用,帮你秒懂古诗词;在学习诗词时可阅读数十万首诗词,涵盖各类诗词场景,帮助你全方位掌握诗词的注解和译文。
二、喜马拉雅听书喜马拉雅听书是一款听书软件,软件大小为1374MB,适用于android22以上手机,喜马拉雅听书内容全、极方便、不耗流量不花钱、没有信号也能听。三、懒人听书懒人听书是由深圳市懒人在线科技有限公司开发运营的一款移动有声阅读应用,提供免费听书、听电台、听新闻等有声数字收听服务,用户规模上亿,是国内受欢迎的有声阅读应用。
四、爬梯朗读爬梯朗读 (Pati)是神州佳教(北京)信息服务股份有限公司推出的一款少儿朗读学习产品。通过朗读录音并打分的形式,给朗读带入快乐元素,帮小朋友们提高朗读兴趣,五、掌阅掌阅成立于2008年9月,专注于数字阅读,是移动阅读分发平台。
一直秉承专注、务实的企业精神,与国内国际600家优质的版权方合作,引进高质量的海量图书数字版权,为全球150多个国家和地区的数亿用户提供高品质的图书内容和智能化的用户体验。
参考资料:
诗的故事 这里有一个宋之问巧遇骆宾王的故事。
初唐诗人骆宾王曾参与起兵反对武则天,但归于失败,他只得隐姓埋名,出家当和尚。 这天,杭州灵隐寺来了一个年轻的游客,此人正是宋之问。
晚间,宋之问于寺间长廊漫步,见皓月当空,野山魃魃,便诗兴大发,吟出“鹫岭郁昭哓,龙宫隐寂寥”两句诗来,自觉有些意味,可是下面两句却一时接不上来。长廊尽头,宋之问忽见一老僧打坐。
他便上前招呼。老僧抬眼寒喧几句,道:“老衲倒有两句——”于是,他缓缓吟来:“楼观沧海日,门听浙江潮。”
宋之问听了,深感佩服。 宋之问回房细细品味,觉得老和尚的两句妙不可言,第二天一早就兴冲冲地跑去拜见老和尚,可不见人影。
正在徘徊怅然之际,一个小和尚经过,宋之问赶忙上去询问,和尚道:“噢,他就是骆宾王啊。” 诗歌概念起源 诗歌是一种主情的文学体裁,它以抒情的方式,高度凝练,集中地反映社会生活,用丰富的想象、富有节奏感、韵律美的语言和分行排列的形式来抒发思想情感。
诗歌是有节奏、有韵律并富有感 彩的一种语言艺术形式,也是世界上最古老、最基本的文学形式。诗歌起源于上古的社会生活,因劳动生产、两性相恋、原始宗教等而产生的一种有韵律、富有感 彩的语言形式。
《尚书虞书》:“诗言志,歌咏言,声依永,律和声。”《礼记乐记》:“诗,言其志也;歌,咏其声也;舞,动其容也;三者本于心,然后乐器从之。”
早期,诗、歌与乐、舞是合为一体的。诗即歌词,在实际表演中总是配合音乐、舞蹈而歌唱,后来诗、歌、乐、舞各自发展,独立成体,诗与歌统称诗歌。
诗体概说 诗体的分类,是一个复杂的问题。现在,只就一般的看法,简单地谈谈汉魏六朝和唐宋的诗体。
汉魏六朝诗,一般称为古诗,其中包括汉魏乐府古辞、南北朝乐府民歌,以及这个时期的文人诗。乐府本是官署的名称。
乐府歌辞是由乐府机关采集,并为它配上乐谱,以便歌唱的。《文心雕龙·乐府》篇说:"凡乐辞曰诗,诗声曰歌。
"由此可以看出诗、歌、乐府这三个概念之间的关系:诗指的是诗人所作的歌辞,歌指的是和诗相配合的乐曲,乐府则兼指二者而言。后来袭用乐府旧题或摹仿乐府体裁写的作品,虽然没有配乐,也称为乐府。
中唐时白居易等掀起一个新乐府运动,创新题,写时事,因而叫作新乐府。 唐以后的诗体,从格律上看,大致可分为近体诗和古体诗两类。
近体诗又叫今体诗,它有一定的格律。古体诗一般又叫古风,这是依照古诗的作法写的,形式比较自由,不受格律的束缚。
从诗句的字数看,有所谓四言诗、五言诗和七言诗。四言是四个字一句,五言是五个字一句,七言是七个字一句。
唐代以后,四言诗很少见了,所以通常只分五言、七言两类。五言古体诗简称五古;七言古体诗简称七古;三五七言兼用者,一般也算七古。
五言律诗简称五律,限定八句四十字;七言律诗简称七律,限定八句五十六字。超过八句的叫长律,又叫排律。
长律一般都是五言诗。只有四句的叫绝句;五绝共二十个字,七绝共二十八个字。
绝句可分为律绝和古绝两种。律绝要受平仄格律的限制,古绝不受平仄格律的限制。
古绝一般只限于五绝。 “现代诗”名称,开始使用于1953年—纪弦创立“现代诗社”时确立。
现代诗的含义: 1形式是自由的 2内涵是开放的 3意象经营重于修辞。 “古典诗”与“现代诗”的比较:“诗”者皆为感于物而作,是心灵的映现。
“古典诗”以“思无邪”的诗观,表达温柔敦厚、哀而不怨,强调在“可解与不可解之间”。“现代诗”强调自由开放的精神,以直率的情境陈述,进行“可感与不可感之间”的沟通。
诗歌主要有以下几部分: (一)诗歌的起源 诗是最古老也是最具有文学特质的文学样式。来源于古代人们的劳动号子和民歌,原是诗与歌的总称。
开始诗和歌不分,诗和音乐、舞蹈结合在一起,统称为诗歌。中国诗歌有悠久的历史和丰富的遗产,如,《诗经》《楚辞》和《汉乐府》以及无数诗人的作品。
西欧的诗歌,由古希腊的荷马、萨福和古罗马的维尔吉、贺拉斯等诗人开启创作之源。 (二)诗歌的特点 诗歌是高度集中地概括反映社会生活的一种文学体裁,它饱含着作者的思想感情与丰富的想象,语言凝练而形象性强,具有鲜明的节奏,和谐的音韵,富于音乐美,语句一般分行排列,注重结构形式的美。
我国现代诗人、文学评论家何其芳曾说:“诗是一种最集中地反映社会生活的文学样式,它饱含着丰富的想象和感情,常常以直接抒情的方式来表现,而且在精炼与和谐的程度上,特别是在节奏的鲜明上,它的语言有别于散文的语言。”这个定义性的说明,概括了诗歌的几个基本特点:第一,高度集中、概括地反映生活;第二,抒情言志,饱含丰富的思想感情;第三,丰富的想象、联想和幻想;第四,语言具有音乐美。
(三)诗歌的表现手法 诗歌的表现手法很多,我国最早流行而至今仍常使用 的传统表现手法有“赋、比、兴”。《毛诗序》说:“故诗有六义焉:一曰风,二曰赋,三曰比,四曰兴,五曰雅,六曰颂。”
这“六义”中,“风、雅、颂”是指《诗经》的诗篇种类,“赋、比、兴”就是。
国外古书能否全部扫描成电子版
本文2023-10-21 13:53:59发表“古籍资讯”栏目。
本文链接:https://www.yizhai.net/article/155109.html