求扫描版古籍转文本的工具

栏目:古籍资讯发布:2023-08-04浏览:1收藏

求扫描版古籍转文本的工具,第1张

用office 的Document Imaging OCR文本识别功能,能从扫描文件中识别文字转换成文本或word格式文件;

从开始-程序-office-打开软件

先打开扫描的Tag图像文件格式的文件,点 工具-‘使用OCR识别文本’识别出来,然后另存为文本文件。

1事物是变化发展的发展的实质,是新事物的产生和旧事物的灭亡。古籍保护的手段也应该不断的发展,所以说古籍数字化是一种必然。

2物质决定意识要求我们一切从实际出发,实事求是。五级在保护当中面临着褪色,破败等一系列的问题。以要从实际出发把古籍数字化。

3矛盾具有特殊性,要具体问题具体分析。结合当前古籍保护当中的一些实际问题进行古籍数据化。

这个问题其实问的太大了,因为哲学它包括很多方面的知识,其实这个问题从哪一个角度都可以来进行回答。我随便挑了三个角度吧,希望能帮到你。望采纳一下。

最近十几年,中国的古籍数字化步骤在加快。《四库全书》、《四部丛刊》、《汉籍电子文献》(台湾中央研究院)及建设中的《中国基本古籍库》、《四库全书存目丛书》等大型丛书的电子化,则使古籍的使用完全上升到了现代化水平。在电子版背景下,省略了复印与打字程序,使古籍资料的搜集与使用实现了“零接口”。几秒种的复制与粘贴,就可以使古籍资料变成自己想要的文本格式资料。明代史著的由由分散到集中,由“线装版”到“影印版”再到“电子版”,使读者足不出户,就可以自由纵情阅读、随意复制,极大地便利了史学的研究工作,推动了史学研究的向前发展。

8月1日,哈佛燕京图书馆正式宣布,馆藏的4200部/53000卷中文善本特藏数字化工程已全部完成,更让人欣喜的是,网友可以免费在线浏览、下载。整个数字化项目耗时十年,合作机构包括中国国家图书馆、广西师范大学出版社、中国社会科学院中国地方志指导小组,以及浙江大学CADAL(大学数字图书馆国际合作计划)图书馆等机构。

根据哈佛燕京图书馆馆长郑炯文2014年接受采访时提供的数据,目前,哈佛燕京图书馆的藏书将近150万册,其中中文文献逾80万册,日文文献将近35万册,朝鲜文文献将近20万册。“在中国本土之外,哈佛燕京图书馆是西方世界里两个最大、最好的中国古籍善本收藏图书馆之一(另一个是位于华盛顿特区的美国国会图书馆)。”

高兆煌 光州志 :68卷, 附志馀 : 12卷 [China], 乾隆35

为什么哈佛燕京图书馆馆藏如此丰富?这要从这个图书馆的源头讲起。哈佛燕京图书馆1928年开馆,是哈佛燕京学社下面的一个私人图书馆,当时叫“汉和图书馆”,主要收藏中国和日本的文献。1976年,哈佛燕京图书馆变成哈佛文理学院图书馆系统的一个分馆,改名为“哈佛燕京图书馆”。

裘开明是哈佛燕京图书馆第一任院长,也是美国第一个华裔图书馆馆长,在他的带领下,图书馆的善本珍藏数量增长很快,到1936年,藏书已增长至7万多册。日本侵华时期,许多古籍流散于上海等地,图书馆便购入大批书籍;二战以后,日本流出大量私藏古书,裘开明又多次赴日访书。

中华民国海关进口出口税税则 :自中华民国二十七年六月施行

此外,哈佛燕京图书馆的发展也和二战后美国汉学、东亚研究的兴起密不可分。根据郑炯文的介绍,“二战以后,美国成为西方国家的领袖,因为要理解几个国家的国情,才发展出大量的东亚图书馆”,而哈佛燕京图书馆是这类图书馆中的佼佼者。

在哈佛燕京图书馆的官网上可以看到,数字化工程下共列包括中国旧海关资料、哈佛燕京图书馆中文善本特藏稿、基督教传教士文献、中国珍稀方志、拓片收藏、莫里士中国老照片、明清妇女著作、韩南教授藏书在内的25个大类文献。

现在,通过这个链接(http://guideslibraryharvardedu/Chineseutm_source=Library+Staff&utm_campaign=9fca5a7bb3-EMAIL_CAMPAIGN_2017_06_28&utm_medium=email&utm_term=0_4bb25c0228-9fca5a7bb3-26352423#s-lg-box-6321879)就可以直接去浏览、下载这些珍贵善本的电子版。

中国为世界做出贡献了。

1 缺乏整体规划,重复建设严重

2 文献购置和设备购置成为制约古籍数字化的两大难题

3 古籍整理技术成果未得到充分利用

4 检索技术急待完善

5 数字化文件格式数量多,不统一

6 人才的知识不全面性难以适应古籍数字化

代表将20万部中国古籍数字化的目的也是希望能够扩大这些古籍的影响力,在这个快节奏、数字化的时代,代表的想法也是在用另一种方式尽最大可能保证古籍的继续流传。

古籍中蕴含着很多古时候人们生活智慧的结晶,有的是偏向于人物记述,也有的是偏向于生活技巧等等,种类繁多,但是不可否认的是这些古籍中有很多值得我们学习推敲的地方,也正是因为如此,所以很多这方面的研究专家、学者想要把古籍发扬光大,希望能够有越来越多的人关注古籍、阅读古籍,但是因为智能手机等科技产品的问世,使得大家更加专注于电子书等的阅读,对于古籍来说就是一个很不好的事情。

也正因为抓住了大家更倾向于阅读电子书的契机,所以代表才会提议将中国古籍进行数字化,一方面这样的做法是在带动着古籍和社会整体趋势靠拢,也是在不断朝着新时代的契机一起进步,虽然是古籍,但是相信随着古籍不断数字化,这些古籍将会成为人类社会文明进步的一大阶梯;另一方面数字化后的古籍,同电子书一样,阅读起来更加方便快捷,甚至于在数字化的过程中,可以将古籍中晦涩难懂的部分直接链接白话文的解释,这样一来,阅读古籍不但不用考虑时间和空间的限制,甚至于连一般都会担心的看不懂问题也有了很好的解决办法,如此可以吸引更多的人阅读古籍,可以说这也是很好的社会现象。

在我看来这个提议是很符合现在社会现象的,同时也能解决社会问题,最重要的是为古籍阅读、流传问题提供了一种不可多得的解决方式,可谓是百利而无一害,当然也很是希望这项提议能够通过。

中国西北民族大学海外民族文献研究所24日披露,该所自2006年起整理出版流失在海外的敦煌古藏文文献,目前完成英藏9册、法藏22册(每册336页左右),并正在推动古藏文文献的数字化建设,有望完成具备智能检索功能的数据库。

这些文献由西北民族大学、上海古籍出版社、英国大英图书馆、法国国家图书馆合作编纂出版,流失海外的敦煌藏经洞藏文文献首次以出版形式回归故里。

20世纪初,敦煌藏经洞发现的数万件珍贵古代文献文物流落海外。在这批流失的珍贵文物中,包括1万件左右的藏文文献,以及相当数量的回鹘文、粟特文、龟兹文、于阗文、梵文、希伯来文等写本。目前藏于英国国家图书馆和法国国家图书馆的敦煌藏文文献,是流失海外最大宗、最重要的民族古文字文献,具有极其重要的史料价值。

据海外民族文献研究所副所长才让介绍,敦煌莫高窟藏经洞出土的大量文献中,古藏文文献数量仅次于汉文文献,系第二大类古文献。

才让说,与国内相比,珍藏在英、法、美、日、俄等国家的敦煌古藏文文献内容十分丰富,除了佛教文献外,还有法律、社会契约、历史、医学、伦理、民间故事、语言等方面的文献。此外,还有译自梵文、汉文的文史类著作,比如印度著名史诗《罗摩衍那》,汉语古代著作如《战国策》片段的译文,也有儒家著作的翻译。

据才让介绍,该所整理出版英藏9册、法藏22册的敦煌古藏文文献,历时13年,而这项工作还未结束,最终计划整理出版英藏15册、法藏30多册。此后,还将出版其他国家所藏古藏文文献。

“有些文献只剩残存断片,文字模糊,内容解读会有一定困难。我们在仔细阅读和理解的基础上,与传世的佛教文献进行比对,然后对文献拟名。”才让说,由于按照英法对文献编号的顺序出版,每册所涉及的内容较为繁杂,并非单一文献。下一步,将对文献分类辑录,更便于研究。

该所目前完成的敦煌古藏文文献影印本,也是英藏、法藏敦煌古藏文文献的首次完整出版。这将有利于研究公元8至11世纪吐蕃的历史文化及当时的民族文化交流史。

来源:中国新闻网

热门文章
    确认删除?
    回到顶部