在古籍修复中,对破损缺失的文字如何进行修复?
一般有三种修复方法,分别是划栏补字、不划栏不补字和划栏不补字。这里“栏”就是古籍版式中的“边栏”,是将字围成一个版面的方形线条。无论使用哪种方法修复古籍,都要遵循“整旧如旧”的原则。
所谓“整旧如旧”,就是要在修复的基础上,最大限度地还原古籍原本的风貌。这里就需要有独特的仿古技术,同时还要选用与古籍相同或相似的材料,才能将古籍原来的特色保存下来,有助于考证版本。下面就来介绍三种对缺失文字修复的方法。
第一,“划栏补字 ”。意思是在修复古籍的时候,把边栏画上补全,也把缺的字补全,缺的字可以通过专家考证得知。这种方法是非常传统的古籍修复方法之一,但是现在已经很少用了,因为这么做很容易破坏古籍原来的风格,对专家考证其他相关信息造成不便。
第二,“不划栏不补字 ”。意思简单明了,对古籍原本的边栏和字等信息一概不管,只补纸张,选用材质相同、相似的纸张材料,对古籍缺失的边边角角给予填补,这种方法是现在业内最认同的方法。作为一名修复人员,他所擅长的不是去判断缺失的文字需要补什么,而是做一个“最小修复”,所以这么做不仅让整个书籍看起来工整许多,也保留了古籍的原汁原味,为考证工作提供了相当大的便利。
第三,“划栏不补字”。这是对前两种方法的一个整合,如果只补纸张,可能略显单薄,如果全都补上,那古籍也不能称之为古籍了。所以有人想出了这个方法,因为边栏只是一个排版样式,判断和修复边栏比修补残缺的文字要容易许多,也不会对古籍造成太大的破坏。
用office 的Document Imaging OCR文本识别功能,能从扫描文件中识别文字转换成文本或word格式文件;
从开始-程序-office-打开软件
先打开扫描的Tag图像文件格式的文件,点 工具-‘使用OCR识别文本’识别出来,然后另存为文本文件。
常用于写刻古籍正文的字体:一种是手写体,即软体;一种是匠体,即硬体。
宋人写字,多学唐代书法家欧阳询、颜真卿和柳公权等,故宋刻本的字体,多含有这些书法家字体的笔意。
宋代的浙本多用欧体,宋代建本多用颜体,而宋代的蜀本却在颜体之中糅进了柳体的笔意。元人刻书“多用赵松雪字体”,后世多称作“元体字”。赵松雪即元代著名书画家赵孟頫。
明正德之前,袭承元风,字体多用赵体。但“自正德,嘉靖以降……字体亦一变而为方体字,僵硬呆滞。万历以后,字体又一变而为横轻直重……天启、崇祯,字体又一变而为狭长的横轻直重字样。”
毫无影响 只要不动构形就毫无影响 这个顶多算作异写字 异写字的识读较繁简还容易一些。古籍排印主要是为了降低阅读难度 对此有影响的是横/纵排版和标点样式 采取什么字形毫无影响 有一定基础的必然要看刻本影印件才行啊。具体政策我找不到,但是我想纵然有,历来对古籍也是特殊处理的。新型的简体字取得了明显的效果,第一,减少了汉字的笔画数目,原来的繁体字平均笔画是16画,简化后平均笔画是103画;第二,提高了阅读的清晰度;第三,减少了通用汉字的字数;第四,简化后产生了一些新形声字表音比繁体字准确;第五,有些简体字便于分解和称说。简体字中一部分是古体字,一部分是书法家造的,一部分是群众造的,都是中国的文化遗产。长期以来,简体字、繁体正字与异体字事实上并行。简化实际上是以简体字取代繁体字的正体地位。
缺点:
1.部分简体字使用了“符号代替“,打乱了字族的严整性。如汉、权、鸡、仅、邓等字,“又”作为简化偏旁替换了本身完全不同的四个繁体字偏旁,同时既不能表音,也不能表意,属于难以理解的密码文字。
2.同音代替合并了一些汉字,例如干、乾、干(擀的右部偏旁),面、面(左麦右面),只、只(上隹下又),经常会导致表意混乱(特别是在文言文中),引起歧义。
1 怎样利用扫描仪,把书本上的文字转换成WORD文件
方法一、最简单的方法是选择一键OK的机器,直接选择带有这个快捷按键功能的机器,按一下即可转换到Word或者是Excel格式。
还有一种方法是选择汉王的软件有个文本王的版本,直接扫描进去后,选择插入WORD的图标,即可转换,明基的扫描仪最低端的机器都有配的。方法二、首先将扫描仪安装好,接下来启动“Microsoft Office/ Microsoft Office 工具/Microsoft Office Document Scanning”即可开始扫描。
提示:Office 2003默认安装中并没有这个组件,如果你第一次使用这个功能可能会要求你插入Office2003的光盘进行安装。 由于是文字扫描通常我们选择“黑白模式”,点击扫描,开始调用扫描仪自带的驱动进行扫描。
这里也要设置为“黑白模式”,建议分辨率为300dpi。扫描完毕后回将自动调入Office 2003种另外一个组件“Microsoft Office Document Imaging”中。
点击工具栏中的“使用OCR识别文字”按键,就开始对刚才扫描的文件进行识别了。按下“将文本发送到Word”按键即可将识别出来的文字转换到Word中去了。
如果你要获取部分文字,只需要用鼠标框选所需文字,然后点击鼠标右键选择“将文本发送到Word”就将选中区域的文字发送到Word中就行了。建议安装Office的时候选择将其附加程序完全安装 然后在XP系统下。
扫描仪连接后,双击扫描仪,会出来一个 Microsoft Office Documents Scanning 的提示 选用它来扫描。待扫描完成后上方有个带word图标的按钮按一下。
就会发现你扫描的文字已经存在于word中了只不过他存出来是web格式的doc文档。再做简单的转化就行了这个微软的OCR识别效果相当好,而且对于像书一样的一次可以扫描左右两页并且它可以自动将这两页按页码顺序排布下来。
以上是在windows XP + Office 2003下运行通过 方法三、用扫描仪扫描,并用OCR软件进行识别,输出成文本,粘贴到WORD就行了。OCR软件推荐尚书OCR、汉王OCR。
用扫描议扫为Adobe Acrobat Reader 简体中文版的文件,再用快照,粘出来就行了,文字还是文字,还是,也可以直接转换用扫描仪扫描,并用OCR软件进行识别,输出成文本,粘贴到WORD就行了。举个例子:以中晶扫描仪的识别软件-尚书OCR为例,将书本放到扫描仪的平板时,最好将书本夹角有文字处尽量贴向平板!以保证文字扫描时不会扭曲,可保证识别时的正确率!将文字区域扫描到尚书OCR软件以后,先确认左上角“文件”菜单下的系统配置是识别简体中文或者纯英文(注:繁体识别率会有所下降!)。
然后做下倾斜校正(在“编辑”菜单下),如果文字区域明显倾斜,有可能识别出来是乱码或错误信息! 校正完成后,版面分析,工具栏上有图标,然后识别!最后点“输出”菜单输出到指定格式,选择“RTF”格式,这个保存出来就是Word文档了!方法四、安装OCR软件,在使用OCR软件识别前,可用用处理软件(例如:photoshop)处理一下,转换成黑白模式,并适当加大对比度,可以大大提高识别率。 文字提取(OCR)图解教程 或Microsoft Office Document Imaging(office2003中内含) OFFICE中有一个组件document image,功能一样的强大。
不仅扫描的文字,连数码相机拍的墙上的宣传告示上的字都能提取出来。第一步 打开带有文字的或电子书籍等,找到你希望提取的页面,按下键盘上的"ALT+打印屏幕键(PrintScreen)"进行屏幕取图,或者用其他抓图软件。
保存成tif格式。第二步 我们需要安装“Microsoft Office Document Imaging”的组件,点“开始→程序→Microsoft Office→Microsoft Office 工具 ”,在 “Microsoft Office 工具” 里点“ Microsoft Office Document Imaging” 然后打开,找到OCR识别工具(像眼睛),点击此工具,开始安装,这个时候就需要你把光盘(或虚拟光驱)的office安装文件。
第三步 用 Microsoft Office Document Imaging打开,用OCR工具(图中红色筐圈部分)选取你要提取的文字,然后点右键,选择-复制到word或者记事本。 或用摄像头作扫描仪输入文字:我们平时使用的摄像头大家好象只用作聊天了吧 其实它的作用也是很广泛的好多的朋友在写论文,资料的时候总是要用一些书上的资料总是到打印社进行扫描打印,其实我们的摄像头就可以解决这个问题一,安装Microsoft office 2003 (仅以office 2003为例。
其它版本office均可) 二,打开“开始→Microsoft office→Microsoft office工具→Microsoft office Document scannging”,如果该项未安装,系统则会自动安装。此时会弹出扫描新文件对话框,单击[扫描仪]按钮,在弹出的对话框中选中摄像头,并选中“在扫描前显示扫描仪驱动”复选框,再选中“黑白模式”,并选中“换页提示”和“扫描后查看文件”两项。
三,再单击[扫描]按钮即可进行扫描,在扫描过程中会弹出一个对话框,选中[格式]按钮,在“输出大小”中选择600480分辨率,然后将文稿放平,反复调节摄像头的焦距和位置,使画面达到最佳效果,点击[捕获]按钮即可得到画面,该会显示在“。
因为古代并没有打印机,所以并没有办法大批量的生产书籍。虽然当时已经有了印刷术,但是想要印上一本书也是比较困难的,而且成本也很高,所以很多古籍都是手写的。想要抄录一本书要耗费大量的时间,而且很多书籍都是谁需要谁就去抄的,所以大部分人在抄录的时候就只会抄录一本,这样这些书就算是好不容易流传到了今天也都是孤本。
就算是有些古籍并不止一本,在一代代的流传下来,也会有破损和丢失,所以大部分的古迹都是孤本。很多人都非常喜欢收集古代的书籍,因为古代的书籍不仅非常的有文献价值,而且很有历史意义。在古籍当中有孤本和善本,还有真本的分类。在这些分类当中,孤本肯定是最有价值的,因为这些孤本在世界上就只有这一本,所以是独一无二的。
这些孤本之所以珍贵,是因为仅此一本,所以很多人都非常好奇,既然这些书非常的珍贵,为什么古人在抄录的时候不能再多抄录几本呢?古代的科学技术没有现在那么先进,现在大家在印书的时候都是直接用打印机印的,所以想印几本就印几本。但是古代的时候大家想要复制一本书籍,就只能用手抄。虽然可能在古代的时候已经有了印刷术,但是那个时候印刷术还非常的不普遍,而且耗费的时间和精力也非常的多。
所以想要抄完一本书是要耗费很多的时间的,而且像非常有价值意义的书是经过了很多人共同编写才完成的,所以根本就没有时间和精力再去抄录第二本。像是明成祖时期的《永乐大典》,就是收集了很多的古书,两千多个人一起参与编撰的。而且这本书写了很长的时间才完成的,所以想要再抄录一本是非常困难的事情。嘉靖在闲着的时候就把《永乐大典》给抄写了一遍,就单单是抄这一本书,就花了他五年的时间。
古籍书的字没有可以进行修复
书籍的修复基於其特性,在修复过程中,处理准则和一般印刷文件有若干共同点,因为它们的主体都是纸张。不过如果书籍本身是一件艺术品,例如是一部经典文学作品、是一件稀奇罕见之珍品、印刷品质精美特殊、具历史意义价值之文件,美妙的插画艺术、或是装订之特殊技巧等等因素,因而使得书籍变得分外珍贵。书籍修复和一般纸张修复最大的不同点,在於书籍的功能是要被使用,使用如有损坏,让它再恢复成为一本书的样子。书籍不是一件素描作品或是一幅画,可以远远的欣赏。书籍是要在手中触摸,让读者享受翻阅展读的乐趣。修复师面对书籍修复的工作时,虽然也是属於纸张修复,但仍需区分清楚其伤害之异质处。
在古籍修复中,对破损缺失的文字如何进行修复?
本文2023-10-25 02:58:49发表“古籍资讯”栏目。
本文链接:https://www.yizhai.net/article/166851.html