怎么才能识别pdf里面的竖版的文字

栏目:古籍资讯发布:2023-10-14浏览:3收藏

怎么才能识别pdf里面的竖版的文字,第1张

解决这个问题可以借组第三方的工具,我用的是捷速pdf文字识别软件,不仅识别效果好,操作还十分的简单。

  第一步:打开软件,软件的页面非常的简洁,直接就进入到操作主界面。

  第二步:将PDF拖拽到软件中(如果你觉得这样添加文件的方式不够正式,你可以点击左上角的“开始转换”按钮,找到PDF一次进行添加。

  第三步:选择输出路径,也就是转换好的结果保存在什么地方可以自己选择,也可以直接选择保存在原文件夹内,这样比较好找。

  第四步:开始转换,最关键的转换步骤来了,点击“开始转换”按钮进行转换,这个时候软件会自动对PDF进行识别,我们只需要等待结果即可。

最后的结果就是又快又好的将pdf中的文字识别出来。

这种标点叫开明制标点,一般在方正书版软件中可以自动处理。在word中通过特殊方法,也可以做到。

将需要处理的标点罗列出来,这里仅以常见的几种标点为例:

打开查找对话框。

查找:[“”,。]。

展开“高级”,勾选”使用通配符“,勾选”突出显示所有在该范围找到的项目“,点”查找全部“(2007版以上点”主文档“)。

关闭查找对话框,这里所有被查找到的字符处于被选中状态,不可在页面区域点击鼠标,否则所选字符即被放弃。

下面有两个选择:

第一是选”格式“菜单中的“更改大小写”--半角。当然,不进行前面的查找,也可以直接选择全文后执行此操作。这种方法是将除句号之外的标点处理为半角,不够美观。

第二是选“格式”菜单--“字体”,选“字符间距”标签,在“间距”中选择“紧缩,并在其磅值栏填选2。

古籍用竖排更方便校对。整理古籍经常用对着多种竖排的古本校对,这时候如果是横排,会带来诸多不便。不过另外一些朋友用的整理平台的操作板只支持横排,也没有太大问题。所有说到底也是习惯。

竖排文字的行文方向,从整行上来看是从右向左。在报纸排版的时候,标题、正文是从右向左竖排。

从汉字的特点和人的生理习惯来看、因为是右手写字、左手执册,一个字的笔顺自然是从上至下,自左而右的方便。

如果从右往左写,写左半部时,毛笔势必挡住右半字形,不便于安排结构,影响结字的美观。而每个汉字的末笔都是在中下或右下,写完上一字的末笔紧接着写下一字的起笔,竖式书写比横式书写更方便,更便于笔势的连贯。

扩展资料:

1955年1月1日,《光明日报》的报纸改变了排版方式,由原先的“竖排右书”改成了“横排左书”,也在这一天,报纸上刊登了一篇文章—《为本报改为横排告读者》,其中就提到了中国现代书籍报刊的排版方式需要改变,应该跟着时代进步和发展,应该跟着人们的生活习惯的改变而改变,文字横排是一种发展趋势。

其实早在四年前,陈嘉庚先生在政协一届二次会议上就提过“汉字横写”的事情,而《光明日报的》实践,率先踏出了非常重要的一步,为之后几个月里,多种报纸改版打响了头炮,到1956年后,全国响应横排左书。

参考资料:

-东亚文字排版

人民网-人民日报海外版

古书鉴别涉及的内容比较复杂,技术性强,是一门专门的学问。很多喜欢研究文学的人们都会想要去购买一本真品。那么你知道应该如何去鉴别清楚它的真伪吗以下是懂视小编为你整理的古书鉴别真伪的方法,希望能帮到你。

古书鉴别真伪的方法一、封面。古书封面为四周单线边栏,分为三行,右行为编著撰选者姓名,中行为书名,左行为刊印人或斋、堂名。

二、装订。古书装订在宋以前均为卷轴形式和折叠页装。册装书的出现是在宋代以后,册装最初是蝴蝶装,后来进到了包背装。线装书是在明代中叶以后才有的。

三、版式。古书的版式,北宋和南宋前期刻本基本上是白口,南宋后期出现黑口,元末至弘治年间通行粗黑口。明正德,嘉靖年间又出现白口书,之后一直到清代,黑白两种书口同时流行。

四、字体。古书字体主要有两种,一种宋体字,另一种是元体字。尽管时有非欧非颜,非柳非赵的所谓“馆阁体”出现,但那并非主流。

五、纸张。宋代印书多用麻纸和以竹为原料的玉扣纸。元刻本常用竹纸或皮纸,比宋版用纸稍黑。明代印书,前期多用江西棉纸,后期多用竹纸,晚期盛行毛边纸。清代大多采用开花(又称桃花纸),但在实际应用中,几乎以前所用的各种纸张,清刻本中都在运用。

六、讳字。避讳讲究自周代始,官名、人名、地名均随帝王名字的改变而改变,这对判断古籍年代极有参考价值。历代避讳常见的有改字、空字、缺笔。秦汉时大多采用改字和空字避讳,讳名不讳姓。用缺笔字代讳字发端于唐,又在宋版书上特多。金元刻本无讳字,多俗体、简体。明前、中期亦不避讳,明刻讳字始于明光宗朱常洛。清刻本避讳尤其苛严。

古书的纸质麻纸:分黄、白两种。黄麻纸色略黄,稍粗糙,有的较白麻纸略厚;白麻纸洁白光滑,背面较正面粗糙且有草棍等粘附,质地细薄,坚韧。纸纹均宽,约一指半。宋刻本多用白麻纸,元后期多用黄麻纸,时纸纹渐窄,约一指。明初仍用之。

罗纹纸:色白,质地柔软,具明显横纹,似丝织罗绸,故名。自宋以来代有制造,但宋刻本有此纸者鲜见。

棉纸:又称皮纸,分黑、白两种。白棉纸色白,质地细柔,纤维多,韧性强;黑棉纸色黄黑,韧性稍差。明前期多用。嘉靖前较细薄,隆、万后稍粗厚。清初仅见少数印本。

竹纸:色微黄,稍脆,宋元至明初问有使用,嘉靖后较为普遍。

开化纸:细腻、洁白,薄而韧性强,柔软。清内府刻本及扬州诗局刻书多用之。嘉、道后质次量少,家刻本中偶有采用。

连史纸:洁白纯净,正面光滑,背面稍粗糙,但无草棍纸屑粘附,纸料较细。乾隆后所用甚多。

宣纸;因产于安徽宣城而得名。分为多种。料半纸,薄而质地细,色洁白,绵软有弹性,可以作绘画印书,晚清、民国有些书用之。玉版纸,能吸水,晚清、民国印金石、书画册等多用此纸。棉连纸,摹拓铜器、碑刻及印书画用。

毛边纸:米**,正面光滑,背面稍粗,质脆,乾隆后用得较多。

太史连纸:稍黄,质地细洁而有韧性,乾隆后与上述毛边纸为两种最常使用的印书纸。

如何通过字体鉴定古籍年代唐刻本

现存最早的唐代刻本,除了敦煌所出乾符四年(877)与中和二年(822)两种唐历和刻于咸通九年(868)卷本《金刚经》已流散异国以外,未见其他传本留存。所以说,唐代古书都是传说级别的东西。

宋刻本

前面说到,宋时刻书印书事业繁盛,两浙、四川与福建等经济发达地区成了刻书的中心,刻书单位有监司、州学、书院、家塾、书坊等。但为何到今天宋版书寥若晨星呢因为即使排除战火、天灾的因素,一般纸的寿命也只不过千年而已。像唐代遗留下来仅存的那几本书,若不是纸张在湿度为零、几乎真空的敦煌戈壁滩的洞窟中存放,绝无保全的可能。

每一册宋版书都是艺术品,弥足珍贵,因此现代按页卖,且每页都在万元以上。其实早在明末崇祯年间,著名的刻书和藏书家毛晋,为搜求宋版书,就按页购宋版书了。他在藏书楼汲古阁门前悬挂征求启事谓:“有以宋椠本至者,门内主人计叶酬钱,每叶出二百……有以时下善本至者,别家出一千,主人出一千二百。”

宋代官刻书多在卷末镌校勘人衔名,私刻和坊刻本多在卷末镌刻书题记或牌记。由工于刻书前要请书法大家缮写上版,字体既美,校刻亦精,字体大都采颜、柳、欧阳笔法,其风格北宋质朴,南宋挺秀。所谓“纸坚刻软,字画如写”(明高濂《遵生八笺》)则是宋刻本的共同特色。

元刻本

元代初期刻书承南宋遗风,字体也接近,常把元刻本误为宋刻本,后流行赵体字。元浙本多由士大夫经手,流风所及,自然流行赵体,渐有颜体字,字瘦一些、圆劲一些,不像南宋建本字那样横细竖粗。元代俗文化发达,故刻本中多简体字和俗字,许多简体字跟现代一致。

官刻、家刻中较少,经史文集中较少,坊刻和话本类书中较多。元本墨色稍淡,刀法也显软弱无力。早期用纸,白麻纸、黄麻纸兼而有之,中期以后,则多用黄麻纸。元朝皇帝为蒙古族。人名汉字都是音译、无法避讳也不用避讳。元人礼制观念淡薄,查禁的也不严,元刻本中几乎没有讳字。

明刻本

明代刻书情况,大致可分三个时期:明初至正德一百余年间,刻书风格继承元代余韵,无论官刻私雕,概括起来讲,那就是“黑口、赵字、继元”。

嘉靖(1522—1566)至万历(1573—1620)时期,近百年间,由于前后七子文学复古运动的影响,反映在刻书风格上,一洗前期旧式版式、行款、字体,全面仿宋。这一时期所刻的书,除了司礼监刻一遵旧式少有变化外,其余无论官雕私刻,完全变为另外一种风格,即“白口、方字、仿宋”。颇有宋版遗风。

嘉靖六家文选字体

万历后期至崇祯(1628-1644)时期,刻书风气又一变,字形由方变长,字画横轻竖重,更显死板,讳字也较以前为严。

清刻本

清代刻本繁多,综而观之,大致有如下特点:清代刻本以康熙为界,其字体变化分作两个时期,康熙以前是明万历后的风格,字体长方,横细竖粗。

猜你感兴趣:

1珠宝鉴定真伪的方法与技巧

2星月菩提辨别真伪的方法与技巧

3古瓷鉴别真伪的方法与技巧有哪些

4哥窑鉴别真伪的技巧与秘诀

5鉴别红糖真伪的技巧与秘诀有哪些

怎么才能识别pdf里面的竖版的文字

解决这个问题可以借组第三方的工具,我用的是捷速pdf文字识别软件,不仅识别效果好,操作还十分的简单。  第一步:打开软件,软件的页面...
点击下载
热门文章
    确认删除?
    回到顶部