怎么把古书扫描成文字

栏目:古籍资讯发布:2023-08-04浏览:9收藏

怎么把古书扫描成文字,第1张

1 怎样利用扫描仪,把书本上的文字转换成WORD文件

方法一、最简单的方法是选择一键OK的机器,直接选择带有这个快捷按键功能的机器,按一下即可转换到Word或者是Excel格式。

还有一种方法是选择汉王的软件有个文本王的版本,直接扫描进去后,选择插入WORD的图标,即可转换,明基的扫描仪最低端的机器都有配的。方法二、首先将扫描仪安装好,接下来启动“Microsoft Office/ Microsoft Office 工具/Microsoft Office Document Scanning”即可开始扫描。

提示:Office 2003默认安装中并没有这个组件,如果你第一次使用这个功能可能会要求你插入Office2003的光盘进行安装。 由于是文字扫描通常我们选择“黑白模式”,点击扫描,开始调用扫描仪自带的驱动进行扫描。

这里也要设置为“黑白模式”,建议分辨率为300dpi。扫描完毕后回将自动调入Office 2003种另外一个组件“Microsoft Office Document Imaging”中。

点击工具栏中的“使用OCR识别文字”按键,就开始对刚才扫描的文件进行识别了。按下“将文本发送到Word”按键即可将识别出来的文字转换到Word中去了。

如果你要获取部分文字,只需要用鼠标框选所需文字,然后点击鼠标右键选择“将文本发送到Word”就将选中区域的文字发送到Word中就行了。建议安装Office的时候选择将其附加程序完全安装 然后在XP系统下。

扫描仪连接后,双击扫描仪,会出来一个 Microsoft Office Documents Scanning 的提示 选用它来扫描。待扫描完成后上方有个带word图标的按钮按一下。

就会发现你扫描的文字已经存在于word中了只不过他存出来是web格式的doc文档。再做简单的转化就行了这个微软的OCR识别效果相当好,而且对于像书一样的一次可以扫描左右两页并且它可以自动将这两页按页码顺序排布下来。

以上是在windows XP + Office 2003下运行通过 方法三、用扫描仪扫描,并用OCR软件进行识别,输出成文本,粘贴到WORD就行了。OCR软件推荐尚书OCR、汉王OCR。

用扫描议扫为Adobe Acrobat Reader 简体中文版的文件,再用快照,粘出来就行了,文字还是文字,还是,也可以直接转换用扫描仪扫描,并用OCR软件进行识别,输出成文本,粘贴到WORD就行了。举个例子:以中晶扫描仪的识别软件-尚书OCR为例,将书本放到扫描仪的平板时,最好将书本夹角有文字处尽量贴向平板!以保证文字扫描时不会扭曲,可保证识别时的正确率!将文字区域扫描到尚书OCR软件以后,先确认左上角“文件”菜单下的系统配置是识别简体中文或者纯英文(注:繁体识别率会有所下降!)。

然后做下倾斜校正(在“编辑”菜单下),如果文字区域明显倾斜,有可能识别出来是乱码或错误信息! 校正完成后,版面分析,工具栏上有图标,然后识别!最后点“输出”菜单输出到指定格式,选择“RTF”格式,这个保存出来就是Word文档了!方法四、安装OCR软件,在使用OCR软件识别前,可用用处理软件(例如:photoshop)处理一下,转换成黑白模式,并适当加大对比度,可以大大提高识别率。 文字提取(OCR)图解教程 或Microsoft Office Document Imaging(office2003中内含) OFFICE中有一个组件document image,功能一样的强大。

不仅扫描的文字,连数码相机拍的墙上的宣传告示上的字都能提取出来。第一步 打开带有文字的或电子书籍等,找到你希望提取的页面,按下键盘上的"ALT+打印屏幕键(PrintScreen)"进行屏幕取图,或者用其他抓图软件。

保存成tif格式。第二步 我们需要安装“Microsoft Office Document Imaging”的组件,点“开始→程序→Microsoft Office→Microsoft Office 工具 ”,在 “Microsoft Office 工具” 里点“ Microsoft Office Document Imaging” 然后打开,找到OCR识别工具(像眼睛),点击此工具,开始安装,这个时候就需要你把光盘(或虚拟光驱)的office安装文件。

第三步 用 Microsoft Office Document Imaging打开,用OCR工具(图中红色筐圈部分)选取你要提取的文字,然后点右键,选择-复制到word或者记事本。 或用摄像头作扫描仪输入文字:我们平时使用的摄像头大家好象只用作聊天了吧 其实它的作用也是很广泛的好多的朋友在写论文,资料的时候总是要用一些书上的资料总是到打印社进行扫描打印,其实我们的摄像头就可以解决这个问题一,安装Microsoft office 2003 (仅以office 2003为例。

其它版本office均可) 二,打开“开始→Microsoft office→Microsoft office工具→Microsoft office Document scannging”,如果该项未安装,系统则会自动安装。此时会弹出扫描新文件对话框,单击[扫描仪]按钮,在弹出的对话框中选中摄像头,并选中“在扫描前显示扫描仪驱动”复选框,再选中“黑白模式”,并选中“换页提示”和“扫描后查看文件”两项。

三,再单击[扫描]按钮即可进行扫描,在扫描过程中会弹出一个对话框,选中[格式]按钮,在“输出大小”中选择600480分辨率,然后将文稿放平,反复调节摄像头的焦距和位置,使画面达到最佳效果,点击[捕获]按钮即可得到画面,该会显示在“。

用office 的Document Imaging OCR文本识别功能,能从扫描文件中识别文字转换成文本或word格式文件;

从开始-程序-office-打开软件

先打开扫描的Tag图像文件格式的文件,点 工具-‘使用OCR识别文本’识别出来,然后另存为文本文件。

第一章 总 则

第一条 为建立健全图书质量管理机制,使图书出版工作更好地为人民服务,为社会主义服务,为全党全国的工作大局服务,努力实现图书出版从扩 大规模数量为主向提高质量效益为主的转变,促进图书出版事业的繁荣和发展,依据中国《出版管理条例》和有关图书质量的政策、法规、标准,特制 定本规定。

第二条 本规定适用于经国家正式批准的图书出版单位及其出版的图书。

第二章 图书质量的分级和标准

第三条 图书质量管理的范围,包括选题、内容、编辑加工、校对、装帧设计、印刷装订……方面。为了便于管理,本规定将有连带关系的选题和内 容,合并为内容项;将编辑加工和校对,合并为编校项。

第四条 图书内容质量、装帧设计质量分为两级,即:合格、不合格;编校质量、印刷装订质量分为四级,即:优质、良好、合格、不合格。

第五条 图书内容的质量分级标准

1、在思想、文化、科学、艺术……方面,有一定的学术价值、文化积累价值或使用价值的,为合格。

2、在思想、文化、科学、艺术……方面,没有价值,有严重问题,或违反国家有关政策禁止出版的,为不合格。

第六条 图书编校的质量分级标准

1、差错率低于025/10000的,为优质。

2、差错率超过025/0000,未超过05/10000的,为良好。

3、差错率超过05/10000,未超过1/10000的,为合格。

4、差错率超过1/10000的,为不合格。

图书编校质量差错率的计算方法,见本规定附件。

第七条 图书装帧设计的质量分级标准

l、封面(包括封一、封二、封三、封底、勒口、护封、封套、书脊)、扉页、插图……,能够恰当反映图书的内容,格调健康;全书版式设计统一, 字体、字号合理的,为合格。

2、封面(包括封一、封二、封三、封底、勒口、护封、封套、书脊)、扉页、插图……,不能反映图书的内容,或格调不健康,或全书版式设计不统 一,字体、字号使用混乱的,为不合格。

第八条 图书印刷装订的质量分级标准

根据新闻出版署发布的中华人民共和国出版行业标准《书刊印刷标准CY/1-3-91,CY/T4-6-91,CY/T7.1-7.9-9],CY/T12-17-95》的规 定:

1、图书印刷装订的质量全面达到优质品标准的,为优质。

2、图书印刷装订的质量某一项或某两项存在细小疵点,其他各项均达到优质品标准的,为良好。

3、图书印刷装订的质量全面达到合格品标准的,为合格。

4、图书印刷装订的质量有严重缺陷,达不到合格品标准的,为不合格。

第九条 成品图书的质量标准分为四级,即:优质品、良好品、合格品、不合格品。

第十条 成品图书的质量标准

1、图书内容、装帧设计的质量达到合格标准,且编校、印刷装订的质量达到优质标准的,为优质品。

2、图书内容、装帧设计的质量达到合格标准,编校、印刷装订的质量达到良好标准(含其中一个项目达到优质标准)的,为良好品。

3、图书内容、装帧设计的质量达到合格标准,编校、印刷装订的质量均达到合格标准(含其中一个项目达到良好或优质标准)的,为合格品。

4、图书内容、编校、装帧设计、印刷装订四项中有一项不合格的,为不合格品。

第三章 图书质量的管理

第十一条 出版社须设立由社领导主持的图书质量管理机构,指导和督促各部门、各环节、各岗位的职工实施质量保证措施,对成品图书作出质量等 级评定,对不合格图书作出处理。

第十二条 出版社须制定图书质量管理制度,建立质量管理和质量保证体系,使保证图书质量的工作落实到出书的全过程和全体职工,在制定图书质 量管理制度时须体现保证图书质量的基本制度--选题的专项、专题报批制度;三级审稿制度;

发稿达到“齐、清、定”要求;三校一读校对责任制度;生产督印制度;样书检查和成品检查制度。

第十三条 出版社于每年1月31日前上报上一年度的图书质量检查结果和有关情况。上报的程序是:在京的中央和国家机关各部门所属出版社经主管 部门审批同意后,报新闻出版署;各省、自治区、直辖市所属出版社由各省级新闻出版管理部门审批同意后,报新闻出版署;设在地方的中央各部门的 出版社(军队出版社除外)经主管部门审批同意,并征得所在地省级新闻出版管理部门审批同意后,统一由省级新闻出版管理部门报新闻出版署;军队系 统出版社由解放军总政宣传部审批后,报新闻出版署。

第十四条 地方省级新闻出版局和出版社的主管单位须设立专门机构或有专人负责指导所属或所辖出版社的图书质量管理工作:审核选题计划;审核 批准重要稿件的出版;组织图书质量检查小组(或聘请图书质量审读员)对图书进行抽查;对不合格图书提出处理意见;对所属或所辖出版社出版的图书 在内容……方面发生的严重错误和其他重大问题,承担领导责任。

第十五条 新闻出版署根据全国图书质量的实际情况及读者的反映,每年选取部分出版社的图书,组织审读员进行质量抽查。

第十六条 地方省级新闻出版局或新闻出版署对图书质量进行检查后,须将检查结果和审读记录以书面形式通知出版社。出版社如有不同意见,可在 接到通知后的30日内提出申辩意见上报,请求复议。如有异议,报新闻出版署裁定。

第十七条 地方省级新闻出版局或新闻出版署对所检查图书质量的最终结果及处理决定,发出通报。

第四章 奖励与处罚

第十八条 对一贯注重图书质量工作的出版单位和个人,以及采取有力措施,在短期内提高了图书质量的出版单位和个人,新闻出版署、地方新闻出 版局可以结合图书质量检查工作给予表扬和奖励。

第十九条 对于年新版图书品种有10%以上图书质量不合格的出版社,新闻出版署、地方省级新闻出版局可以视情节轻重,给予通报批评或处罚。根 据《中华人民共和国行政处罚法》,处罚包括:警告、罚款、停业整顿。对中央级出版社的处罚决定,由新闻出版署作出;对地方出版社的处罚决定, 由地方省级新闻出版局或新闻出版署作出,罚款上缴当地财政。

第二十条 经检查为质量不合格的图书,须采取技术处理或改正重印,方可继续在市场上销售。如发现已定为不合格的图书在该图书定为不合格品的 通报或处罚决定发布三个月后仍在市场上销售,由地方省级新闻出版局或新闻出版署对出版社进行经济处罚,除没收该书所得外,还要根据情节轻重处 以罚款,上缴当地财政。

第二十一条 连续两年造成图书不合格的责任者,其年终考核应定为不称职;不称职的人员,不能按正常晋升年限晋升其专业技术职务和工资;连续 三年检查为不合格品图书的责任者,不能继续从事该岗位的工作。

第五章 附 则

第二十二条 本规定由新闻出版署负责解释。

第二十三条 本规定自发文之日起生效。1992年发布的《图书质量管理规定(试行)》停止执行。

附:图书编校质量差错率的计算方法

一、图书差错率,是指以审读一本图书的总字数,去除审读

该书之后发现的总差错数,计算出来的“万分比”。如审读一本图书的总字数为10万,审读后发现两个差错,则该书的差错率为2/100000,即为 0.2/10000。

二、图书总字数的计算方法,一律以该书的版面字数为准,即:总字数:每面行数X每行字数X总面数。

1、除环衬……空白面不计字数外,凡连续编排页码的正文、目录、辅文……,不论是否排字,均按一面满版计算字数,分栏排版的图书,各栏之间 的空白也计算版面字数。

2、书眉(或中缝)、单排的页码、边码也按正文行数,一并计算字数。

3、目录、索引、附录……字号有变化时,分别按版面计算字数。

4、用小号字排版的脚注文字超过5行不足10行,按该面正文字数加15%计算;超过半面,则该面按注文的满面计算字数。用小号字排版的夹注文 字,随正文版面计算字数。

5、封面(包括封一、封二、封三、封底、勒口、护封、封套、书脊)、扉页,除空白面不计以外,每面按正文版面字数的50%计算;版权页、勒口 (有文字的)按正文的一个版面计算字数。

6、凡旁边串排正文的插图、表格,按正文的版面字数计算;插图占一面的,按正文版面字数的50%计算;表格占一面的,按正文版面计算字数。

7、凡有文字说明的画册、摄影集、乐谱,一律按正文的版面字数全额计算;无文字说明的,按正文版面的30%计算字数。

8、外文版图书、少数民族文字版图书的版面字数,以同样的中文版面字数加30%计算。

三、图书差错的计算方法

1、文字差错的计算标准

⑴凡正文、目录、出版说明、前言(或序)、后记(或跋)、注释、索引、图表、附录、参考文献中的一般性错字、多字、漏字、倒字,每处计1个差 错。前后颠倒字,以用一个校对符号可以改正的,每处计1个差错;书眉(或中缝)中的差错,无论有几个,1条计1个差错;行文中的数字错,每码计1个 差错;页码(包括边码)错,每处计1个差错。

一面内文字连续错、多、漏,5个字以下计2个差错,5个字(不含)以上计5个差错。

⑶封面(包括书脊)、封底、勒口、扉页、版权页上的文字错,每处计2个差错。

⑷知识性、逻辑性、语法性差错,每处计2个差错。

⑸一般性的科学技术性、政治性差错,每处计3个差错。

⑹外文、少数民族拼音文字、国际音标、汉语拼音以一个单词或词组为单位,无论一个单词或词组中几个字母有错,均计1个差错。

⑺外文缩写词应大写(如DNA)却小写(如dna)的,不同文种的单词、缩写语混用(如把英文缩写N错为俄文缩写H)的,每处计1个差错。

⑻外文中的人名、地名、国家和单位名称……专用名词,词首应该大写却错为小写的,每处计05个差错;同一差错在全书超过3处(含3处),计 15个差错。

⑼自造简化字、同音代替字,按错字计算;混用简化字、繁体字,每处计05个差错,全书最多计3个差错。

⑽量和单位的中文名称不符合国家标准的,每处计05个差错;同一差错多次出现,每面只计0.5个差错。

⑾阿拉伯数字与汉语数字用法不规范,每处计025个差错,全书最多计3个差错。

2、标点符号和其他符号差错的计算标准

⑴标点符号的一般错用、漏用、多用,每处计0.5个差错。但成组的标点符号,如引号、括号、书名号……错用、漏用、多用一边的,按每组计 05个差错。

⑵小数点误为中圆点,或中圆点误为小数点的,每处计025个差错;名线、着重点的错位、多、漏,每处计025个差错。

⑶破折号误为一字线、半字线,每处计025个差错;标点符号误在行首、行末的,每处计025个差错;可用逗号也可用顿号,可用分号也可用句 号的,不计错。

⑷外文复合词、外文单词按音节转行,漏排连接号的,每处计01个差错;同样差错在每面超过3个(含3处),只计03个差错。

⑸法定计量单位和符号,数理化……科技计量和符号、乐谱……符号的一般性差错,视情节轻重,计05-1个差错;同样差错,重复出现,每面只 计05-1个差错。

⑹图序、表序、公式序……序列性差错,每处计05个差错,全书超过3处(含3处),计15个差错。

3、格式差错的计算标准

⑴影响文意,不合版式要求的另页、另面、另段、另行、接排、空行,每处计0.25个差错。

⑵连续在一起的字体、字号错,每处计025个差错;字体和字号同时错,每处也计0.25个差错。

⑶在同一面上几个同级标题的位置、转行格式不统一的,计025个差错;肩题与正文之间未空格的,每处计025个差错。

⑷阿拉伯数字转行的,每处计01个差错。

⑸图、表的位置错,图、表的内容与说明文字不符,每处计2个差错。

⑹书眉单双页位置互错,每处计05个差错。

⑺脚注注码与正文注码配套,但不顺号;或有注码无注文,有注文无注码的,每处计025个差错。

四、图书的封面(包括封一、封二、封三、封底、勒口、护封、封套、书脊)、扉页、版权页、前言(或序)、后记(或跋)、目录,都为必须审读、检 查的内容。

page number 书的每一页面上标明次序的号码或其他数字。书籍每一页面上标明次第的数目字。用以统计书籍的面数,便于读者检索。

词目:页码(页码)

拼音:yè mǎ

英语:page number

释义:书的每一页面上标明次序的编码或其他数字。用以统计书籍的面数,便于读者检索。

例句: 蒋子龙 《机电局长的一天》四:“这一段没头没尾,页码是二二七。”

相关词语:

页面 页子 页岩 页心 页边  活页 百页窗 该页无法显示 篇页 靴页 书页 护页 百页 油页岩 尾页 散页 铁页子 画页 白页 册页 内页 皮靴页儿 折页

兄弟是不是 也写论文的了

唉 去年我们写的时候 研究生毕业论文必须要有作者、出版社 版本 页码 。这个真是要人命啊 我很多都是引用人家书上的 但是人家都没标页码 只有书 图书馆又不一定有这样的古书 所以到最后麻烦的一塌糊涂啊

1、中文摘要

中文摘要标题:居中,4号宋体加粗

摘要正文:小4号宋体字,限一页

关键词:3-5个,中间用“逗号”分开,小4号宋体加粗

2、目录

目录标题:居中,三号宋体加粗

目录内容:内容包含正文一、二级标题、参考文献标题、致谢标题、格式小四宋体,15倍行距(限一页,需要时可调整行距),要求页码正确无误并对齐。

题目的写法

毕业论文题目应简明扼要地反映论文工作的主要内容,切忌笼统。由于别人要通过你论文题目中的关键词来检索你的论文,所以用语精确是非常重要的。

论文题目应该是对研究对象的精确具体的描述,这种描述一般要在一定程度上体现研究结论,因此,我们的论文题目不仅应告诉读者这本论文研究了什么问题,更要告诉读者这个研究得出的结论。

热门文章
    确认删除?
    回到顶部