OCR技术的用途?

栏目:古籍资讯发布:2023-08-05浏览:2收藏

OCR技术的用途?,第1张

1) 办公自动化。工厂企业、公司及事业单位的日常办公用文件及资料等需要输入计算机存储检索。使用OCR,既比存储图像文件大大地节省存储量,又不需要专职录入人员,是减轻劳动量、节约资金、提高办公效率的最好措施。

2) 建立中文资料库。要大量输入各种文书、刊、报及文件,使用OCR可以缩短建库时间,减轻劳动强度,降低费用。

3) 打字公司、书刊出版社、报社等。使用OCR可以自动录入已经出版的文章和打印文件,稍加修改编辑成新文章或再版己有书刊。OCR输出的标准汉字代码文件可为大多数中文处理系统、轻印刷系统、照排系统所接受,可重新打印、印刷输出。

4) 图书馆、档案馆、文献中心。用本系统自动录入图书有关信息,可建立书目数据库自动录入经典图书全文,将纸上文字转移到计算机内,便于保存、查找、检索,更大的好处可以提供给专家用计算机对书籍内容进行研究。

5) 机器翻译机。器翻译的第一步是将全文输入计算机,利用OCR可以将机器自动翻译相匹配,实现高速自动翻译。

6) 个人使用。当您阅读资料时,可用OCR将您感兴趣的段落自动录入,特别是作家,可以将一些书载历史资料或文献快速录入到计算机内。

ocr文字识别:是指光学字符识别,通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息,再利用文字识别技术将图像信息转化为可以使用的计算机输入技术。

ocr文字识别应用行业:目前OCR文字识别的应用范围非常广泛,市场上较为成熟的OCR产品有:证件识别SDK、车牌识别SDK、文档识别SDK、银行卡识别SDK、表格识别SDK、票据识别SDK、名片识别SDK、护照识别SDK、身份证识别SDK。目前,银行、保险、金融、税务、海关、公安、边检、物流、电信工商管理、图书馆、户籍管理、审计等很多行业都已经应用了OCR技术。

ocr文字识别率:目前行业OCR文字识别针对印刷字体的识别率基本达到90%以上;而对手写体则偏低。光学字符识别识别率有限于所采集到的分辨率、色彩等因素,目前基于人工智能AI的OCR已可大大的减少环境的影响。

OCR使用方法:针对个人用户可自行到搜索引擎搜索“ocr识别软件”到相应的官方网站下载安装使用。针对行业用户则相对麻烦,需要根据所应用的行业领域寻找相应的OCR SDK,自行开发或使用提供商所提供的接口。

用了三天多的时间读完了罗辑思维推出的《智能时代》(吴军著),下面将该书的要点整理出来,分享给大家。

1、人类通过观察 现象 获得 数据 ,通过数据发现规律( 信息 ),通过信息总结出 知识 。例如:现象:星球运动;数据:星球的位置和对应的时间;信息:星球的运行轨迹;知识:开普勒三定律。

2、人类的文明过程其实就是一个“获取数据”——》“分析数据”——》“建立模型”——》“预测未知”的过程。

3、人类利用数据由来已久:

    a 我们现在一直使用的日历就是基于古人的观察数据基础上而来的;

    b 托勒密在喜帕恰斯留下的大量观测数据基础上,构建完成了地心说模型;堪称完美(但不简洁)。

    c 开普勒在老师第谷的大量观测数据基础上,总结出了开普勒三定律,用数学语言描述了日心说模型;

    d 统计学就是一门依据调查数据进行预测的科学。

1 有了大数据,计算机就可以将智能问题变为数据问题;

2 机器智能最重要的是能够解决人脑所能解决的问题,而不在于是否需要采用和人一样的方法;

3 大数据的三个特征:体量大、纬度多、全面性;

1 我们之前的思维方式——机械思维;机械思维是现代文明的基础;

2 机械思维可以追溯到古希腊。其中最具有代表性的是欧几里得和托勒密;

3 欧几里得的最大成就不是发现了那些几何定理,而是在人类所积累起来的几何学和数学知识的基础上,创立了公理化的几何学;欧几里得的基于公理化系统不仅为几何学、数学和自然科学后来的发展奠定了基础,而且对西方人的整个思维方法都有极大的影响。

4 托勒密的方法论可以概括为“通过观察获得数学模型的雏形,然后利用数据来细化模型”。但托勒密的方法论有两大缺陷:整体模型很复杂和确定性假设(他假设了行星的运行轨道是圆)。

5 牛顿不仅把欧几里得通过逻辑推理建立起来一个科学体系的方法论从数学拓展到了自然科学领域,而且把托勒密用机械运动模型描述的天体的规律,扩展到对世界任何规律的描述。

6 后人把牛顿的方法论概括为机械思维:世界的变化规律是确定的;世界变化的规律不仅可以被认识而且可以用简单的公式或语言描述清楚;这些规律放之四海皆准。

7 从牛顿开始,人类的进步在很大程度上得益于机械思维,但是到了信息时代,他的局限性也越来越明显:首先,不是所有的规律都可以用简单的原理描述;其次,找到因果关系变得越来越困难,因为简单的因果关系都被发现了。

8 世界的不确定性来自两个方面:首先,影响世界的变量其实非常多;其次,我们在观察(测量)世界的同时也在影响世界。

9 如果我们承认了世界的不确定性,那么我们就不会采用确定性思维去面对一个不确定性的世界。

10 通过大数据我们可以发现事物间的相关性而不是因果性,大数据思维和原有的机械思维并非完全对立,他更多的是对后者的补充。

1亚马逊的三个优势:a、交易数据是即时而且完整的记录下来,并且随时可以用;b、拥有顾客的全面信息;c、所有的市场策略能马上实现。相对而言,实体零售类的公司(如沃尔玛、家乐福)不是没有数据,而是在个性化和实效性方面很难像电子商务公司那样有效。

2 各种商业模式:

    新技术+原有产业=新产业;

    现有产业+蒸汽机=新产业;

   现有产业+电=新产业;

   现有产业+摩尔定律=新产业;

   现有产业+大数据=新产业;

   现有产业+机器智能=新产业;

3 对历次技术革命中商业模式的变迁分析,我们可以得到三个结论:a、技术革命导致商业模式的变化,尤其是新的商业模式的诞生;b、生产越来越过剩,需求拉动经济增长的模式变的不可逆转;C、商业模式的变化既有继承性也有创新性。

2 数据的存储要求:容量大;读写速度要快;标准的数据格式便于共享;

3 数据的处理:并行处理、优化算法;

4 机器学习的过程是一个不断迭代、不断进步的过程,用机器学习的专业术语来说就是“期望值最大化”的过程:只要事先设定一个学习的目标,这些算法会不断的优化模型,让它越来越接近真实的情况。

5 Google 在2010年开发出了Google大脑(Google Brain)的深度学习工具。该工具的突破性在于可以将一个很大的模型上百万的参数同时训练的问题,简化为能够分布在上万台服务器上的小问题,这样使得大型人工神经网络训练成为可能。

6 数据安全的两层含义:保证用户的数据不损坏、不丢失;保证数据不被偷走。

7 大数据带来的严重的隐私问题在于今后会变的没有隐私。

1 未来的农业:农业的智能化可以在降低水和化肥的用量前提下,提高亩产;

2 未来的体育;金州勇士队基于大数据的训练和战术使其在6年时间里从倒数第二登顶NBA总冠军;

3 未来的制造业:特斯拉的汽车装配厂全部由机器人操作,而且也使的个性化生产成为可能;

4 未来的医疗:通过机器智能可以解决医疗资源短缺的问题;通过大数据缩短药物的研发时间从而降低药物成本;通过基因药物的研制可以生产个性化的药物。实例:全世界的3000多台达芬奇机器人完成了300多万例手术。

5 未来的律师业:通过大数据降低律师的费用;

6 未来的记者和编辑:今天美国很多媒体的财经新闻已经是由计算机自动编写完成。

1、在历次技术革命中,一个人、一家企业、甚至一个国家,可以选择的道路只有两条:要么加入浪潮,成为前2%的人,要么观望徘徊被淘汰。

2、隐私就像自由,只有当人们失去它的时候,才知道它的可贵。

3、三次技术革命:18世纪60年代始于英国的以蒸汽机为代表的第一次工业革命;19世纪末始于美国和德国的已电力驱动为代表的第二次工业革命;“二战”后以摩尔定律为标准的信息革命。

4、两次工业革命给人类带来的福祉是先从少数精英开始的 ,经过长达半个多世纪的时间才开始造福技术革命的中心地区。

5、技术革命会使很多产业消失或者产业从业人口大量减少,释放出的劳动力需要寻找出路。这个时间至少要一代人以上,因为被淘汰的产业从业人员能够进入新行业的其实非常少。

5、智能革命对社会的冲击甚至有可能超过过去几次技术革命。

6、智能革命的结果是让计算机代替人去思考,或者说靠计算得到比人类思考更好的结果,能够更好的解决各种智能问题。

7、这一次由机器智能带来的革命,对社会的冲击将是全方位的,我们原本依赖的那些所谓需要智力的工作也在消失。在智能革命全面到来的时候,不可能像过去那样把农业人口变成城市人口,把第一、第二产业变成第三产业那么简单。

8、随着技术革命的发展,并非每个人的发展机会都是越来越多,反而可能是越来越少。

9、在智能时代我们该如何生存:成为研发大数据和机器智能的人员,或者利用好大数据和机器智能。比如,收集现有的业务过程中的数据,通过大数据和机器智能优化现有的业务模式。

偶得吴军老师的《智能时代》一书,阅读该书前两章,感觉受益匪浅,尤其是通过对第二章“大数据与机器智能”的阅读,才使我对人工智能的历史有了一个大致的了解,现将感想倾诸于下。

一、“数据”概述

虽然我对人工智能的具体情况尚不了解,但大致知道现阶段的人工智能需要以大数据为基础,而《智能时代》第一章即详细介绍了数据的相关问题。

首先,“在计算机出现之前,一般书籍上的文字内容并不被看成数据,”而今天,不止书籍上的文字内容,连我们的活动,我们每天的言谈举止,喜爱偏好等,都已被看成是某种数据。

在人类社会早期,我们通过观察现象,总结数据,再从数据中提取出有用的信息,并在信息的基础上形成知识(知识具有系统性),从而指导我们的行为。我们使用数据的标准流程如下:

而在过去数据的作用之所以不被重视,“这里面有两个原因,首先是由于过去数据量不足,积累大量的数据所需要的时间太长,以至于在较短的时间里它的作用不明显。其次,数据和所想获得的信息之间的联系通常是间接的,它要通过不同数据之间的相关性才能体现出来。”而这种相关性也有待人们的发掘,吴军老师举了王进喜照片与日本投标之间的关联、谷歌用户对某节目的搜索量和该节目收视率之间的关联以及搜索趋势和流感疫情之间的关联等来说明相关性的重要。

而关于第一个原因,“在互联网出现之前,获得大量的具有代表性的数据其实并非一件容易事,在误差允许的范围内做些统计当然没有问题,但只有在很少的情况下能够单纯依靠数据来解决复杂的问题。因此在20世纪90年代之前,整个社会对数据并不是很看重。”

数据的相关性还要透过建立合适的数学模型来更好的加以利用,“要建立数学模型就要解决两个问题,首先是采用什么样的模型,其次是模型的参数是多少。”“……如果一开始模型选得不好,那么以后修修补补就很困难。因此,在过去,无论在理论上还是工程上,大家都把主要的精力放在寻找模型上。”

“有了模型之后,第二步就是要找到模型的参数,以便让模型至少和以前观察到的数据相吻合。这一点在过去的被重视程度远不如找模型。但是今天他又有了一个比较时髦而高深的词——机器学习。”(程按:既输入数据,不断调整模型,这和今天机器学习的方法类似)

“回到数学模型上,其实只要数据量足够,就可以用若干个简单的模型取代一个复杂的模型。这种方法被称为数据驱动方法,因为它是先有大量的数据,而不是预设的模型,然后用很多简单的模型去契合数据(Fit Data)。虽然这种数据驱动方法在数据量不足时找到的一组模型可能和真实的模型存在一定的偏差,但是在误差允许的范围内,单从结果上看和精确的模型是等效的,这在数学上是有根据的。从原理上讲,这类似于前面提到的切比雪夫大数定律。

当然,数据驱动方法要想成功,除了数据量大之外,还要有一个前提,那就是样本必须非常具有代表性,这在任何统计学教科书里的一句话,但是在现实生活中要做到是非常难的。……”

二、大数据和机器智能

“在2000年以后,由于互联网特别是后来移动互联网的出现,数据量不仅剧增,而且开始相互关联,出现了大数据的概念,在2000 年以后,由于互联网特别是后来移动互联网的出现,科学家和工程师们发现,采用大数据的方法能够使计算机的智能水平产生飞跃,这样在很多领域计算机将获得比人类智能更高的智能。可以说我们正在经历一场由大数据带来的技术革命,其最典型的特征就是计算机智能水平的提高,因此我们不妨把这场革命称为智能革命。当计算机的智能水平赶上甚至超过人类时,我们的社会就要发生天翻地覆的变化,这才是大数据的可怕之处。

那么为什么大数据会最终导致这样的结果,大数据和机器智能是什么关系呢?要说清楚这一一点,首先要说明什么是机器智能。”

“1946年,第一台电子计算机ENIAC诞生,这使得人类重新开始考虑机器能否有智能的问题。”

“真正科学地定义什么是机器智能的还是电子计算机的奠基人阿兰·图灵博士。1950年,图灵在《思想》杂志上发表了一篇题为《计算的机器和智能》的论文。在论文中,图灵既没有讲计算机怎样才能获得智能,也没有提出什么解决复杂问题的智能方法,而只是提出了一种验证机器有无智能的判别方法。”既让一个裁判坐在墓前和幕后的“人”交流,幕后是一台机器和一个人,如果裁判无法判断出与自己交流的是人还是机器,那么就说明这台机器拥有了和人同等的智能。

“这种方法被后人称为图灵测试(Turing Test)。计算机科学家们认为,如果计算机实现了下面几件事情中的一件,就可以认为它有图灵所说的那种智能:

1语音识别

2机器翻译

3文本的自动摘要或者写作

4战胜人类的国际象棋冠军

5自动回答问题

今天,计算机已经做到了上述这几件事情,有些时候还超额完成了任务,比如在下棋方面,不仅战胜了国际象棋的世界冠军,而且还战胜了围棋的世界冠军,后者的难度比前者高出6~8个数量级。当然,人类走到这一步并非一帆风顺,而是先走了十几年的弯路。”

鸟飞派:人工智能10

“据记载,1956年的夏天,香农和一群年轻的学者在达特茅斯学院召开了一次头脑风暴式的研讨会。……事实上,这是一次头脑风暴式的讨论会。这10位年轻的学者讨论的是当时计算机科学尚未解决,甚至尚未开展研究的问题,包括人工智能、自然语言处理和神经网络等。人工智能这个说法便是在这次会议上提出的。”

“人工智能这个名词严格地讲在今天有两个定义,第一个是泛指机器智能,也就是任何可以让计算机通过图灵测试的方法,包括我们在本书中要经常讲的数据驱动方法。第二个是狭义上的概念,即20世纪五六十年代特定的研究机器智能的方法。今天,几乎所有书名含有“人工智能”字样的教科书(包括全球销量最大的由斯图亚特·罗素和诺威格编写的《人工智能:一种现代的方法》一书)依然用主要的篇幅介绍那些“好的老式的人工智能”(Good Old

Fashioned)。后来那些利用其他方法产生机器智能的学者为了划清自己和传统方法的界限,特地强调自己不是用人工智能的方法。因此,学术界将机器智能分为传统人工智能的方法和现代其他的方法(比如数据驱动、知识发现或者机器学习)。当然,计算机领域之外的人在谈到人工智能时,常常是泛指任何机器智能,而并不局限于传统的方法。因此为了便于区分,我们在本书中尽可能地使用机器智能表示广义上的概念,而在使用人工智能表达时,通常是指传统的人工智能方法,甚至我们有时会强调为人工智能10。

那么传统的人工智能方法是什么呢?简单地讲,就是首先了解人类是如何产生智能的,然后让计算机按照人的思路去做。今天几乎所有的科学家都不坚持“机器要像人一样思考才能获得智能”,但是很多的门外汉在谈到人工智能时依然想象着“机器在像我们那样思考”,这让他们既兴奋又担心。事实上,当我们回到图灵博士描述机器智能的原点时就能发现,机器智能最重要的是能够解决人脑所能解决的问题,而不在于是否需要采用和人一样的方法。

为什么早期科学家们的想法会和今天的门外汉一样天真呢?这个道理很简单,因为这是根据我们的直觉最容易想到的方法,在人类发明的历史上,很多领域早期的尝试都是模仿人或者动物的行为。比如人类在几千年之前就梦想着飞行,于是就开始模仿鸟,在东方和西方都有类似的记录,将鸟的羽毛做成翅膀绑在人的胳膊上往下跳,当然实验的结果都可想而知。后来人们把这样的方法论称作“鸟飞派”,也就是看看鸟是怎样飞的,就能模仿鸟造出飞机,而不需要了解空气动力学。事实上我们知道,怀特兄弟发明飞机靠的是空气动力学而不是仿生学。在这里,我们不要笑话前辈来自直觉的天真想法,这是人类认识的普遍规律。

在人工智能刚被提出来的时候,这个研究课题在全世界都非常热门,大家仿佛觉得用不了多长时间就可以让计算机变得比人聪明了。遗憾的是,经过十几年的研究,科学家们发现人工智能远不是那么回事,除了做出了几个简单的“玩具”,比如让机器人像猴子一样摘香蕉,解决不了什么实际问题。到了20世纪60年代末,计算机科学的其他分支都发展得非常迅速,但是人工智能研究却开展不下去了。因此,美国计算机学界开始反思人工智能的发展。虽然一些人认为机器之所以智能水平有限,是因为它还不够快、容量不够大,但是,也有一些有识之士认为,科学家们走错了路,照着那条路走下去,计算机再快也解决不了智能问题。”

明斯基在《语义信息处理》引用了巴希勒使用过的一个例子: The pen was

in the box和The box was in the pen,来说明目前人工人工智能的局限性。

“这两句话会得到相同的语法分析树,而仅仅根据这两句话本身,甚至通篇文章,是无法判定pen在哪一句话中应该作为围栏,在哪一句话中应该是钢笔的意思。事实上人对这两句话的理解并非来自语法分析和语意本身,而是来自他们的常识或者说关于世界的知识(world knowledge),这个问题是传统的人工智能方法解决不了的。因此,明斯基给出了他的结论:‘目前’(指1968年)的方法无法让计算机真正有类似于人的智能。由于明斯基在计算机科学界具有崇高的声望,他的这篇论文导致美国政府削减了几乎全部人工智能研究的经费,在之后大约20年左右的时间里,全世界人工智能在学术界的研究是处于低谷的。”

另辟蹊径:统计+数据

“到了20世纪70年代,人类开始尝试机器智能的另一条发展道路,即采用数据驱动和超级计算的方法,而这个尝试始于工业界而非大学。

在那个年代,IBM在全世界计算机乃至整个IT产业可以说是处于独孤求败的地位。……这时,IBM考虑的不能再是如何占有更大的市场份额,而是如何让计算机变得更聪明。

1972年,康奈尔大学的教授弗雷德·贾里尼克(Fred Jelinek,1932-2010)到IBM做学术休假,正好这时IBM想开发“聪明的计算机”,贾里尼克就“临时”负责起这个项目。至于什么是聪明的计算机,当时大家的共识是它要么能够听懂人的话,要么能将一种语言翻译成另一种语言,要么能够赢得了国际象棋的世界冠军。贾里尼克根据自己的特长和IBM的条件,选择了第一个任务,即计算机自动识别人的语音。”

贾里尼克认为语音识别是一个智能问题,而是一个通信问题,既人发出语音是一个大脑编码的过程,编码完成,经过传播,传入听者的耳朵,听者接受并理解则是一个解码的过程,而对于语音识别问题也可以按此处理,他“用当时已经颇为成熟的数字通信的各种技术来实现语音识别,而彻底抛开了人工智能的那一套方法(指传统的方法,让计算机模拟人)”

“贾里尼克和他的同事在研究语音识别时,无意中开创了一种采用统计的方法解决智能问题的途径,因为这种方法需要使用大量的数据,因此又被称为数据驱动方法。这种方法最大的好处是,随着数据量的积累,系统会变得越来越好,相比之下过去人工智能的方法很难受益于数据量的提升。”

“在语音识别之后,欧洲和美国的科学家开始考虑能否用数据驱动方法解决其他智能问题。贾里尼克的同事彼得·布朗(Peter Brown)在20世纪80年代,将这种数据驱动方法用于机器翻译。但是由于缺乏数据,最初的翻译结果并不令人满意,虽然一些学者认可这种方法,但是其他学者,尤其是早期从事这项工作的学者认为,解决机器翻译这样智能的问题,光靠基于数据的统计是不够的。从20世纪80年代初到90年代中期大约十多年的时间里,在计算机界大家一直有个争议,那就是数据驱动方法是否适用于各种领域,语音识别是否只是一个特例。简单地讲,当时无论是做语音识别、机器翻译、图像识别,还是自然语言理解的学者,分成了界限很明确的两派,一派坚持采用传统的人工智能方法解决问题,简单来讲就是模仿人,另一派在倡导数据驱动方法。这两派在不同的领域力量不一样,在语音识别和自然语言理解领域,提倡数据驱动的一派比较快地占了上风;而在图像识别和机器翻译方面,在较长时间里,数据驱动这一派处于下风。这里面主要的原因是,在图像识别和机器翻译领域,过去的数据量非常少,而这种数据的积累非常困难。图像识别就不用讲了,在互联网出现之前,没有一个实验室有上百万张。在机器翻译领域,所需要的数据除了一般的文本数据,还需要大量的双语(甚至是多语种)对照的数据,而在互联网出现之前,除了《圣经》和少量联合国文件,再也找不到类似的数据了。”但随着互联网的兴起,数据的获取变得容易起来,2005年谷歌公司打败全世界所有机器翻译研究团队所用的方法依然是数据驱动方法,而之所以能赢,则是因为“用了比其他研究所多几千倍甚至上万倍的数据。”

“如今在很多与“智能”有关的研究领域,比如图像识别和自然语言理解,如果所采用的方法无法利用数据最的优势,会被认为是落伍的。

数据驱动方法从20 世纪70年代开始起步,在八九十年代得到缓慢但稳步的发展。进入21世纪后,由于互联网的出现,使得可用的数据量剧增,数据驱动方法的优势越来越明显,最终完成了从量变到质变的飞跃。如今很多需要类似人类智能才能做的事情,计算机已经可以胜任了,这得益于数据量的增加。

全世界各个领域数据不断向外扩展,渐渐形成了另外一个特点,那就是很多数据开始出现交叉,各个维度的数据从点和线渐渐连成了网,或者说,数据之间的关联性极大地增强,在这样的背景下,就出现了大数据。”

“在有大数据之前,计算机并不擅长解决需要人类智能来解决的问题, 但是今天这些问题换个思路就可以解决了,其核心就是变智能问题为数据问题。由此,全世界开始了新的一一轮技术革命智能革命。”

尽管过往数年,计算机能做的事情越来越来,但给人的感觉仍然是“快却不够聪明”,但当我们拥有足够多的数据之后,便可以化智能问题为数据问题,机器不再需要像人一样思考才能解决问题,只要输入足够的数据,配合合适的算法(模型),机器便可以做出最优的判断。深蓝即使战胜了卡斯帕罗,“但在这看似聪明的表象背后,其实是大量的数据、并不算复杂的算法和超强计算能力的结合——深蓝从来没有,也不需要像人一样思考。”

“计算机下棋和回答问题,体现出大数据对机器智能的决定作用。我们在后面会看到很多各种各样的机器人,比如 Google自动驾驶汽车、能够诊断癌症或者为报纸写文章的计算机,它们不需要像科幻**里的机器人那样长着人形,但是它们都在某个方面具有超过人类的智能。在这些机器人的背后,是数据中心强大的服务器集群,而从方法上讲,它们获得智能的方法不是和我们人一样靠推理,而更多的是利用大数据,从数据中学习获得信息和知识。如今,这一场由大数据引发的改变世界的革命已经悄然发生,我们在后面的几章会更深入地介绍它。这次技术革命的特点是机器的智能化,因此我们称之为智能革命也毫不为过。”

计算机视觉研究领域的分支之一,归属于模式识别和人工智能,是计算机科学的重要组成部分。

人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。

人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的“容器”。

人工智能可以对人的意识、思维的信息过程的模拟。人工智能不是人的智能,但能像人那样思考、也可能超过人的智能。

人工智能是一门极富挑战性的科学,从事这项工作的人必须懂得计算机知识,心理学和哲学。人工智能是包括十分广泛的科学,它由不同的领域组成,如机器学习,计算机视觉等等,总的说来,人工智能研究的一个主要目标是使机器能够胜任一些通常需要人类智能才能完成的复杂工作。但不同的时代、不同的人对这种“复杂工作”的理解是不同的。

2017年12月,人工智能入选“2017年度中国媒体十大流行语”。2021年9月25日,为促进人工智能健康发展,《新一代人工智能伦理规范》发布。

ocr识别,其实也就是文字识别,就比如微信里会有的文字提取功能,用到的便是ocr识别技术;乘坐高铁需要刷身份证取票或是刷身份通行也用到的是ocr识别技术。

ocr技术发展至今,所具备的功能不仅仅是文字识别,还有各类证件识别、护照、通行证、文档表格等等的ocr识别。

一起来看一下生活中都有哪些OCR识别的影子:

顺丰运单识别

在这个全民网购的时代,每天都会产生许多的快递单,货运单,就那顺丰公司来说,每年都会在人力上消耗巨大,其中消耗在运单识别上的人力资源更是难以衡量。由于顺丰运单的数量较多,而用户手写字体。

光照、成像、倾斜等问题,给运单识别带来了困难。而ocr识别技术可以有效解决这些问题。顺丰快递应用了ocr识别技术之后,最终达到3小时识别2000万张的识别效率,大部分字段的准确率也在98%以上,帮助客户大大节省了人力成本。

企业微信

企业微信中的名片识别和营业执照也是利用OCR技术,现在腾讯云的ocr识别产品可以支持各种营业执照的识别,帮助你更好的提取出、文字、文档、表格、以及各种证件里的有效信息。

丰巢快递柜

丰巢快递柜是国内最早实现无人刷脸寄件的快递柜之一。快递柜是现在快递分类和人们领取的有利产品,由于无人查验寄件人身份,提供了OCR身份证识别能力和人脸识别能力。在业务线成功的开启的同时,也解放了大量的人力物力。利用ocr识别技术和人脸识别技术,使得用户可以自主寄件和区间,大大提供了寄件、取件效率。

这三个案例均是ocr识别技术的典型案例,每一项技术的诞生都是极具意义的,就看人们怎么去应用它。

希望本回答可以帮助到你

望采纳~

光学字符识别

将扫描的文件转化为可编辑的文字信息应用了人工智能中光学字符识别,简称OCR,是一种可以使你转换不同文档的技术,比如将扫描纸质文档,PDF文件或者数码相机拍摄的转换成可以编辑的文档。假设你获得了一个纸质文件-比如,杂志、彩页或者你合作伙伴发给你的PDF合同。很明显,光是一台扫描仪是不足以让这些文档转变成可以编辑的文档,也就是Microsoft Word。扫描仪可以做的只是创建或者一张黑白或者彩色的图像文档。为了从扫描文档、PDF或者数码中提取文字和数据,你需要OCR软件识别上的信息,从单词到句子,然后变成整个可以编辑的文档。OCR作为最早实用化的人工智能技术之一,已在产业中得到广泛应用。中安未来OCR技术经过多年的市场应用和技术积累,已推出文档识别、证照识别、票据识别、名片识别等全方位文字识别产品与服务,广泛服务于各行业。近日,中安OCR技术再次升级,在原有中文、英文、日文、韩语、法文等十多种语言文字的识别基础之上,重磅推出维吾尔文、藏文等多语种印刷体文字识别能力,高效助力维族、藏族等少数民族产业发展。

查看更多

热门文章
    确认删除?
    回到顶部