中国古籍离家百年被Ai找回,这究竟是怎么成功的?

栏目:古籍资讯发布:2023-09-20浏览:3收藏

中国古籍离家百年被Ai找回,这究竟是怎么成功的?,第1张

这些珍藏在加州伯克利分校的中国古籍之所以能以数字化的方式成功回归,一方面有赖于四川大学教授陈力的奔走联系,另一方面有赖于阿里达摩院技术团队与四川大学专家联手研发的针对古籍识别的Ai系统。

近日,20万页的中国古籍以数字化的形式从加州伯克利分校回归的消息激动人心,根据相关媒体的报道,此次古籍的回归实属不易,其背后有四川大学教授陈力这位63岁的老人长达两年的奔走联系,也有阿里达摩院技术团队与四川大学专家利用先进的机器学习方法研发出超高准确率的古籍识别系统,个人认为,古籍是中国文化中一笔宝贵的财富,此次回归的古籍补充了中国文化的一块空白,应该被好好珍惜

陈力教授前后联系奔走两年

四川大学教授陈力先生一辈子都在与古籍打交道,许多年来不论岗位如何变迁,一直心系古籍的保护和传承,而正是源于这份发自内心的坚持,这位63岁的老人忘我地前往加州伯克利分校奔走联系长达两年,最终促使20万页的中国古籍回归祖国。

Ai识别系统准确率高达975% 

在此次的古籍回归中,先进的Ai识别系统扮演着重要的角色,据了解,该系统是由阿里达摩院技术团队与四川大学专家联手研发,他们针对古籍识别的特点利用先进的机器学习设计了一套边识别古籍、边训练模型的系统,而最终成型的系统准确率高达975%。

古籍是中国文化的一笔财富

许多年前,大量的中国古籍由于各种原因流失到了海外,中国文化因此缺失了宝贵的一部分,此次回归的20万页的中国古籍,填补了中国文化曾经被撕裂开的伤痕,是中国文化的一笔宝贵的财富。

中国的古籍版本浩如烟海,按照各种 不同的标准,可以分为许多类型。按照制 作方式的不同,古籍版本可以分为写本与印本两大类。写本,又称“手写本”,是指用手写 成而非制版印刷的本子,包括稿本、抄本等。 人们习惯上将唐朝以前的本子称为“写本”, 唐朝以后的本子称为“抄本”。人们又习 称除稿本和抄本外用手写形式写成的本子 为“写本”。写本比经过加工整理的抄本 或印本更为真实具体。

朋友你好:根据你的来看,首先,文字锋芒有所欠缺,没有书写的笔锋;再有,空白处有比较多的小点壮野墨。文字边缘有印刷特有的边框。最后,以文字做多个对比,没有一定规范(相同的字不一样)。 综上所述这是一册雕版印刷体的 《神相水镜集全编》

个人浅见,希望对你有帮助。

5月18日,一批珍藏于加州大学伯克利分校的中文古籍善本,以数字化方式回归故土,落地汉典重光古籍平台。借助阿里达摩院的技术,首批20万页古籍已完成数字化,并沉淀为覆盖3万多字的古籍字典,公众可通过汉典重光平台翻阅、检索古籍。据悉,达摩院AI对20万页古籍的识别准确率达到975%。 

百度AI在国内属于什么水平?

绝对是一个第一流的前三名啊,这是一点问题没有的。不是传统的这个搜索,现在基本上来讲就是两大块。无人车也是挂在这个人工智能里头的,它剩下的那些边缘的东西基本上都砍掉了,这个公司的市值和你这个公司本身的这个技术水准其实未必是直线挂钩的,尤其是在中国这个市场,你这一个公司说白了,你这个业务线越多,你干的事业部越多,那你表面上,你的这个产值就高,用户人群也高,你不聚焦呀,然后你赶上现在红利期的时候,表面上觉得轰轰烈烈,但是一旦非红利期的时候不就不行了吗?

我国AI发展到什么程度了?

这几年AI企业爆发式增长,具体查查数据显示18年新增的AI企业比17年翻了一倍,达到了19,000家。19年比18年增长了70%达到了3万家,2020年上半年AI企业的数量突破了56万家。这背后AI正在下沉,沉到各行各业,成为传统生产力的一部分。为什么AI公司数量还在爆发式增长,因为现在大量的AI公司其实并不是受投资人追捧,有团队有技术的AI公司,他们更多是深入到各行各业,甚至有可能成为一些人眼里的伪AI公司,他们可能不掌握核心技术,重点是做服务搞商业。但伪AI公司的涌现正在说明在某些方面AI技术的门槛已在降低,基础已经建设到了一定程度。“旧时王谢堂前燕”的AI技术已成为标签元素,进入到了各种寻常百姓家。

中国AI在医疗方面优势巨大。

如今AI进到生物化学,药学,病理学,在这个医疗方面我觉得真的是开启了一个新的时代,在这一块我认为中国有巨大的优势,一种是它的新举国体制,而且他需要调动很多资源,比如说它的临床研究啊,那些医生医学,那需要原来做制药的公司也进来,基因测序的这些公司也进来,然后原来生物化学那些专家也进来,然后ai的人再进来。很少见全世界现在有哪个国家或哪个地方能够有这样的一个能力去调动这些资源,那我是看到中国的确有这样的一个能力,这个能力可能啊,我觉得我们有可能在这个领域可能比美国还要先进。我认为10年时间啊,有可能我们会走美国前面。

常用于写刻古籍正文的字体:一种是手写体,即软体;一种是匠体,即硬体。

宋人写字,多学唐代书法家欧阳询、颜真卿和柳公权等,故宋刻本的字体,多含有这些书法家字体的笔意。

宋代的浙本多用欧体,宋代建本多用颜体,而宋代的蜀本却在颜体之中糅进了柳体的笔意。元人刻书“多用赵松雪字体”,后世多称作“元体字”。赵松雪即元代著名书画家赵孟頫。

明正德之前,袭承元风,字体多用赵体。但“自正德,嘉靖以降……字体亦一变而为方体字,僵硬呆滞。万历以后,字体又一变而为横轻直重……天启、崇祯,字体又一变而为狭长的横轻直重字样。”

特点:

1、纸色苍润,质地坚良,洁白厚实。笺则古香古色,柔韧而极薄,防霉防蛀。

2、墨色香淡,纸上墨色青纯,笺上墨色光泽如漆,虽水润而绝无漂迹。

3、字势生动,字画刻写古雅苍劲,宋刻字体有肥瘦两种。

4、早期宋版大多为白口,墨栏单边,其后双边渐多,分四周双边和左右双边。版心上记载字数、书名、卷第、刊工姓名,书名通常在鱼尾下。行宽字疏,行格多用乌丝栏,行字不等。

5、书中文字大多避皇帝讳,尤其是内府和官府。

刻本书的鉴定依据 关于印本和写本书的用纸,前人没有系统的调查研究资料可供参考,很多纸不知其名称,而文献中提到的纸又难以与实物相联系,鉴定时所能根据的仅是纸质的精细厚薄,颜色的黄、白或灰以及帘纹宽狭而已。宋代有的浙刻本用白麻纸,纸质较匀净,有韧性;四川刻本也用白麻纸,有些纸质较粗,甚至有透空小孔。南宋初期福建印书所用竹纸,质地细润,纸色较白,但以后多用**竹纸,因而从宋、元到明代,黄纸成为福建印本的特征。明代以棉纸为贵,棉纸有厚薄之不同,纸质细润,白棉纸印书成为明代特色。明末出现了开化纸,纸质细白匀净,清代以开化纸印书最名贵,连史纸、竹纸应用亦多。宋以后,还有用公文纸(公牍纸)和其他册子、信札等旧纸的背面印书的,这些公文纸如载有年月也可借以推断印本的大致时代。总之,书籍的用纸是识别版本的一项依据,但要多作比较,因为有的书刻印于宋代,后世仍可用其书版再印,而区别初印本和后印本,只能从纸张来判别了。

中国古籍离家百年被Ai找回,这究竟是怎么成功的?

这些珍藏在加州伯克利分校的中国古籍之所以能以数字化的方式成功回归,一方面有赖于四川大学教授陈力的奔走联系,另一方面有赖于阿里达摩院...
点击下载
热门文章
    确认删除?
    回到顶部