20万页中国古籍被AI找回的背后,有着怎样的感人故事?
宋刻本《后村居士集》、北宋《金粟山大藏经》写本、清文澜阁《四库全书》零等20万页古籍以数字化的方式回归了。这些古籍古迹历史非常久远,时至如今还能回归这中间的困难喝阻碍难以言喻。据了解,这些古籍的数字化回归离不开一位年近七旬老人数年的奔走。那么,这背后的故事到底是怎样的呢?
这位老人是中央文史馆馆员、四川大学的教授,两年间里,奔走于加州大学伯利克分校,让收藏在此的文化古籍可以通过技术以另外一种方式回归。经过这名老学者的不断努力和奔走,终于20万页古籍以一种现代化的方式回归并且出现在大众视野里。这定是有着非凡的信念和坚定的信仰。并且有这么一项技术能够运用在这20万页古籍上,使之以数字化形式呈现,那么在未来肯定也可以运用到其他的文物或文化典籍的恢复和回归上。这不仅是对文化典籍恢复有重要影响,对于科技上来说也是非常显著的一项进步。
当然,我想说的并不仅仅只是这个故事和这项技术,我更想呼吁的是能够有更多的像这位教授一样的学者出现,每个人都应该以中国文化而感到自豪。我们目前古书典籍的修复现状其实是不容乐观的,专业人才的缺失,修复的难度系数高都让这项事业难以前进,我们应该惋惜但更应该珍惜。
最后,我想说的是中华上下5000年,其中的文化瑰宝数不胜数,历史长河中消逝不见的也大有其在。但不论是保存至今的还是丢失不见都提醒着我们要珍惜并且创造。我们是历史文化的见证者更加是历史文化的创造者,葛剑雄教授曾在一个讲座上说中国古籍能保存至今,是先贤不惜生命代价传承下来。现在,这名年近七旬的教授用行动告诉我们,中国古籍的保存不仅只有先贤的贡献,我们也是同样可以为之做出贡献的。
海外古籍数字化回归:如何做到“为天下人所用”?
南方周末
原创
2021-6-2 00:09 · 《南方周末》官方账号
陈力和何梦超讨论古籍数字化方法。 (达摩院供图/图)
流散海外八十多年后,文澜阁本《四库全书》中的《宋百家诗存》重现大众视野。
在扫描影像中,这本中国古籍上的水浸、虫噬、霉变历历可见,每一处都是历史的风霜。1790年左右,《宋百家诗存》随《四库全书》入藏杭州文澜阁,清咸丰年间在太平军入杭后散失,1861年左右被嘉业堂收藏。抗战时期,部分嘉业堂藏书流落到了上海,可能被日本人收购,并于1949年辗转到了美国,如今藏于加州大学伯克利分校东亚图书馆。
东亚图书馆收藏了大量中国古籍善本,截至2021年5月18日,其中二十万页被扫描影像、读取文字,以数字化形式回归祖国。
这是海外古籍回归项目“汉典重光”的成果之一。这批数字化古籍善本中既有宋元本,也有明清至民国时期著名学者的稿本、抄本,其中一些是以前很少有人见过的珍贵藏本,比如清文澜阁本《宋百家诗存》。
古籍流散海外的原因多种多样,实体回归几乎是不可能的,比较可行的办法是数字化回归。
此前的古籍数字化平台,大多是展示扫描后的古籍,读者只能在这些平台阅读,无法就书中内容进行检索分析。此次汉典重光的数字化团队不仅将古籍扫描,还将扫描下来的识别转化成了电子文字。搜索某一字词,可以跳转到字词所在书本的具体章节段落。
这些古籍资源将向公众免费开放。阿里达摩院院长张建锋表示,汉典重光古籍数字化平台将被捐赠给权威公共机构长期运营。
“让蒙尘的古籍重焕新生”
四川大学历史文化学院教授陈力是汉典重光项目的古籍专家。陈力的父亲是教历史的,1977年,陈力作为恢复高考的第一届考生,填报的所有志愿都与历史、中文、图书馆相关,最后被省内第一志愿四川大学历史系录取,从此“一辈子都在做这个”,对古籍积累下一份深厚的感情。
在汉典重光项目之前,陈力已经参与过古籍数字化项目。他曾经在国家图书馆工作18年,其中一半的时间分管古籍,经手过哈佛大学燕京图书馆的一个古籍数字化回归项目。2009年,燕京图书馆馆长郑炯文专门从美国飞到中国商量相关事宜,目录都筛选完成了,也做完了一部分书的扫描,但项目最终因为资金、技术等没能达到预期而搁浅。
这次未竟的合作在某种程度上成为汉典重光项目的起源。在哈佛大学访问期间,高晓
20万页古籍通过达摩院技术数字化“回归”,我国还有多少文物流落在外?
在最近的一段时间内,我们国家的文物回归有了重大的突破,达摩院通过当下的数字化技术成功将20万页的古籍收拢回归,让我们在新技术的加持下看到了古人的智慧。但在看到这让人惊叹的古籍之后,很多人都在想我国那些流落在外的文物,当下又过着怎样的光景?而又有多长的时间才能够回归到祖国的怀抱呢?
我们都知道在以前的中国物产丰腴,能工巧匠众多,因此有很多优秀的文物国宝流传,但随着侵略者的入侵在他们的硝烟与炮火的侵略下我们国家的很多国宝文物都被洗劫,流落海外,这其中最知名的就是十二生肖铜首,此外还有很多工艺精美的文物也辗转到了海外,这是中华大地炎黄子孙心中永远的一道伤疤。
总结近几年来我国以及世界其他国家追索海外流失文物的成功经验,不难得出这样的结论:促成海外文物的顺利回归不仅需要加强国际间的交流与合作,还需要国内各种制度设施的辅助和配合:不仅需要国家的支持与推动,还需要充分发挥民间组织和个人的积极作用。
要加强政府间的交流,在现有的国际法律框架内,通过外交谈判等手段达成双边或多边协议,以解决流失文物的回归问题。我国应该积极开展与相关国家政府间的沟通,尽可能就追索流失文物以及共同打击非法走私文物的犯罪活动等问题达成共识。注重与国际刑警组织的配合。具体而言,我国可以与国际刑警组织建立长期有效的合作机制向其提供有关我国珍贵流失文物的详细资料,充分发挥其在打击国际犯罪和进行司法鉴定方面的优势以实现我国海外流失文物的顺利回归。
在海外应当充分发挥当地华人团体,特别是华人律师团的作用。借助他们对当地法律的熟悉程度是诉讼实现其应有的效果,为我们成功维权提供强大的技术支持。 积极开展与世界各国的文化交流活动,通过国际文化传播的多种途径对我国的历史文化进行宣传,激发国外的文物持有者尊重历史、尊重中国的意识,促成其自发捐回文物的善举。
文物对于我们有非常重要的历史意义和文化意义,因此我们也希望文物能够更快的回归祖国的怀抱。
5月18日,一批珍藏于加州大学伯克利分校的中文古籍善本,以数字化方式回归故土,落地汉典重光古籍平台。借助阿里达摩院的技术,首批20万页古籍已完成数字化,并沉淀为覆盖3万多字的古籍字典,公众可通过汉典重光平台翻阅、检索古籍。据悉,达摩院AI对20万页古籍的识别准确率达到975%。
百度AI在国内属于什么水平?
绝对是一个第一流的前三名啊,这是一点问题没有的。不是传统的这个搜索,现在基本上来讲就是两大块。无人车也是挂在这个人工智能里头的,它剩下的那些边缘的东西基本上都砍掉了,这个公司的市值和你这个公司本身的这个技术水准其实未必是直线挂钩的,尤其是在中国这个市场,你这一个公司说白了,你这个业务线越多,你干的事业部越多,那你表面上,你的这个产值就高,用户人群也高,你不聚焦呀,然后你赶上现在红利期的时候,表面上觉得轰轰烈烈,但是一旦非红利期的时候不就不行了吗?
我国AI发展到什么程度了?
这几年AI企业爆发式增长,具体查查数据显示18年新增的AI企业比17年翻了一倍,达到了19,000家。19年比18年增长了70%达到了3万家,2020年上半年AI企业的数量突破了56万家。这背后AI正在下沉,沉到各行各业,成为传统生产力的一部分。为什么AI公司数量还在爆发式增长,因为现在大量的AI公司其实并不是受投资人追捧,有团队有技术的AI公司,他们更多是深入到各行各业,甚至有可能成为一些人眼里的伪AI公司,他们可能不掌握核心技术,重点是做服务搞商业。但伪AI公司的涌现正在说明在某些方面AI技术的门槛已在降低,基础已经建设到了一定程度。“旧时王谢堂前燕”的AI技术已成为标签元素,进入到了各种寻常百姓家。
中国AI在医疗方面优势巨大。
如今AI进到生物化学,药学,病理学,在这个医疗方面我觉得真的是开启了一个新的时代,在这一块我认为中国有巨大的优势,一种是它的新举国体制,而且他需要调动很多资源,比如说它的临床研究啊,那些医生医学,那需要原来做制药的公司也进来,基因测序的这些公司也进来,然后原来生物化学那些专家也进来,然后ai的人再进来。很少见全世界现在有哪个国家或哪个地方能够有这样的一个能力去调动这些资源,那我是看到中国的确有这样的一个能力,这个能力可能啊,我觉得我们有可能在这个领域可能比美国还要先进。我认为10年时间啊,有可能我们会走美国前面。
本文2023-08-08 10:02:40发表“古籍资讯”栏目。
本文链接:https://www.yizhai.net/article/48773.html