知识图谱的提升Google搜索效果

栏目:古籍资讯发布:2023-10-19浏览:3收藏

知识图谱的提升Google搜索效果,第1张

Knowledge Graph从以下三方面提升Google搜索效果:

1、找到最想要的信息。

语言可能是模棱两可的 —— 一个搜索请求可能代表多重含义,Knowledge Graph会将信息全面展现出来,让用户找到自己最想要的那种含义。现在,Google能够理解这其中的差别,并可以将搜索结果范围缩小到用户最想要的那种含义。

2、提供最全面的摘要。

有了Knowledge Graph,Google可以更好的理解用户搜索的信息,并总结出与搜索话题相关的内容。例如,当用户搜索“玛丽·居里”时,不仅可看到居里夫人的生平信息,还能获得关于其教育背景和科学发现方面的详细介绍。此外,Knowledge Graph也会帮助用户了解事物之间的关系。

3、让搜索更有深度和广度。

由于Knowledge Graph构建了一个与搜索结果相关的完整的知识体系,所以用户往往会获得意想不到的发现。在搜索中,用户可能会了解到某个新的事实或新的联系,促使其进行一系列的全新搜索查询。

  通过创建属性库,顶点类型,边类型,索引类型,实现图模型的构建与管理,平台提供列表模式和图模式两种模式,可实时展示元数据模型,更加直观。同时还提供了跨图的元数据 复用功能 ,省去相同元数据繁琐的重复创建过程,极大地提升建模效率,增强易用性。

  在元数据管理中,需要先创建属性,再进行定点类型、边类型的创建。属性支持single、list、set三种基数, 属性一旦创建无法通过可视化交互形式修改,顶点、边中的属性也不支持删除操作。

  通过创建导入任务,实现导入任务的管理及多个导入任务的并行运行,提高导入效能

  数据导入目前仅支持csv格式的数据,可中途保存设置,导入过程中提供数据约束——边连接的顶点是否存在的检查。

  支持Apache TinkerPop3的图遍历查询语言 Gremlin ,除了查询之外还可实现顶点/边的创建及删除、顶点/边的 属性修改 等。

  除了全局的查询外,可针对查询结果中的顶点进行深度定制化查询以及隐藏操作,实现图结果的定制化挖掘。

  元数据管理中的编辑功能较弱,一旦新建后的顶点、边、属性通过可视化交互形式只能实现新增,无法修改。可以直接全部删除顶点、边、属性,或通过查询语言进行顶点/边的属性修改。 这一点是Nebula的优势(对属性的修改不改变已入库数据,比如删除某个属性后数据仍在,只是可视化不见了;改变属性类型如由string改int不报错,已入库的数据仍是string类型),不过Huge的顶点、边的管理操作相对清晰一点。

  元数据管理提供图可视化模块,提供元数据复用板块,已建的元数据可以通过一键复用功能实现拷贝粘贴,减少重建工作量。(该元数据创建模块如果是通过查询语言构建,该部分可以通过查询语言复制粘贴实现)

  没有可视化的查询交互,但是提供了关于节点的部分可视化查询交互。

古籍版本的种类主要有: 写本是用手写成书的本子,包括:写本、稿本、影抄本、传抄本等。 刻本又分官刻本、私人刻本、坊刻本三大类。官刻本是指历史上各朝代中央和地方的机关衙署及其附属机构刻印的本子私人刻本也称“家刻本”,包括个人、家族和家塾刻本等。坊刻本是指以刻印书籍为营业的书坊所刻印的本子,刻书中的牌记有“书坊”“书林”“书籍铺” “经籍铺” 等名称,书目中亦有称之为“书棚”的。按区域划分, 刊刻古籍著名的有浙本、 闽本、蜀本之称。 活字本包括:“木活字本”、“铜活字本”、“泥活字本” 等。 金属活字印本还有锡活字本、铅活字本、铁活字本等。 其他有复刻本,亦称“影刻本”、“翻刻本”,还有写刻本、套印本、彩色印本、公文纸背印本、批校本等。 鉴别古籍版本的方法 ①对原书所具有的记载、特征和其在成书后流传过程中所形成的记录资料进行考察。一般从书名叶、牌记、序跋,采用的字体、行款,以及批校、题跋、藏章、装订格式,所附的刻工记录,书中避讳字考查。例如:清陆心源著《宋楼藏书志》书名叶,前半叶刻“宋楼藏书志 曲园居士俞樾题”,后半叶刻“光绪八年壬午冬月十万卷楼藏版”,据此可知刊刻者和版刻年月。 又如: 北宋刻本,字体刚劲硬整,南宋刻本字体渐趋圆润,元代刻本字多“软体”,明代刻本多尚楷体,明末至清的刻本形成横细竖粗的印刷字体,这仅是宋至清刻本字体衍变的轮廓,实际变化繁复得多,要细加区别。②通过书目著作考查鉴别古籍。考查书的刊行流通情况,现存各种版本情况,历史文献记载,或考查原书与历史所记载各本异同及其特点,单凭文献记载和文字材料,不能看到古籍原状,在判断上受到局限,可利用古籍书影图谱帮助识别。对前人有关图书的记述(如书目、论著等)要经过分析研究论证,其中有些可能是考查不周或论断有误的,从而作出适当、准确的辨识。③从不同的制版工艺所形成的版本特征来加以鉴别。 古籍版本大致可分写本和印本两大类 ( 捶拓、铃印的图籍不计在内 ),以印本为多数,印本中以木版雕刻印本为多。例如:刻本字迹锋芒棱角完整清晰,说明此本印成较早;字迹锋芒尽失,漫灭残损, 版片断裂,说明是较晚的印本,等等。④鉴别古籍要注意伪本。古籍不仅具有文化学术价值, 且具有历史文物和艺术价值,但在社会流传过程中它又是商品,因而产生一些投机的书商和“伪造者”。例如:以残充全,将原来有残缺的书加以裁改修补,充作完整的书;加盖伪章,冒充原书为著名人物收藏或“加工”(如批校等)的珍本;挖改描补,把较晚的刻本经过挖改、描补等,充为早期刻本或少见的“珍本”;撕去原书序跋,藉以伪充前代旧刻古本,等等。 鉴别版本需要不断实践, 反复考查,增加感性知识,积累经验,争取多看实物,以书影图谱作研究的补充和参考,逐步做到确切了解和掌握。

知识图谱的提升Google搜索效果

Knowledge Graph从以下三方面提升Google搜索效果:1、找到最想要的信息。语言可能是模棱两可的 —— 一个搜索请求可能代表多重含义,Kno...
点击下载
热门文章
    确认删除?
    回到顶部