说明:CAS是国科大的简称,KG是知识图谱的缩写,这个栏目之下是我整理的国科大学习到的知识图谱的相关笔记。
课程目标
教学安排
详情请见博客:CAS-KG——课程安排
什么是推理
知识推理的分类
归纳推理与演绎推理
归纳推理 (induction):归纳是从特殊到一般的过程。所谓归纳推理,就是从一类事物的大量特殊事例出发,去推出该类事物的一般性结论。我们熟知的数学归纳法就是归纳推理的一个典型例子。
演绎推理 (deduction):演绎是从一般到特殊的过程。所谓演绎推理,就是从一般性的前提出发,通过演绎(即推导),得出具体陈述或个别结论的过程。最经典的演绎推理就是三段论 (syllogism),它包括一个一般性原则(大前提)、一个附属于大前提的特殊化陈述(小前提),以及由此引申出的特殊化陈述符合一般性原则的结论。
演绎推理不仅仅局限于三段论,也不只是从一般到特殊的过程。它有着强烈的演绎特性,重在通过利用每一个证据,逐步地推导到目标或以外的结论,多被用于数学物理证明、思维推导等各类应用。
演绎推理与归纳推理的区别:
演绎推理是在已知领域内的一般性知识的前提下,通过演绎求解一个具体问题或者证明一个结论的正确性。它所得出的结论实际上早已蕴含在一般性知识的前提中,演绎推理只不过是将已有事实揭示出来,因此它不能增殖新知识。而相反,归纳推理所推出的结论是没有包含在前提内容中的。这种由个别事物或现象推出一般性知识的过程,是增殖新知识的过程。
确定性推理与不确定性推理
确定性推理:确定性推理大多指确定性逻辑推理,它具有完备的推理过程和充分的表达能力,可以严格地按照专家预先定义好的规则准确地推导出最终结论。但是确定性推理很难应对真实世界中,尤其是存在于网络大规模知识图谱中的不确定甚至不正确的事实和知识。
不确定性推理:
不确定性推理也被称为概率推理,是统计机器学习中一个重要的议题。它并不是严格地按照规则进行推理,而是根据以往的经验和分析,结合专家先验知识构建概率模型,并利用统计计数、最大化后验概率等统计学习的手段对推理假设进行验证或推测。不确定性推理可以有效建模真实世界中的不确定性。
逻辑推理和非推理推理
符号推理与数值推理
面向知识图谱应用的知识推理
知识图谱需要推理,主要体现在两种任务上:
基于规则的推理:精准+可解释
典型的推理规则:一阶谓词逻辑规则
规则对于推理的作用
归纳逻辑程序设计(Inductive Logic Programming, ILP)使用一阶谓词逻辑来进行知识表示,通过修改和扩充逻辑表达式来完成对数据的归纳。
FOIL算法
FOIL (First Order Inductive Learner) [Quinlan, 1990] 利用序贯覆盖实现规则的学习,其基本流程为:
FOIL规则评估
FOIL算法示例
利用FOIL算法找到定义目标谓词 DaughterOf 的规则
传统ILP问题 VS 知识图谱
传统ILP问题:
知识图谱:
扩展阅读:Neural Logic Machines
Neural Logic Machine (NLM), a neural symbolic architecture for both inductive learning and logic reasoning.
推理规则概述
规则:包含规则主体(body)和规则头(head)两部分
规则学习评估方法
AMIE:不完备知识库中的关联规则挖掘
AMIE (Association Rule Mining under Incomplete Evidence) [Galárraga et al., 2013] 支持从不完备的知识库中,挖掘闭式(closed)规则
AMIE规则评估
封闭世界假设 (Closed World Assumption):知识库中不存在的事实都是错误的
所以提出:
部分完整性假设 (Partial Completeness Assumption)
知识图谱中规则与关系路径
知识图谱中包含的仅仅是实体间的二元关系,因此规则与知识图谱中的关系路径存在对应关系。
路径排序算法
PRA (Path Ranking Algorithm) [Lao et al., 2011] 以实体间的路径作为特征,来学习目标关系的分类器。
加粗样PRA工作流程式
基于规则的直接推理
马尔可夫逻辑网 (Markov Logic Network) [Richardson and Domingos, 2006] 是将概率图模型与一阶谓词逻辑相结合的一种统计关系学习模型,其核心思想是通过为规则绑定权重的方式将一阶谓词逻辑规则中的硬性约束(hard constraints)进行软化。
绑定权重的规则示例
从马尔可夫逻辑网的定义出发,很容易得到一个图结构:
利用马尔可夫逻辑网对知识图谱进行建模后,我们可以:
概率软逻辑 (Probabilistic Soft Logic) [Kimmig et al., 2012]是马尔可夫逻辑网的进一步延伸,其最大优点是允许原子事实的真值可以在连续的 【0,1】 区间内任意取值,而不像马尔可夫逻辑网那样只能取 {0,1} 中的离散值。
概率软逻辑建模示例
给定一组原子事实和绑定权重的规则,概率软逻辑计算所有可能的原子事实真值取值 的概率分布。更形式化地,用 表示实例化的规则集合, ∈ 表示一条实例化规则,那么 的概率分布如下:
其中 是规则 的权重, 是连续型的马尔可夫随机场规范化因子, ∈ {1,2} 提供了两种不同的损失函数
利用概率软逻辑对知识图谱进行建模后,我们可以:
PSL推理应用示例:事件识别
事件触发词的歧义性问题
解决方法:同时考虑多层次信息对触发词进行消歧,包括深层局部信息和全局信息
事件识别方法
全局模块
前沿:Soft Reasoners over Language
知识库/知识图谱
推理模式
人类进行推理时,往往呈现出以下两个特点:
符号推理 VS. 数值推理
分布式知识表示
分布式知识表示(Knowledge Graph Embedding)的核心思想是将符号化的实体和关系在低维连续向量空间进行表示,在简化计算的同时最大程度保留原始的图结构
[Wang et al., 2017]。
基本步骤:
基于分布式知识表示的推理
评测任务与数据集
分布式知识表示方法分类
TransE模型的不足
TransE模型的改进
位移距离模型总结
计算实体和关系在隐式向量空间的语义匹配程度,以此来判断三元组成立的可能性
RESCAL及其变种
深度神经网络
语义匹配模型总结
模型训练
融合多元化信息的分布式知识表示
上述分布式知识表示方法仅用到了知识图谱中的三元组信息,还有多种其他类型的信息也被证实能够提升分布式知识表示的效果。
符号推理与分布式表示推理的比较
问题定义与现有两类方法
方法融合与动机
融合框架
前沿:基于表示学习获取推理规则
前沿:时序预测推理
前沿:低资源知识推理
One-shot relational learning for knowledge graphs, EMNLP 2018.
Meta relational learning for few-shot link prediction in knowledge graphs, EMNLP 2019
面向知识图谱应用的知识推理
知识推理的分类
推理规则概述
符号推理 VS. 数值推理
分布式知识表示
未来发展
符号表示与分别式表示融合知识体系
文章浏览阅读1.9k次,点赞5次,收藏6次。根据RFC 6455标准,Websocket协议提供了一种标准化的方式在客户端和服务端之间通过TCP连接建立全双工、双向通信渠道。它是一种不同于HTTP的TCP协议,但是被设计为在HTTP基础上运行。Websocket交互始于HTTP请求,该请求会通过HTTPUpgrade请求头去升级请求,进而切换到Websocket协议。我们可以看到在该请求报文中有两个特殊的请求头,一个是Upgrade请求头,代表升级为websocket协议。还有一个是Connection请求头,代表升级连接。_qwebsocket的唯一标识
文章浏览阅读3.5k次。将hive数据 查询出结果保存在hdfs set mapred.reduce.tasks = 1;set mapred.job.name=recommend_$idate;insert overwrite directory '/user/client/' ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t'select * from t..._经过hive计算后,写入到hdfs中的统计数据,想要展现给用户,最佳方式是什么
文章浏览阅读2.5k次。gitHop地址https://github.com/wechatpay-apiv3/wechatpay-apache-httpclientimport cn.hutool.json.JSONObject;import com.fasterxml.jackson.databind.ObjectMapper;import com.fasterxml.jackson.databind.node.ObjectNode;import com.vworld365.common.exception.Req_wechatpay-apache-httpclient 连接池
文章浏览阅读802次,点赞14次,收藏6次。Java基础课(卡码网):队列
文章浏览阅读3.2k次,点赞3次,收藏14次。转载PCA(Principal Component Analysis,主成分分析)是一种常用的数据分析方法。PCA通过线性变换将原始数据变换为一组各维度线性无关的表示,可用于提取数据的主要特征分量,常用于高维数据的降维。PCA主要步骤:设有m条n维数据:1)将原始数据按列组成n行m列矩阵X2)将X的每一行(代表一个属性字段)进行零均值化,即减去这一行的均值3)求出协方差矩阵4)求出..._离散kl变换降维步骤
文章浏览阅读102次。面向对象 Object Oriented概述面向过程分析出解决问题的步骤,然后逐步实现。例如:婚礼筹办– 发请柬(选照片、措词、制作)– 宴席(场地、找厨师、准备桌椅餐具、计划菜品、购买食材)– 婚礼仪式(定婚礼仪式流程、请主持人)公式:程序 = 算法 + 数据结构优点:所有环节、细节自己掌控。缺点:考虑所有细节,工作量大。面向对象找出解决问题的人,然后分配职责。例如:婚礼筹办– 发请柬:找摄影公司(拍照片、制作请柬)– 宴席:找酒店(告诉对方标准、数量、挑_界面使用控制台输出显示。识别对象:界面视图类、逻辑控制类、数据模型类分配
文章浏览阅读1.8k次。本文主要展示如何用flask实现token验证及跨域问题,本文主要参考文章为:Flask实现token认证 - 简书但基于此,更详细的实现了包括解决频繁options问题、全局请求token验证问题。run.pyfrom flask import Flask, g, jsonify, redirect, request, make_responsefrom flask_httpauth import HTTPBasicAuthfrom itsdangerous import Ti.._flask options
文章浏览阅读2.8k次。服务端管理员调用的接口没有鉴权,且将内容直接拼接到执行的命令,没有做过滤。_cve-2023-33246
文章浏览阅读1.1k次。第一种方法 使用response.Redirect : Dim filename filename=request("file") response.Redirect "/images/" & filename & ".jpg" %> 第二种方法 使用server.createObject("ADODB.Stream"): Re_asp 隐藏 原图片地址
文章浏览阅读3k次,点赞3次,收藏20次。通过网线连接获取树莓派ip地址_树莓派网线连接电脑查看ip
文章浏览阅读1.7w次,点赞29次,收藏96次。Linux之Mysql安装配置第一种:通过yum安装配置Mysql(简单)第二种:Linux离线安装Mysql(较难)一、通过yum安装Mysql1. 第一步 下载下载地址:https://dev.mysql.com/downloads/repo/yum/········或········· http://repo.mysql.com#使用wget下载mysqlwget http://repo.mysql.com/mysql80-community-release-el7.rpm_linux安装mysql命令
文章浏览阅读1.3k次。https://blog.csdn.net/heyijia0327/article/details/45567373_ros发布和订阅在一个节点