
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
CHANGELOG5/5/2021,新增 Neural Snowball 方法7/15/2020,细致梳理知识抽取体系和信息抽取体系7/2/2020,Snowball 方法新增 pattern 置信度计算公式 RlogF 解析5/10/2020,初次发表。前言知识抽取是知识图谱构建的前置步骤,其中,关系抽取是建立图谱中实体关联的必经之路。而今,学术界往往倾向于结合最新的深度学习技术探索关系抽取效果
公众号 系统之神与我同在概述ProphetNet: 用序列到序列预测N-gram. EMNLP- Findings 2020增强版的知识注入模型来生成常识. COLING 2020.BANG: 结合大规模预训练的自回归和非自回归生成. ICML 2021Poolingformer: 集中注意力的长文档建模. ICML 2021EL-Attention: 记忆效率,无损的生成注意力. ICML 20
自然语言生成(NLG)技术利用人工智能和语言学的方法来自动地生成可理解的自然语言文本。NLG降低了人类和计算机之间沟通的难度,被广泛应用于机器新闻写作、聊天机器人等领域,已经成为人工智能的研究热点之一。首先,列举了当前主流的NLG的方法和模型,并详细对比了这些方法和模型的优缺点;然后,分别针对文本到文本、数据到文本和图像到文本等三种NLG技术,总结并分析了应用领域、存在的问题和当前的研究进展;进而
作者:杨夕链接:https://www.zhihu.com/question/451107745/answer/1801709801来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。命名实体识别用过的最实用、效果最好的技巧或思想可以看一下 这个【关于 NER trick】 那些你不知道的事github.com/km1994/NLP-Interview-Notes/bl
机器学习的成功很大程度上取决于数据。但是,高质量的标记数据通常很昂贵且难以获得,尤其是对于训练参数较多的模型。而我们却可以很容易地获取大量的无标记数据,其数量可能是标记数据的数千倍。为了解决标注数据较少的问题,我们要尽可能利用其无标注数据,一个常规的做法是自监督的预训练(self-supervised pre-training)。其目标是设计合理的自监督任务,从而使模型能从无标注数据里学得数据的信
背景介绍文本分类是NLP中的一个经典任务, 通常在大型的数据集进行一些预训练的模型在文本分类上可以取得很不错的成绩。例如word2vec, CoVe(contextualized word embeddings)和ELMo都取得了不错的成绩。Bert是基于双向transformer使用masked word prediction和NSP(next sentence prediction)的任务进行
知识图谱的皮相知识管理这个领域,有个分支叫语义网,这两年就改了名字叫知识图谱。知识图谱其实有狭义的和广义的区别。这里讲的是狭义的知识图谱。我觉得华东理工大学的王昊奋教授定义得挺好,抄在这里:知识图谱旨在描述真实世界中存在的各种实体或概念。其中,每个实体或概念用一个全局唯一确定的ID来标识,称为它们的标识符。每个属性-值对用来刻画实体的内在特性,而关系用来连接两个实体,刻画它们之间的关联。但我觉得,
公众号 系统之神与我同在前几个月参加了今年ccks(中国知识图谱与计算语义大会)任务四基于知识图谱问答的比赛:a榜第三 b榜出差去了 等回来的时候结束了 在这里写个分享知识图谱典型问题:问题:武汉大学出了哪些科学家查询语句:select ?x where {?x<职业><科学家_(从事科学研究的人群)>.?x<毕业院校><武汉大学>.}答案:"<
作者:鲁云龙链接:https://www.zhihu.com/question/267242467/answer/1827583493来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。其实题主说得很对:“如果神经网络自己能通过训练存储所有知识信息,也就没必要用知识图谱了”,但问题却提反了,应该说NLP是知识图谱的未来,而且这是必然的发展趋势。知识图谱本质上是一种结构化的
公众号 系统之神与我同在****内容:国内外医学知识图谱发展情况医学知识图谱的领域特征和应用需求数研院医学知识图谱构建医学知识图谱应用案例国内外医学知识图谱发展情况知识图谱概念广义概念:作为一种技术体系,指大数据知识工程的一系列代表性技术的总称。狭义概念:作为一种知识表示形式,知识图谱是一种大规模语义网络,包含实体、概念及其之间的各种语义关系。国外医学知识图谱:UMLSUMLS是美国国家医学图书馆







