会议交流 | WISA2023-知识图谱与大模型论坛

知识图谱和大型语言模型都是用来表示和处理知识的手段。大模型补足了理解语言的能力，知识图谱则丰富了表示知识的方式，两者的深度结合必将为人工智能提供更为全面、可靠、可控的知识处理方法。第二十届CCF中国信息系统及应用大会(WISA 2023) 知识图谱与大模型论坛邀请了五位优秀学者进行分享，他们将带来知识图谱与大模型领域的最新研究进展，并对知识图谱与大模型的融合之道展开深入探讨。WISA 2023是中

开放知识图谱

1282人浏览 · 2023-09-14 17:20:55

开放知识图谱 · 2023-09-14 17:20:55 发布

WISA 2023是中国计算机学会（CCF）主办、CCF信息系统专业委员会和四川大学共同承办的旗舰会议（会议编号：CCF-TC-23-077），将于2023年9月15-17日在四川成都召开。

大会将围绕“数智共生与信息系统”主题，关注数智共生、智慧信息系统、数字化转型与信息系统安全等领域，聚焦元宇宙、知识图谱、区块链等关键问题，搭建学术、企业、政府交流平台。会议将邀请信息系统关键技术领域的资深专家做主题报告，分享最新的前沿技术与产业热点。会议期间，还将组织专题论坛、企业前沿论坛、专委沙龙等活动，力求全方位地扩大交流范畴，拓展交流形式，提升交流效果。

大会热忱欢迎从事信息系统及相关领域的专家、学者、学生和专业技术人员踊跃投稿和与会交流。

会议网站

https://conf.ccf.org.cn/wisa2023

论坛议程

特邀嘉宾

王昊奋同济大学特聘研究员

个人介绍：王昊奋，上海交大博士、上海市优秀博士，同济大学百人计划特聘研究员，博士生导师。其研究兴趣及专长是知识图谱、自然语言处理、对话式用户交互、智能内容生成。他是全球最大的中文开放知识图谱联盟OpenKG发起人之一。出版了《自然语言处理实践》《知识图谱方法、实践与应用》等著作。他还受邀在世界人工智能大会等诸多国际与国内智能峰会上担任讲者，并在自然语言处理国内顶级会议NLPCC多次担任知识图谱方向主席，长期作为ISWC, WWW, AAAI等人工智能国际顶级会议程序委员会委员。负责参与10余项国家自然科学基金、863重大专项、科技部科技支撑、经信委和科委等AI相关项目，共发表100余篇AI领域高水平论文。长期在一线人工智能公司担任CTO之职，荣获徐汇区学科带头人人才计划。他构建了全球首个可交互养成的虚拟偶像—“琥珀·虚颜”；所构建的智能客服机器人已累计服务用户超过10亿人次，并成功入选中国人工智能产业发展联盟最佳AI应用案例。目前，他担任中国计算机学会术语工委副主任，SIGKG主席，上海秘书长，中国中文信息学会理事，语言与知识计算专委会副秘书长，上海市计算机学会自然语言处理专委会副主任，上海交通大学AI校友会秘书长等社会职位。

演讲题目：增强大语言模型关键技术与应用泛式

报告摘要：随着chatGPT的兴起，大语言模型进入百模大战。然而，其幻觉，成本贵等局限限制其在各个行业广泛落地。本次报告将重点介绍各种大模型增强技术，包括：提示工程是引导大模型准确输出的关键要素之一；为了避免大模型的“一本正经胡说八道”，知识和检索增强是使能技术；大模型已经已经进化为智能体，各种数据和服务的编排和路由是通往智能中控的核心手段；多模态是未来的趋势，通过大模型作为桥梁可以关联感知和决策，并最后结合具身智能做到虚实融合。最后，围绕应用落地，分析大模型+和+大模型两种不同的演进路线，以及不同的产业落地和生态。

程龚南京大学教授

个人介绍：程龚，南京大学教授，入选国家级青年人才计划。研究兴趣包括知识图谱、信息检索、神经符号推理等技术，并应用于知识计算平台、数据搜索引擎、问答系统等。主持国家重点研发计划、国家自然科学基金等资助的多个项目课题，获ISWC等国际会议最佳论文奖或提名6次，担任过ISWC短文程序委员会主席、CCKS程序委员会主席等职务。

演讲题目：开放知识图谱的搜索引擎构建

报告摘要：在万维网上可以获取到越来越多的结构化数据（包括知识图谱），如何从海量的开放数据中找到有用的部分？这就需要专用的数据搜索引擎提供支持。本报告将对数据搜索引擎的构建做出一些思考，并介绍我们团队的最新研究进展。

陈玉博中国科学院自动化研究所副研究员

个人介绍：陈玉博，中科院自动化所副研究员，研究方向为自然语言处理和知识图谱，在ACL、EMNLP、AAAI 等国际重要会议和期刊发表学术论文40 余篇，Google Scholar引用量4500余次，其中两篇论文入选ACL、EMNLP高影响力论文（Paper Digest评选），曾获多次最佳论文奖（NLP-NABD 2016、CCKS 2017、CCL 2020、CCKS 2020）。出版学术专著两部《知识图谱》、《知识图谱：算法与实践》，由人工智能学会推荐入选十三五国家重点图书出版规划教材。连续多年在中国科学院大学主讲《知识图谱》课程，2021 年获得中国科学院大学优秀课程。主持国家自然科学基金面上项目、青年基金项目，参与国家自然科学基金重点项目、2030新一代人工智能重大项目、重点研发计划课题。主持研发的信息抽取和知识图谱构建系统多次获得国际/国内学术评测冠亚军。入选2020 年第五届中国科协青年人才托举工程、2022 年全球华人AI 青年学者、2022 年中国科学院青年创新促进会会员、2022北京智源人工智能青年科学家俱乐部，担任中国中文信息学会青年工作委员会秘书长、COLING 2022领域主席、Data Intelligence编委等。获2018 年中国中文信息学会“钱伟长中文信息处理科学技术奖”一等奖，2019 年度北京市科学技术进步奖一等奖。

演讲题目：预训练语言模型中的知识分析、萃取与增强

报告摘要：近年来，大规模预训练语言模型在知识密集型的自然语言处理任务上取得了令人瞩目的进步。这似乎表明，预训练语言模型能够自发地从语料中学习大量知识，并隐式地保存在参数之中。然而，这一现象的背后机理仍然萦绕着许多谜团。语言模型究竟掌握了哪些知识，如何提取和利用这些知识，如何用外部知识弥补模型不足，这些问题都亟待进一步探索。该报告将重点介绍预训练语言模型知识分析、知识萃取、知识增强等领域的基础知识和近期研究进展。

赵森栋哈尔滨工业大学副教授

个人介绍：赵森栋，哈尔滨工业大学副教授/博生导师，担任哈工大智慧医疗研究所所长助理。康奈尔大学博士后，伊利诺伊大学香槟分校联培博士。担任《Frontiers In Big Data》的编委，并在IBM Waston Xprize担任Red Judge。他还是Nature Communications等多个国际顶级期刊和会议的审稿人和程序委员会成员。他的研究领域主要聚焦自然语言处理、大语言模型、健康智能和新药发现。他参与了多项重要的国家级项目，包括国家973项目和科技创新2030-"新一代人工智能"等。他开发的中文医学大模型“本草”在GitHub上获得了3600多个星标，反映了其工作的影响力和公众的广泛关注。至今，他已经在相关领域发表了40余篇学术论文，其中包括在AAAI、IJCAI、ACL、WSDM、ICDM、CIKM、EMNLP、COLING等国际顶级会议以及Briefing in Bioinformatics、IEEE TKDE、Bioinformatics、IEEE J-BHI等国际顶级期刊上发表的论文，并获得了ACL 2023最佳论文提名奖的荣誉。

演讲题目：大语言模型的微调技术

报告摘要：大语言模型，如GPT系列模型，在各种自然语言处理任务中表现卓越。为了使这些模型更适应特定应用场景，研究人员通常采用一种被称为“微调”的技术。微调是在大规模数据集上预训练模型然后在特定任务的小型数据集上进行精细化训练的技术。本报告将深入探讨大语言模型的“微调”技术，包括指令微调、提示微调、低秩适配微调、知识微调等技术。我们将详解这些微调方法的原理，以及它们在现实世界任务中的应用。在指令微调中，我们将讨论如何通过嵌入特定的指令，使模型在执行任务时表现出更强的定向性。而在提示微调部分，我们会解析如何通过精心设计的提示，激发模型的潜力，以更高效地处理各类问题。在低秩适配微调中，我们将讨论如何利用低秩适配的方法做到在使用大模型适配下游任务时只需要训练少量的参数即可达到一个很好的效果。在知识微调中，我们将讨论由我们提出的如何潜入领域知识把通用模型转变成领域行业模型的技术方法。此外，面对不断变化的自然语言处理领域，微调技术的发展也在持续进行。我们将探讨微调技术的未来趋势，其中包括基于元学习的微调、低资源微调策略，以及使用迁移学习进行跨领域微调等。

张文浙江大学特聘研究员

个人介绍：张文，浙江大学软件学院特聘研究员，研究方向为知识图谱、图数据处理、大数据系统。在包括NeurIPS/KDD/WWW/IJCAI/AAAI/ICDE/ACM MM/WSDM等在内的国际顶级会议上发表多篇论文。主持浙江省自然科学基金项目。曾获国际知识图谱联合会议IJCKG最佳论文奖、最佳应用论文奖，浙江省科技进步二等奖等奖励。入选副省级市高层次人才引进计划、百度2023年度AI华人女性青年学者榜。

演讲题目：知识图谱结构预训练方法

报告摘要：知识图谱中实体和实体之间的关系可以组成一张有标签的有向图，这图中蕴含着丰富的模式和信息，基于结构的学习可以使算法具有预测未知连接的推理能力，既然图结构中蕴含如此丰富的信息，那么我们是否可以对图结构进行预训练并使模型学习到的结构知识迁移至未知的场景呢？在本报告中，我将基于团队的最新研究进展，介绍我们对知识图谱结构预训练方面的思考。

点击阅读原文，进入WISA 2023官网报名。

OpenKG

OpenKG（中文开放知识图谱）旨在推动以中文为核心的知识图谱数据的开放、互联及众包，并促进知识图谱算法、工具及平台的开源开放。