logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

基于知识图谱的电影自动问答系统(一)知识的获取与存储

引言这学期上自然语言处理课,老师需要我们合作完成一项大作业。当时的我早已对知识图谱感兴趣,有种跃跃欲试的冲动,正好逢上这样的一次机会。初生牛犊不怕虎,我就报上了“基于知识图谱的电影自动问答系统”。后来才发现,这项目的难度真的挺大,要做好不容易呀。关于本体、知识库、知识图谱本体(Ontology),是知识库本身的存在。维基百科的定义是“a formal naming and defini

#知识图谱#自然语言处理
社区划分算法

简介  使用许多互联网数据,我们都可以构建出这样的网络,其节点为某一种信息资源,如图片,视频,帖子,新闻等,连边为用户在资源之间的流动。对于这样的网络,使用社区划分算法可以揭示信息资源之间的相关性,这种相关性的发现利用了用户对信息资源的处理信息,因此比起单纯使用资源本身携带的信息来聚类(例如,使用新闻包含的关键词对新闻资源进行聚类),是一种更深刻的知识发现。网络社区划分的两种主要思路社区划分的算法

关于spark的mllib学习总结(Java版)

本篇博客主要讲述如何利用spark的mliib构建机器学习模型并预测新的数据,具体的流程如下图所示:加载数据对于数据的加载或保存,mllib提供了MLUtils包,其作用是Helper methods to load,save and pre-process data used in MLLib.博客中的数据是采用spark中提供的数据sample_libsvm_data.txt,其有一百个数据

#spark#机器学习#java
关于python,数据挖掘,自然语言处理的一些学习资源

使用Python分析社交网络数据Python集合(set)类型的操作朴素贝叶斯算法的python实现方法机器学习算法与Python实践之(四)支持向量机(SVM)实现Yaha分词库示例数据挖掘之Apriori算法详解和Python实现代码分享django+haystack+whoosh+分词库=搜索站

#python#自然语言处理#数据挖掘
关于python操作mysql

安装mysqldb包sudo apt-get install MYSQL相关编程代码conn = MySQLdb.connect(host='127.0.0.1',port=3306, user='root',passwd='iiip', db='moviedb',charset='utf8')cur = conn.cursor()sql = "select movie_id from movi

#mysql#python
到底了