logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

雪花算法和uuid比较

​SnowFlake算法,是 Twitter 开源的分布式 id 生成算法。其核心思想就是:使用一个 64 bit 的 long 型的数字作为全局唯一 id。在分布式系统中的应用十分广泛,且ID 引入了时间戳,基本上是保持自增的。​由于在Java中64bit的整数是long类型,所以在Java中SnowFlake算法生成的id就是long来存储的。

文章图片
#java#数据库#分布式
大数据系统与大规模数据分析学习笔记(相似度计算)

大数据系统与大规模数据分析学习笔记(相似度计算)​寻找相似项过程:1.Jaccard相似度​定义 Jaccard 相似度计算公式:J(A,B)=(A交B)/(A并B)2. shingling将文档用短字符集合来表示2.1 k-shinglecharacter 级别:包括空格word 级别:不包括空格和逗号句号符2.2 k 值大小的选择如果文档由邮件组成,那么选择 k = 5 比较合适。如果文档比较

文章图片
#数据分析#学习#数据挖掘
图神经网络学习笔记

点(vertex)、边(edge)、全局图(global),图神经网络(GNN,Graph Neural Network)主要作用还是跟传统神经网络的作用一样——每次每个点通过周围点迭代更新自身权重,随着迭代,图神经网络的感受野会越来越大,慢慢的每个点会拥有全局图的特征。图卷积神经网络与卷积神经网络就像老婆与老婆饼、java和javascrit的区别,原理几乎完全不一样,,哪怕100个输入数据格式

文章图片
#pytorch#nlp#transformer
图神经网络关系抽取论文阅读笔记(五)

模型的整体架构如下图所示。r^=arg⁡max⁡r∈Rp(r∣A−GCN(X,TX))r=r∈Rargmax​p(r∣A−GCN(X,TX​))其中Tx是从现成的工具包中获得的x的依赖树,R是关系类型集;P计算给定两个实体的特定关系r的概率,而是r以X和Tx为输入的A-GCN的输出。本文提出了利用依赖信息进行关系提取的A-GCN方法,即对依赖连接应用注意机制,对连接和类型同时施加权重,

文章图片
#论文阅读#深度学习
国科大大数据系统与大规模数据分析课程第一次作业(hash distinct)

大数据系统与大规模数据分析第一次作业一、作业内容从HDFS中读出数据对读出的数据进行hash去重将处理好的数据存入Hbase二、作业代码import java.util.*;import java.util.regex.Matcher;import java.util.regex.Pattern;import java.io.*;import java.net.URI;import java.ne

文章图片
#java#hadoop#hbase +1
分布式图计算系统与算法简单文献综述

​引言图作为计算机领域一个很重要的数据结构,很多软件算法都是基于图来实现的,随着人们对算力要求的越来越高,硬件算力也已到达瓶颈,单机的图计算系统已经不能满足巨大的计算需求,因此,分布式图计算系统的研究也变得越来越火热。本文简单介绍了当前主流分布式图计算系统和算法的发展历程,并对比了不同分布式图计算框架的优缺点及差异,文章最后在分布式图计算系统与算法领域作了简要总结。......

文章图片
#分布式#hadoop#mapreduce +1
天猫复购预测训练赛技术报告

逻辑回归[1](Logistic Regression,LR)是一种广义线性回归(Generalized Linear Model),在机器学习中是最常见的一种用于二分类的算法模型。决策树[2](Decision Tree,DT)是一种基本的分类与回归方法,本文主要讨论分类决策树,决策树模型呈树形结构,在分类问题中,表示基于特征对数据进行分类的过程。随机森林[3]

文章图片
#数据挖掘#随机森林
JVM快速入门学习笔记(三)

栈是运行时的单位,Java 虚拟机栈,线程私有,生命周期和线程一致。描述的是 Java 方法执行的内存模型:每个方法在执行时都会创建一个栈帧(Stack Frame)用于存储局部变量表、操作数栈、动态链接、方法出口等信息。每一个方法从调用直至执行结束,就对应着一个栈帧从虚拟机栈中入栈到出栈的过程。

文章图片
#jvm#学习#java
到底了