logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大数据之谷歌文件系统论文 GFS The Google File System

我们设计并实现了Google文件系统,这是一个面向大规模分布式数据密集型应用的可扩展分布式文件系统。它在廉价的通用硬件上运行,提供了容错性,并向大量客户端提供高聚合性能。尽管与先前的分布式文件系统有许多相同的目标,但我们的设计是通过观察我们的应用工作负载和技术环境(包括当前和预期的环境)驱动的,这反映了对一些先前文件系统假设的明显偏离。这使我们重新审视了传统选择并探索了根本不同的设计点。该文件系统

文章图片
#大数据
java 表单避免重复提交?

只有一个针对锁的获取:acquiretryAcquire传入信息。至于锁的释放,则交给实现者自己实现。首先,我们定义一个注解。/***//*** 缓存实现策略* @return 实现*/Class<?/*** key 生成策略* @return 生成策略*/Class<?/*** 密匙生成策略* @return 生成策略*/Class<?/*** 存活时间* 单位:秒* @return 时间*//

#java
java 如何实现开箱即用的敏感词控台服务?

sensitive-word-adminsensitive-word-admin 是基于 sensitive-word 实现的,一款开箱即用的敏感词控台服务。特性基本的 CRUD开箱即用的配置控台简单易用的 API 服务变更日志快速开始数据库脚本执行 mysql-5.7.sql 脚本。核心表如下:create table word(id int unsigned auto_increment co

#java
工作流引擎-17-开源审批流项目之 flowable workflow designer

本仓库通过 github pages 部署了静态页面,使用 jsdelivr 做 cdn ,国内访问也非常快速,所以你可以直接集成本仓库的页面,因为全部白嫖了 github 的资源,没有自己建服务器维护,所以不用担心资源失效问题。本组件对标的是 flowable 官方设计器,也就是实现 flowable 的 xml 规则标准,里面所用名词也都是官方文档中的专业术语。所以这个组件只是程序员在开发阶段

#开源
开源分布式系统追踪-01-Zipkin-01-入门介绍

Zipkin最初是为了在Cassandra上存储数据而构建的,因为Cassandra是可扩展的,具有灵活的模式,并且在Twitter中大量使用。如果要解决延迟问题或错误,可以根据应用程序,跟踪长度,注释或时间戳对所有跟踪进行筛选或排序。跟踪器存在于您的应用程序中,并记录有关发生的操作的时间和元数据。请注意,此页面已过期。一旦跟踪数据到达Zipkin收集器守护程序,它就会被Zipkin收集器验证,存

#java
分布式链路追踪-03-分布式系统跟踪工具,如何设计 span?

基本结构:Span ID 应该是一个足够长的唯一标识符,确保在分布式系统中每个 Span 的 ID 都是唯一的。Span ID 和 Trace ID:每个 Span 都应该有一个唯一的标识符(Span ID),用于在分布式系统中跟踪操作的传播路径。需要注意的是,保证顺序性往往会引入更多的复杂性和开销,而在分布式系统中,一般更关注全局唯一性和跟踪数据的完整性。这样,在同一节点上生成的 Span ID

#java
Neo4j GDS-11-neo4j GDS 库中相似度算法实现

Neo4j Graph Data Science (GDS) 库提供了丰富的相似度算法,覆盖从生产级到实验级的多种场景。以下是详细的算法分类、实现原理、参数配置、示例代码及适用场景分析。引用中的示例,计算用户间基于共同喜好的相似度。引用,用于电影推荐系统中的用户相似度计算。引用,适用于用户评分向量分析。

文章图片
#neo4j#算法#开发语言 +3
NLP segment-02-聊一聊关键词提取 keyword

随着深度学习的发展,基于模型的方法能够更加智能地结合上下文语义进行关键词提取。关键词提取有助于快速理解文档内容,并在信息检索、文本分类、摘要生成等任务中扮演重要角色。基于统计的方法主要依赖词频、词的位置等统计信息,比较适合无监督的关键词提取场景。为了便于大家学习,项目开源地址如下,欢迎 fork+star 鼓励一下老马~是从文本中自动识别出最能代表该文本主题的词或短语的过程。在自然语言处理(NLP

#java
工作流引擎-11-开源 BPM 项目 jbpm

它完全由 Java™ 编写,可运行在任何 JVM 上,同时也可在 Maven Central 仓库中获取。可以作为独立服务使用,也可以嵌入到自定义服务中。是一个用于构建业务应用程序的工具包,旨在帮助自动化业务流程和决策。是开源软件,遵循 Apache 软件许可证发布。

#开源
Neo4j GDS-01-graph-data-science 图数据科学插件库概览

该库作为 Neo4j 图数据库的插件,集成了图算法、图转换和机器学习管道功能,通过 Cypher 过程在数据库内部操作。Neo4j 官方构建的 GDS 包含闭源组件,而本仓库代码可独立构建为。预览版需手动安装,不会自动出现在 Neo4j Desktop 中。Neo4j 图数据科学库是 Neo4j 图算法库的继任者。通过 Pregel API 开发自定义算法(分支依赖未发布的库版本,需手动配置。:可

文章图片
#neo4j#数据库#算法 +1
    共 144 条
  • 1
  • 2
  • 3
  • 15
  • 请选择