logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Python库-FuzzyWuzzy使用介绍

FuzzyWuzzy是一个 Python 库,旨在提供模糊字符串匹配的功能。它能够比较两个字符串之间的相似度,即使它们在拼写或格式上略有不同。通过使用各种算法和方法,如基于字符、基于单词的匹配,以及部分匹配和排序匹配等技术,FuzzyWuzzy 能够有效地处理文本数据中的拼写错误、近义词和重复项。这使得它在数据清洗、搜索功能、自动完成和信息抽取等场景中非常实用。FuzzyWuzzy 提供了简单易用

文章图片
#python#网络#服务器
大模型之-Seq2Seq介绍

Seq2Seq(Sequence to Sequence)模型在文本摘要任务中的应用与其在机器翻译中的应用有很多相似之处。文本摘要的目标是从一个长文本中生成一个简短的、语义上等价的摘要。与机器翻译类似,Seq2Seq模型通过编码器和解码器的组合来实现这个任务。编码器(Encoder)编码器将输入的长文本编码成一个固定长度的上下文向量(Context Vector)。通常使用递归神经网络(RNN)、

文章图片
#语言模型#机器学习#机器翻译
greenplum(gp)postgre清理pg_xlog释放空间

​greenplum数据库在大量数据更新时,会产生大量的pg_xlog,造成磁盘空间占用;系统长时间运行后,pg_log文件夹下日志文件也会越来越大,合理的做法是日志文件的磁盘和数据目录挂载在不同的磁盘路径下或者磁盘扩容;若在同一路径下,可将日志文件备份到其他路径,腾出一部分空间,或清理pg_xlog【注意】:可以看到当前数据目录下pg_xlog 193M大小实际上集群的每个数据存储节点上都会存在

#postgresql#数据库#大数据
图数据库Nebula_Graph界面工具安装与使用

NebulaGraph Studio是一款可以通过 Web 访问的开源图数据库可视化工具,是 Nebula Graph 官方提供的图形用户界面(GUI)工具,它提供了更直观的方式来管理和查询图数据库。Nebula Studio 支持可视化的模式管理、数据查询、图可视化、数据导入导出等功能,使用户能够更轻松地操作数据库。Nebula Graph Dashboard 是 Nebula Graph 数据

文章图片
#数据库#大数据#数据分析
深入理解窗口函数和使用介绍

想象一家咖啡馆,里面有一堵特殊的墙,我们称之为“洞察之墙”。这堵墙背后有一个魔法窗户,这就是窗口函数。这个窗户可以让你透过它去看到一系列的数据,但是你可以使用特殊的工具,比如望远镜和魔法棒,来查看和分析这些数据。现在,让我们来看看这些工具的具体用途:1. **望远镜 - RANK、DENSE_RANK、ROW_NUMBER:** 想象你站在窗户前,你可以通过使用望远镜,看到墙上的标识。这些标识告诉

文章图片
#大数据#数据分析#数据仓库 +1
azkaban简介及azkaban部署、原理和使用介绍

azkaban简介及azkaban部署、原理和使用介绍azkaban简介​Azkaban是一套简单的任务调度服务,整体包括三部分webserver、dbserver、executorserver。​Azkaban是由Linkedin开源的一个Java项目,批量工作流任务调度器。用于在一个工作流内以一个特定的顺序运行一组工作和流程。​Azkaban定义了一种KV文件格式来建立任务之间的依赖关系,并提

#大数据#运维
机器学习的分类

机器学习是人工智能的一个分支,它使计算机系统能够从数据中学习并做出决策或预测。机器学习(Machine Learning)是一种基于数据驱动的方法,旨在通过自动化的统计模型和算法从数据中学习和提取模式,以进行预测、分类和决策。其核心思想是通过训练数据构建模型,使其在面对新数据时能够准确进行预测和分类。

文章图片
#机器学习#人工智能#算法 +1
Presto简介、部署、原理和使用介绍

​Presto是由Facebook开发的一款开源的分布式SQL查询引擎,最初于2012年发布,并在2013年成为Apache项目的一部分;Presto 作为现在在企业中流行使用的即席查询框架,已经在不同的领域得到了越来越多的应用。Presto官方网站:https://prestosql.io/​Presto被广泛用作即席查询引擎,用户可以使用标准的SQL语句向Presto提交查询,并且能够在几秒钟

文章图片
#大数据#数据库#数据仓库 +1
Python-FastAPI框架使用介绍

FastAPI 关键特性1. **快速高效**:基于 Starlette 和 Pydantic 构建,具有高性能和低延迟的特点,支持异步处理请求,利用 Python 的协程提高并发性能。2. **简单易用**:使用标准的 Python 类型注解来定义 API 的输入和输出参数,无需编写大量的文档和验证代码。3. **自动生成文档**:通过访问 `/docs` 路径可以查看自动生成的交互式 API

文章图片
#python#fastapi#开发语言
Nextcloud私有云盘-重新定义云存储体验

​Nextcloud是一个开源的云存储和协作平台,旨在为个人用户、企业和团队提供安全、隐私保护的数据存储和共享解决方案。它允许您在不同设备之间同步、共享文件,提供了强大的协作工具和应用生态系统。:通过Nextcloud,您可以轻松地在不同设备之间同步和共享文件。无论是照片、视频、文档还是其他文件类型,都可以方便地访问和共享。:Nextcloud致力于保护您的数据安全和隐私。它提供端到端加密功能,确

文章图片
#云原生
    共 41 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择