logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Docker错误及解决方法汇总

环境说明:系统环境;CentOS 7(极简版,装在虚拟机上的)docker版本:19.03.101.运行docker images报错提示“Cannot connect to the Docker daemon at ****, Is the docker daemon is running”出现这个错误是因为docker没有启动。启动docker之后再运行一遍就OK了。具体如下:2. docke

Tensorflow:张量(Tensor)的创建及其基础操作

Tensorflow中所有的运算操作都是基于张量进行的。Tensorflow中的张量Tensor是具有统一类型的多维数组。

#tensorflow#深度学习
MAC+Anaconda+Pyspark安装配置

到Apark Spark官网上下载Spark文件,无论是windows系统,还是MAC系统,亦或者Linux系统,都可以下载这个文件(独立于系统)。

#自然语言处理#概率论
LLM:检索增强生成(RAG)

其基本思想是利用信息检索的技术,从大规模语料库(存储在向量数据库)中检索出与当前任务相关的文本片段,并将这些文本片段作为输入提供给生成模型,以引导生成模型产生更准确、更相关的文本输出。通过预训练的方式,GPT模型能够学习得到通用的文本表示,从而在各种自然语言处理任务中表现出色,包括文本生成、文本分类、问答等。简单地说,嵌入(Embedding)思想可以视为一种尝试通过用向量来表示所有东西的“本质”

线性回归:异方差检测及其处理方法

异方差性的存在,会对回归模型的正确建立和统计推断带来严重后果。首先,在异方差情况下,所有与参数估计量方差有关的相关计算都会受到影响。

#线性回归#回归
Kettle: 插入/更新、表输出及表输入

1. 插入/更新按照官方资料说明,插入/更新实现的功能只有两个:依据查询关键字段,将未被发现的行记录插入到表中。如果行记录在表中被找到,则比较需更新的字段,若更新字段不一致,则进行更新操作。在MySQL中构建连个表personal_a和personal_b,其创建语句及原始数据如下。使用Kettle将personal_a中的数据插入更新到personal_b中。create table `pers

如何确定K-means算法中的k值?

k-means算法是机器学习中常用的聚类算法,原理简单实现容易,内存占用量也比较小。肘部法所使用的聚类评价指标为:数据集中所有样本点到其簇中心的距离之和的平方。但是肘部法选择的并不是误差平方和最小的。轮廓系数是一种非常常用的聚类效果评价指标。先利用sklearn.datasets中的方法生成自己的聚类数据集。假设已经通过聚类算法将待分类的数据进行了聚类,并最终得到了。,分别计算其轮廓系数。的轮廓系

#算法#kmeans#聚类
Pandas:如何修改DataFrame中某一列的值?

DataFrame是Pandas中的主要数据结构之一,本篇博客主要介绍如何DataFrame中某一列的值进行修改。

#pandas#python#数据分析
    共 23 条
  • 1
  • 2
  • 3
  • 请选择