logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【hive】数据采样

参考,可以直接查看原文,下面只是对原文进行概括和实际性能测试。

#hive#hadoop#数据仓库
python查看第三方包模块文档的两种方式

本机会随机生成一个端口号(也可以指定端口号,注意端口冲突),输入b直接打开,或者复制地址浏览器中打开查看。ctrl+f 要查询的模块名。

#python
基于阿里云调用deepseek大模型

每个模型的详细信息中会有API示例(),需要做的就是申请自己的API key就行了,过程中可能需要。。

#阿里云
基于Qwen2.5-7B-Instruct进行LoRA微调推理全流程探索

ms-swift是一个针对大模型微调的高层封装框架,旨在简化训练流程、统一接口并集成多种微调技术,如 LoRA、QLoRA、Prefix Tuning等。通过ms-swift实现LoRA微调,仅需配置参数,无需关心底层实现。使用ms-swift,通过lora方式微调下载的基座模型,产出微调的权重文件。使用下载的基座模型,先测试一下推理效果作为合并LoRA后推理效果的对照,参考。本次测试目的为跑通模

#LoRA
分类模型评估:混淆矩阵与ROC曲线

理解混淆矩阵和ROC曲线之前,先明确几个概念。对于分类问题,不论是多分类还是二分类,对于某个关注类来说,都可以看成是二分类问题,当前的这个关注类为正类,所有其他非关注类为负类。从上面几个定义可以知道:1)样本总数 = TP+FP+TN+FN2)所有真实值为正类的样本总数 = TP+FN3)所有真实值为负类的样本总数 = TN+FP。

#机器学习
分类模型评估:混淆矩阵与ROC曲线

理解混淆矩阵和ROC曲线之前,先明确几个概念。对于分类问题,不论是多分类还是二分类,对于某个关注类来说,都可以看成是二分类问题,当前的这个关注类为正类,所有其他非关注类为负类。从上面几个定义可以知道:1)样本总数 = TP+FP+TN+FN2)所有真实值为正类的样本总数 = TP+FN3)所有真实值为负类的样本总数 = TN+FP。

#机器学习
基于阿里云调用deepseek大模型

每个模型的详细信息中会有API示例(),需要做的就是申请自己的API key就行了,过程中可能需要。。

#阿里云
MySQL开窗函数

开窗函数是mysql8.0中的新特性,用于实现和group by分组函数类似的分组聚合功能。分组函数:对一个集合输出一个标量结果,改变了数据的粒度,且丢失了非分组字段及非聚合字段的信息。开窗函数:分别以每一行为当前行,与当前行相关的所有行为窗口,对同一个窗口内的数据进行聚合等类似操作,结果附加到当前行的后面,不改变原始数据粒度,不丢失原始数据信息。这部分可以直接查看文档,个人觉得这部分算是开窗函数

#mysql#数据库
MySQL开窗函数

开窗函数是mysql8.0中的新特性,用于实现和group by分组函数类似的分组聚合功能。分组函数:对一个集合输出一个标量结果,改变了数据的粒度,且丢失了非分组字段及非聚合字段的信息。开窗函数:分别以每一行为当前行,与当前行相关的所有行为窗口,对同一个窗口内的数据进行聚合等类似操作,结果附加到当前行的后面,不改变原始数据粒度,不丢失原始数据信息。这部分可以直接查看文档,个人觉得这部分算是开窗函数

#mysql#数据库
centos7安装python3环境

此时在/usr/local/下会生成一个名为python3的文件夹,进入该文件夹下的bin目录,将软链接python3复制到/usr/bin/目录下,就可以在全局使用python3命令了。4.安装wget,通过wget在线下载python3安装包。这里也可以不安装,手动去官网下载对应安装包上传到虚拟机。centos7自带的python版本为2.7.5,现在在系统中新配置一个python3的环境。2

    共 13 条
  • 1
  • 2
  • 请选择