
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
SVD (或其变种如 FunkSVD, SVD++) 可以用来分解这个矩阵,发现潜在因子 (latent factors),从而预测未评分的项。结构化数据中,将原来的m个特征降维成k个新的特征,新特征是原始特征的线性组合,捕捉了数据的主要方差信息,降维后的数据可以直接用于机器学习模型(如分类、回归),通常能提高计算效率并减少过拟合风险。在进行 SVD 之前,通常需要对数据进行标准化(均值为 0,方

对抗生成网络(GAN)摘要 GAN由生成器与判别器组成,通过对抗训练提升生成能力。生成器将随机噪声转化为样本,判别器区分真实与生成数据。采用nn.Sequential简化网络结构,LeakyReLU避免神经元失活。在心脏病数据集不平衡样本中,使用GAN生成病人样本可提升分类器F1分数。典型应用包括图像/文本生成和数据增强,改进模型如WGAN、CGAN等进一步拓展了应用场景。(149字)

之前在神经网络训练中,为了帮助自己理解,借用了很多的组件,比如训练进度条、可视化的loss下降曲线、权重分布图,运行结束后还可以查看单张图的推理效果。tensorboard这个库,集成了以上所有可视化工具。

知识回顾数据增强卷积神经网络定义的写法batch归一化:调整一个批次的分布,常用与图像数据特征图:只有卷积操作输出的才叫特征图调度器:直接修改基础学习率卷积操作常见流程如下:1. 输入 → 卷积层 → Batch归一化层(可选) → 池化层 → 激活函数 → 下一层2. Flatten -> Dense (with Dropout,可选) -> Dense (Output)一、数据增强在图像数据预

知识点SARIMA模型的参数和用法:模型结果的检验可视化(昨天说的是摘要表怎么看,今天是对这个内容可视化)多变量数据的理解:内生变量和外部变量多变量模型统计模型:SARIMA(单向因果)、VAR(考虑双向依赖)机器学习模型:通过滑动窗口实现,往往需要借助arima等作为特征提取器来捕捉线性部分(趋势、季节性),再利用自己的优势捕捉非线性的残差深度学习模型:独特的设计天然为时序数据而生一、模型介绍1

知识点SARIMA模型的参数和用法:模型结果的检验可视化(昨天说的是摘要表怎么看,今天是对这个内容可视化)多变量数据的理解:内生变量和外部变量多变量模型统计模型:SARIMA(单向因果)、VAR(考虑双向依赖)机器学习模型:通过滑动窗口实现,往往需要借助arima等作为特征提取器来捕捉线性部分(趋势、季节性),再利用自己的优势捕捉非线性的残差深度学习模型:独特的设计天然为时序数据而生一、模型介绍1

知识点:不同CNN层的特征图:不同通道的特征图什么是注意力:注意力家族,类似于动物园,都是不同的模块,好不好试了才知道。通道注意力:模型的定义和插入的位置通道注意力后的特征图和热力图内容参考作业:今日代码较多,理解逻辑即可对比不同卷积层特征图可视化的结果(可选)ps:我这里列出来的是通道注意力中的一种,SE注意力为了保证收敛方便对比性能,今日代码训练轮数较多,比较耗时。

func.__name__:按照pep8的约定,在一个变量前后都加上两个下划线代表着这是一个Python内置的变量,是自动创建的。作用返回 func 的名称更详细的可以问AI。编写一个装饰器 logger,在函数执行前后打印日志信息(如函数名、参数、返回值)装饰器的思想:进一步复用。注意内部函数的返回值。

作业:参考示例代码对心脏病数据集采取类似操作,并且评估特征工程后模型效果有无提升。

从示例代码可以看到 效果没有变好,所以很多步骤都是理想是好的,但是现实并不一定可以变好。这个实验仍然有改进空间,如下。1. 没做smote+过采样+修改权重的组合策略,有可能一起做会变好。针对上面这2个探索路径,继续尝试下去,看看是否符合猜测。不平衡数据集的处理策略:过采样、修改权重、修改阈值。2. 没有调参,有可能调参后再取上述策略可能会变好。(2)确定少数类标签(修改权重前一定要做)(5)修改








