logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【论文阅读—深度学习处理表格数据】ResNet-like & FT Transformer

论文摘要:该研究系统评估了处理表格数据的深度学习方法,指出当前模型因测试标准不一而难以比较的问题。作者提出了两个简单高效的基线模型:ResNet-like架构和改良的FT-Transformer,通过统一实验框架在11个数据集上验证其性能。实验表明,FT-Transformer综合表现最优且稳定,但传统梯度提升树(GBDT)仍具竞争力。研究还开发了基于注意力机制的特征重要性解释方法,为表格数据深度

文章图片
#深度学习#论文阅读#transformer
【论文阅读—可解释性AI(Transformer篇)】Transformer Interpretability Beyond Attention Visualization

本文提出了一种改进Transformer模型可解释性的新方法。针对现有注意力可视化方法(如Attention Rollout)存在的模糊性和无关区域高亮问题,作者基于Deep Taylor分解原理,提出融合梯度信息和相关性传播的解决方案。该方法通过创新性地处理Transformer特有的自注意力机制和跳跃连接结构,实现了更准确、类别特定的决策过程可视化。实验表明,该方法在图像分类和文本情感分析任务

文章图片
#transformer#pytorch#深度学习
linux端口转发加速打开Gradio/Tensorboard

linux运行结果可视化界面用本地端口转发实现流畅操作

文章图片
#linux#运维#服务器 +3
到底了