logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

ffmpeg离线安装到服务器:解决conda/sudo/无法安装的通用方案

本文介绍了FFmpeg离线安装到服务器的通用解决方案。首先从官网下载适合平台的静态二进制文件(本案例使用amd64版本),然后上传到服务器并解压。接着将ffmpeg和ffprobe复制到用户bin目录,并设置PATH环境变量。最后通过ffmpeg -version命令验证安装是否成功。这种方法解决了conda/sudo无法安装FFmpeg的问题,适用于各种服务器环境。

文章图片
#服务器#conda
【项目】pyqt5基于python的照片整蛊项目

FacePrank 是一个功能强大的图像变形工具,使用Python和PyQt5开发。无需复杂的PS技能,只需鼠标点击拖拽,就能对照片进行各种有趣的变形处理。无论是恶搞朋友、制作表情包,还是进行创意设计,这个工具都能满足你的需求!FacePrank 是一个功能丰富、使用简单的照片整蛊工具。通过五大核心变形工具,你可以轻松制作各种搞笑照片。无论是恶搞朋友、制作表情包,还是进行创意设计,这个工具都能满足

文章图片
#python#qt#开发语言
AI视觉系统的致命弱点:一张贴纸就能骗过自动驾驶!深度解读物理对抗样本开山之作

🔥当AI遇上现实世界的"视觉欺骗"!本文精读Google Brain经典论文,全面解析物理对抗样本的生成原理与攻击机制。对抗样本研究已从数字图像延伸到物理世界。通过在真实物体上添加特定的扰动图案,可以影响深度学习模型的识别结果。本文介绍物理对抗样本的基本原理、常见生成方法,以及在交通标志识别、人脸识别等场景中的实际表现。同时探讨现有的防御机制和未来研究方向,帮助开发者更好地理解和应对AI系统在真

文章图片
#机器学习#深度学习#人工智能
【公式+代码】mPLUG-2:跨文本、图像、视频模块化多模态基础模型【论文精读注解】

【学习笔记】mPLUG-2多模态模型精读注解 - 小白也能看懂! 📝跟着论文一起学习阿里达摩院的mPLUG-2模型!本文是我的学习笔记,详细记录了模型的三大核心模块(视觉编码器、文本编码器、跨模态融合),逐行解读关键公式含义,标注了数据在网络中的shape变化过程。特别整理了ITC、ITM、MLM三个损失函数的作用和计算方式。作为一个正在学习的小白,我把容易困惑的地方都做了注释,希望能帮到同样在

文章图片
#人工智能#深度学习
2018 GPT1原文-OpenAI-Report Improving Language Understanding by Generative Pre-Training Reading Notes

这是一篇划时代的论文!OpenAI团队提出的GPT-1模型首次展示了"预训练+微调"范式的强大威力。通过在大规模无标注文本上进行生成式预训练,然后针对特定任务微调,GPT-1在12个自然语言理解任务中的9个达到了当时的最佳性能。这种通用的、任务无关的方法为后续的GPT系列奠定了基础,开启了大语言模型的新纪元。值得每个AI从业者深入研究!虽然此文距离当今比较久远,但是其思想仍在学术界有重要的参考价值

文章图片
ICLR 2015 对抗样本解释利用Adversial Examples ReadingNotes

深度学习模型的致命弱点被揭开!Ian Goodfellow等人在这篇开创性论文中颠覆了传统认知:对抗样本的存在不是因为神经网络"太复杂",而是因为它们"太线性"!通过在高维空间中微小扰动的累积效应,研究者提出了快速梯度符号方法(FGSM),能够轻松"欺骗"最先进的AI模型。更令人震惊的是,一个对抗样本可以同时愚弄多个不同架构的模型。论文不仅揭示了AI的根本脆弱性,还提出了对抗训练作为防御手段,在M

文章图片
到底了