logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

BERT 模型微调:GLUE 与 SQuAD 任务

本文详细介绍了如何在 PyTorch 中对 BERT 模型进行微调,以适应 GLUE 和 SQuAD 两类下游任务。内容涵盖了基于 BERT 构建分类和问答模型的步骤、训练循环的实现方法、数据集的处理及批量化策略,以及模型输出与损失函数的使用。通过本文,读者可以掌握在实际 NLP 任务中微调 BERT 的完整流程,并理解不同任务对模型输入输出的具体要求。

文章图片
#bert#自然语言处理
Transformer 中 Token 的完整旅程:从输入嵌入到输出概率

本文以循序渐进的方式讲解了 Transformer 架构在大型语言模型中的工作流程,重点描述一个 token 在输入到输出整个过程中经历的表示变化。内容涵盖分词、嵌入、位置编码如何将原始文本转换为可处理的向量表示;解释多头注意力如何为 token 注入全局上下文信息;阐述前馈网络如何进一步细化特征;并说明在多个堆叠层中,这些过程是如何反复执行以逐步构建高层语言理解。最终,文章介绍线性投影和 sof

文章图片
#transformer#深度学习#人工智能 +1
使用 Diffusers 库进行 Stable Diffusion 图像修复与扩展

本文详细讲解了如何使用 Hugging Face 的 Diffusers 库,通过 Stable Diffusion 实现图像修复(Inpainting)与扩展(Outpainting)。内容包括使用 SAM 模型生成掩码、创建修复与扩展图像、结合文本提示进行生成,以及在 Google Colab 上运行完整示例。通过本教程,读者可以掌握 Python 代码实现图像局部修复和边界扩展的方法。

文章图片
OpenCV 中基于 SVM 的图像分类与检测实战教程

本文通过 OpenCV 的机器学习模块,演示了如何使用支持向量机(SVM)完成图像分类与目标检测任务。首先,我们在手写数字数据集上训练了一个基于 HOG 特征的 SVM 分类器,用于识别 0–9 的数字图像。随后,将该思路扩展至图像检测场景,通过在测试图像不同位置重复分类,实现目标数字的定位检测。文末还讨论了在真实应用中需关注的多尺度检测与样本不平衡问题,为读者提供从入门到实战的完整思路。

文章图片
#opencv#支持向量机#机器学习
掌握Prompt与AI工作流,解锁高效问题解决新范式

本文探讨了个人成长过程中为何会落后于他人,并提出通过AI工具加速学习和工作的方法。文章介绍了推荐的AI工具Dify及其工作流,解释了Prompt的概念及其对AI输出结果的重要性,分享了编写高质量Prompt的技巧和实战示例。同时,文章强调利用AI解决实际问题的场景与方法,帮助读者在日常工作与学习中减少依赖他人,提高效率,并附上实用Prompt示例供参考。

文章图片
#人工智能#AI
从零开始构建与使用 LoRA:Stable Diffusion 微调完整实战指南

本文系统讲解了如何使用 Hugging Face 的 Diffusers 库从零开始训练与使用 Stable Diffusion 的 LoRA(Low-Rank Adaptation)模型。内容涵盖 LoRA 原理、环境搭建、数据集准备、训练脚本执行、超参数说明与推理加载方式。通过本教程,读者可以在本地 GPU 上快速构建定制风格的图像生成模型,并掌握 AutoPipeline 与多 LoRA 叠

文章图片
#LoRA#深度学习
【人工智能】短视频生成工具MoneyPrinterTurbo安装使用教程

在短视频创作日益普及的当下,手动制作视频不仅耗时,还需掌握剪辑、文案撰写等多种技能。而 MoneyPrinterTurbo 作为一款开源全自动短视频生成工具,只需输入主题或关键词,即可自动完成文案生成、素材匹配、字幕制作、BGM搭配,并合成高清短视频。本文将从项目介绍、特色、部署安装到实际使用,为你提供一份完整教程,帮助你快速上手这款工具。

文章图片
#人工智能#音视频#视频生成 +1
Windows本地部署DeepSeek-R1大模型并使用web界面远程交互

最近爆火的国产AI大模型Deepseek详细大家都不陌生,不过除了在手机上安装APP或者官网在线体验,我们其实完全可以在自己的Windows电脑上本地进行部署,并结合cpolar内网穿透工具轻松实现远程交互,带来更方便快捷的体验。之前就和大家分享过本地运行 AI 模型具有很多优势,比如隐私安全:你的所有数据都保留在你自己的机器上,不存在共享敏感信息的风险。快速响应:官方及三方访问量过大,延迟非常高

文章图片
#windows#AI#人工智能
使用 OpenCV 读取与显示视频帧:从摄像头到本地文件的完整指南

本文介绍数字视频的基本构成原理,并通过 OpenCV 演示如何从摄像头与本地视频文件中读取并显示图像帧。内容涵盖:视频与图像的关系、数字视频的时间维度建模、使用 VideoCapture 抓取实时帧、读取视频文件属性,以及在循环中逐帧处理与展示数据,是掌握 OpenCV 视频处理基础的核心入门指南。

文章图片
#opencv#音视频#人工智能 +3
快速上手Litellm AI代理工具:打破大模型调用壁垒的开发利器

本文全面介绍了开源大模型代理工具 Litellm,它通过统一接口封装多家大模型(OpenAI、Anthropic、Claude、Gemini、文心一言等),解决多模型接入复杂性。文章涵盖核心特性:全场景模型支持、零侵入式集成、负载均衡与故障转移、日志监控与权限管理、缓存与token控制等,并提供快速部署、测试请求与生产环境最佳实践。Litellm让开发者在低成本、高效率下轻松管理大模型应用,从开发

文章图片
    共 165 条
  • 1
  • 2
  • 3
  • 17
  • 请选择