logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

ACT 纯仿真复现教程(Ubuntu + Conda,无真机ALOHA)

本文提供一套无ALOHA真实机器人、仅依靠MuJoCo仿真环境的ACT完整复现流程,适配Ubuntu服务器/本地台式机,全程使用Conda管理Python环境,覆盖系统依赖安装、仓库部署、仿真数据集生成、模型训练、仿真评估、报错排查全流程,完全基于官方仓库内置仿真任务,新手可一键跟着命令复现。适用场景:实验室远程服务器、无实体机械臂、仅做算法仿真验证、复现ACT论文基线效果。

文章图片
#ubuntu#conda#linux
Windows 端 Codex CLI 安装与 CC-Switch 中转站配置完整教程|免代理本地调用 GPT-5.5

通过 Node.js + Codex CLI + CC-Switch 本地路由的组合,即可在 Windows 环境下低成本搭建 AI 编码辅助环境,无需官方订阅账号、无需全局代理,即可使用 GPT-5.5 等大模型完成代码生成、项目重构、报错排查等工作。配合 VS Code 远程开发能力,还可进一步对接服务器算法项目,大幅提升开发效率。

文章图片
#windows
Windows 端 Codex CLI 安装与 CC-Switch 中转站配置完整教程|免代理本地调用 GPT-5.5

通过 Node.js + Codex CLI + CC-Switch 本地路由的组合,即可在 Windows 环境下低成本搭建 AI 编码辅助环境,无需官方订阅账号、无需全局代理,即可使用 GPT-5.5 等大模型完成代码生成、项目重构、报错排查等工作。配合 VS Code 远程开发能力,还可进一步对接服务器算法项目,大幅提升开发效率。

文章图片
#windows
VS Code 完整安装与远程开发实战教程(Windows + Ubuntu 服务器 + Codex + RT1 环境部署)

本文完整覆盖了 VS Code 从本地安装、远程服务器连接、AI 编码插件配置,到工业级算法环境部署的全流程。本地轻量编辑,算力全部下沉到服务器,兼顾开发体验与计算性能Codex 本地生成代码,API 密钥不上传服务器,降低数据安全风险Remote-SSH 无缝衔接文件、终端、调试,一体化开发效率更高。

文章图片
#服务器#windows#ubuntu
VS Code 完整安装与远程开发实战教程(Windows + Ubuntu 服务器 + Codex + RT1 环境部署)

本文完整覆盖了 VS Code 从本地安装、远程服务器连接、AI 编码插件配置,到工业级算法环境部署的全流程。本地轻量编辑,算力全部下沉到服务器,兼顾开发体验与计算性能Codex 本地生成代码,API 密钥不上传服务器,降低数据安全风险Remote-SSH 无缝衔接文件、终端、调试,一体化开发效率更高。

文章图片
#服务器#windows#ubuntu
【深度学习基础】Focal Loss、Dice Loss、组合损失函数

FLpt−αt1−ptγlog⁡ptFLpt​−αt​1−pt​γlogpt​FL⋅FL(⋅)FL⋅是Focal Loss(聚焦损失),损失函数的整体表示,用于衡量模型预测与真实标签的误差。ptp_tpt​是模型对真实类别的预测概率。αtα _tαt​是类别平衡权重(alpha 因子),用于进一步平衡正负样本的数量差异。

文章图片
#深度学习#人工智能
【分数SDE生成模型论文阅读】:统一扩散与分数匹配,解锁连续时间生成新范式

统一框架:用SDE统一离散扩散与分数匹配模型正向SDE:数据→噪声,3种范式VE/VP/sub-VP反向SDE:噪声→数据,靠分数函数∇log⁡ptx∇logpt​x训练:去噪分数匹配,MSE损失采样:Predictor-Corrector,精度最高概率流ODE:确定性采样+精确似然条件生成:无条件模型直接用,修复/上色/条件生成全搞定这篇是扩散模型理论天花板,吃透它,后续所有改进(Consist

文章图片
#论文阅读#迁移学习#人工智能 +2
【Layer Normalization论文阅读】:Transformer背后的归一化神器,从原理到代码实现

不依赖batch size:大模型训练时,batch size经常只有几十甚至几,BN完全失效。序列长度无关:Transformer处理的序列长度不固定,LN在每个时间步独立计算,不需要存历史统计量。训练更稳定:Transformer的层数非常深(GPT-4有上千层),LN的隐式学习率调节能有效防止梯度爆炸/消失。现在,所有的Transformer架构都遵循“Pre-LN”的设计:在注意力和前馈网

文章图片
#论文阅读#transformer#深度学习 +4
【CLIP论文阅读】:基于自然语言监督的通用视觉预训练范式

证明了自然语言监督可以训练出通用的视觉模型,打破了CV对标注数据的依赖提出了对比学习的图文对齐范式,现在所有的多模态大模型(LLaVA、BLIP-2、GPT-4V)都基于这个思路展示了零样本迁移的强大能力,让CV模型从“专用工具”变成了“通用平台”CLIP之后,CV进入了“多模态大模型时代”。现在的VLM不仅能识别图像,还能理解图像内容、回答问题、生成描述,甚至能调用工具完成复杂任务。当视觉和语言

文章图片
#论文阅读#人工智能
【BLIP-2论文阅读】:冻结预训练模型的多模态预训练革命

高效性:冻结两个预训练大模型,只训练188M参数的Q-Former,算力成本降低了54倍通用性:可以接入任何现成的图像编码器和LLM,轻松享受单模态领域的最新进展强大性能:在多个下游任务上取得state-of-the-art结果,特别是零样本能力远超之前的模型多轮数据集:创建包含多轮图文交互的数据集,让BLIP-2具备上下文学习能力更强的单模态模型:接入更新、更强的图像编码器(如ViT-G)和LL

文章图片
#论文阅读#transformer#人工智能 +2
    共 161 条
  • 1
  • 2
  • 3
  • 17
  • 请选择