songyuc 个人主页

@songyuc

songyuc

2022-06-28 03:57:58 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

【Llava】load_pretrained_model() 说明

使用自定义配置覆盖默认设置。

#人工智能 #深度学习

【ManiSkill】Link说明

Link。

【MedSAM】eval.py说明

The script performs inference on 3D medical images (stored asfiles), computes segmentation metrics (Dice coefficient, IoU, and Precision), and saves both quantitative results and optional visualizatio

【Maniskill】看到 class Articulation 还有一个“self.pose”，这个“self.pose”跟“self.qpos”是一样的吗

（位置 + 方向），是“整体放在世界里的姿态”。，也就是“内部关节怎么弯、怎么伸”的状态。

Reward Design with Language Models 译读笔记

强化学习（RL）中的奖励设计具有挑战性，因为通过奖励函数指定人类期望行为的概念可能很困难，或者需要许多专家演示。那么是否可以使用自然语言界面cheaply设计奖励？本文探讨了如何通过提示GPT3等LLM作为 proxy reward function 来简化奖励设计，其中用户提供包含一些示例（few-shot）或描述（zero-shot）的文本提示。本文的方法在RL框架中利用了这种代理奖励函

#语言模型

【Maniskill】Actor说明

Actor是 ManiSkill 对 SAPIEN的批量封装，用来同时管理 CPU/GPU、多子场景中的同名刚体。它继承，自动暴露姿态、速度、碰撞信息等接口，是任务端与底层 PhysX 的桥梁。

VoCo-LLaMA: Towards Vision Compression with Large Language Models 译读笔记

视觉语言模型（VLMs）在各类多模态任务中取得了显著成功，但其性能常常受限于处理高分辨率图像和视频时有限的上下文窗口以及高昂的计算成本。Vision compression 可以通过减少视觉 token 的数量来缓解这一问题。以往的方法通常使用 external modules 对视觉 token 进行压缩，并强制大语言模型（LLM）去理解这些压缩后的表示，从而导致视觉信息的损失。然而，在压缩学习

【Ubuntu】请问，『kill -9』跟『kill -15』有区别吗？

非常好的问题！和确实有很大区别，这对于正确处理进程终止很重要。想象你要让一个人离开房间：就像：实际代码示例程序如何处理 SIGTERM (kill -15)两种终止方式的对比针对您的 DeepSeek 项目推荐的终止流程创建智能终止脚本使用示例其他常用信号除了 -15 和 -9，还有其他有用的信号：最佳实践建议对于您的深度学习项目：首选：让程序有机会清理GPU内存等待几秒：给程序时间完成清理最

#ubuntu #linux

【Maniskill】Pose说明

Pose是 ManiSkill 对的批量封装，统一了 CPU/GPU 与多并行子场景下的位姿管理，支持张量/列表/SAPIEN 对象互转，并提供与 SAPIEN 相同的乘法、求逆、矩阵转换等接口。

【LLaVA-NeXT】LLaVATrainer说明

用于训练 LLaVA (Large Language and Vision Assistant) 多模态模型的训练器类，继承自。

共 96 条

请选择