logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

OpenClaw科普/使用体验

OpenClaw 是一个开源的、自托管的 AI 网关(Gateway),它能把你的聊天软件(企业微信、飞书、钉钉、WhatsApp、Telegram、Discord 等)连接到 AI Agent。简单说,它是一个"管道",让 AI 助手能通过你日常使用的通讯工具为你服务。核心特点:• 自托管(Self-hosted):运行在你自己的机器上,对话数据和文件留在本地(只保证数据不外传,调用外部api的

OpenClaw科普/使用体验

OpenClaw 是一个开源的、自托管的 AI 网关(Gateway),它能把你的聊天软件(企业微信、飞书、钉钉、WhatsApp、Telegram、Discord 等)连接到 AI Agent。简单说,它是一个"管道",让 AI 助手能通过你日常使用的通讯工具为你服务。核心特点:• 自托管(Self-hosted):运行在你自己的机器上,对话数据和文件留在本地(只保证数据不外传,调用外部api的

深度学习TensorFlow里的checkpoint

这几天刚入门跑别人论文的项目(TDD-net)。对项目里的checkpoint比较好奇,于是上网搜寻了相关资料。机器学习里面保存的模型checkpoint文件里面到底是什么东东? - 知乎简单地说,在使用tensorflow跑模型的时候,我们不可能一次跑完,中间要保存一下的(就像写文章中间要保存下草稿)。因此checkpoint其实就是保存下来的中间模型。保存了TensorFlow 模型之后,我们

文章图片
#python#tensorflow
阿里开源多模态大模型Ovis1.6

Ovis1.6开源地址和Demo:

Qwen3Guard解读

训练采取SFT方式,对标签质量要求高,为了减少噪声、数据清洗,先把数据分为A/B两部分,A/B中各自调整黑/白数据配比训练了一个严格模型和宽松模型,然后分别用来预测另外的集合进行投票,选出有争议(即又被预测为安全和宽松)的数据。技术报告,整体来说这个模型是纯NLP的模型,而且从贴切程度上讲:大模型安全 > 平台内容审核,猜测动机和背景是专用于qwen系列LLM输出/输入审核的大模型安全审核模型。合

#深度学习#人工智能
深度学习TensorFlow里的checkpoint

这几天刚入门跑别人论文的项目(TDD-net)。对项目里的checkpoint比较好奇,于是上网搜寻了相关资料。机器学习里面保存的模型checkpoint文件里面到底是什么东东? - 知乎简单地说,在使用tensorflow跑模型的时候,我们不可能一次跑完,中间要保存一下的(就像写文章中间要保存下草稿)。因此checkpoint其实就是保存下来的中间模型。保存了TensorFlow 模型之后,我们

文章图片
#python#tensorflow
mmcv中BaseModule和Pytorch的nn.Module的区别

比起torch.nn.Module类而言,多了init_cfg和init_weights。type里的override是用来init这个实例里一些特殊的部分,比如self.reg。注册在mmcv/cnn/utils/weight_init.py。所有的init方法都是一个INITIALIZERS。BaseModule类在mmcv.runner中。norm的weight都是1,bias都是0。这个实

#python#深度学习
阿里开源多模态大模型Ovis1.6

Ovis1.6开源地址和Demo:

[解决错误]mmyolo的bbox_loss和检测bbox都是空

最近用mmyolo训练自己的数据集的时候发现训练的时候loss_bbox=0,测试和eval的时候结果也全是空的,排除了数据集读取的问题,最后发现是config中自定义了自己的类别但是没有传给dataset。简而言之,在自定义了数据集里的metainfo即类别后,还需要再dataloader构造的时候传入这些metainfo。

文章图片
#python#人工智能#深度学习
[解决错误]AttributeError: ‘MiniCPMVTokenizerFast‘ object has no attribute ‘image_processor‘

大概原因就是缺少原pretrained模型中一些.py,.json文件导致的,就是训练后只保存了一些权重相关的文件,但是要进行推理的话,还需要自行cp过去一些“配置文件”比如MiniCPM-V-2.6在进行官方的finetune后(swift进行finetune后好像不会有这个问题,具体没去看),保留下来的ckpt文件夹跟原版的对比(左finetune右pretrained),缺少了三个文件。其他

文章图片
#机器学习#人工智能
    共 13 条
  • 1
  • 2
  • 请选择