logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【RL-LLM】Self-Rewarding Language Models

Self-Rewarding Language Models- 研究问题:这篇文章要解决的问题是如何通过自我奖励的语言模型(Self-Rewarding Language Models)来实现超人类智能代理。具体来说,现有的方法通常依赖于人类偏好数据来训练奖励模型,然后使用这些模型来训练大型语言模型(LLM),但这种方法存在瓶颈,即人类偏好数据的大小和质量限制。- 研究难点:该问题的研究难点包括:

文章图片
【LLM】deepseek多模态之Janus-Pro和JanusFlow框架

# note@[toc]# 一、Janus-Pro:解耦视觉编码,实现多模态高效统一anus-Pro是一个新颖的自回归框架,统一了多模态理解和生成。通过将视觉编码分离为“理解”和“生成”两条路径,同时仍采用单一的Transformer架构进行处理,解决了以往方法的局限性。这种分离不仅缓解了视觉编码器在理解和生成中的角色冲突,还提升了框架的灵活性。## 技术亮点- 视觉编码解耦:采用独立的路径分别处

文章图片
【机器学习中的矩阵求导】(三)矩阵向量求导(微分法)

学习总结(1)用微分法,要熟练矩阵微分和迹函数的性质。(2)有一些场景,求导的自变量和因变量直接有复杂的多层链式求导的关系,此时微分法使用起来也有些麻烦。如果我们可以利用一些常用的简单求导结果,再使用链式求导法则,则会非常的方便。(3)本task是求解标量对向量的求导,以及标量对矩阵的求导。注意此处统一规定:使用分母布局。文章目录学习总结一、矩阵微分二、矩阵微分的性质三、使用微分法求解矩阵向量求导

文章图片
#机器学习
【机器学习中的矩阵求导】(七)矩阵向量化复习

矩阵向量化,在矩阵乘法、转置、逐元素乘法等会用到;另外可以使用numpy的kron计算kronecker积。

文章图片
#矩阵#机器学习
【LLM多模态】Animatediff文生视频大模型

AnimateDiff,这是一个实用的框架,用于在不需要特定调整的情况下,将个性化的文本到图像(T2I)扩散模型转换为动画生成器。1. 问题背景:现有的个性化T2I模型能够生成高质量的静态图像,但在生成动画方面存在挑战。作者提出了AnimateDiff,旨在解决这一问题。2. AnimateDiff框架:核心是一个可插拔的运动模块,它可以从真实世界视频中学习通用的运动先验,并与任何基于相同基础T2

文章图片
【李宏毅机器学习】Explainable AI

- local explanation的任务是判断出这图片为啥是XX;global explanation的任务是model能够学习到XX是长啥样的(这里说的是XX识别)。- explanable AI典型的2种方法是敏感性分析(Sensitivity Analysis)和基于梯度的方法(Gradient-based Methods)。- 敏感性分析:出发点就是看你的模型对于哪个数据实例非常敏感。

文章图片
#深度学习
(一)云端开发基础

一.云端开发全栈技术简介(1)全栈:概念和技术的有效集合应用 = APP• 云端掌握应用逻辑,存储应用数据,控制应用权限,体现应用智能• 应用提供交互体验思考:云端一定有Web界面吗?思考:云端一定提供浏览器浏览吗?绝大部分应用情况• 云端与应用之间使用HTTP协议• 加密需求采用HTTPS协议• 云端需要部署Web服务器• 应用数据采用JSON格式传输• 接口...

【Airflow】工作流自动化和调度系统

文章目录一、Airflow的诞生二、基于CeleryExecutor方式的系统架构三、Airflow的组成成分四、安装五、基本命令Reference一、Airflow的诞生未使用airflow使用airflow需要自己添加调度代码、调试复杂、功能单一、缺乏整体调度能力框架调度,简单易用,更稳定,功能全面,可以整体调度缺乏图形化能力,给任务的新增、排查等操作带来很多困难。特别是当任务较多,结构复杂的

文章图片
#大数据
解决报错ImportError: IProgress not found. Please update jupyter and ipywidgets.

问题描述在用transformers模型导入预训练模型时,报错:ImportError: IProgress not found. Please update jupyter and ipywidgets.See https://ipywidgets.readthedocs.io/en/stable/user_install.html解决方法(1)首先很多博客说是jupyter的版本过低了,但是卸

文章图片
#jupyter#python
爬虫(五)“中国大学排名定向爬虫”实例

0.实例介绍右键点击查看源代码,ctrl+f查找清华大学找到相应数据。查看robots协议:http://www.zuihaodaxue.cn/robots.txt 发现不存在,说明可以爬。1.实例编写import requestsfrom bs4 import BeautifulSoup #只是引入bs4类import bs4#引入bs4库def getHTML...

    共 351 条
  • 1
  • 2
  • 3
  • 36
  • 请选择