logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Qt停靠窗口QDockWidget应用

//main.cpp#include "dockwindows.h"#includeint main(int argc, char *argv[]){QApplication a(argc, argv);DockWindows w;w.show();return a.exec();}//dockwindow.h#ifndef

Qt布局管理基本实例

综合实例:修改用户资料界面设计:main函数:#include "content.h"#includeint main(int argc, char *argv[]){QApplication a(argc, argv);Content w;w.show();return a.exec();}//主界面#include#inc

多模态大语言模型arxiv论文略读(三十六)

为了进一步扩展这些模型的能力,研究团队提出了一种新的框架,使多模态大语言模型(Multimodal Large Language Models, MLLMs)能够在参数中记忆并召回图像,从而直接响应用户的视觉内容查询。实验设计了不同的超参数设置,以优化DPO模型的性能,并评估了不同方法在不同任务上的表现。现有的方法通过手动标注包含和不包含幻觉的配对响应,并使用各种对齐算法来提高图像和文本之间的对齐

文章图片
#语言模型#人工智能#自然语言处理
多模态大语言模型arxiv论文略读(四)

➡️ 实验设计:KOSMOS-2在多个任务上进行了评估,包括多模态grounding(如短语grounding和指代表达理解)、多模态指代(如指代表达生成)、感知-语言任务(如图像描述和视觉问答)以及语言任务(如语言理解和生成)。在训练过程中,视觉编码器和语言模型保持冻结,仅对视觉抽象器和语言模型的低秩适应(LoRA)进行微调。➡️ 研究动机:为了增强多模态大语言模型在视觉-语言任务中的表现,特别

文章图片
#人工智能#AIGC#阿里云
多模态大语言模型arxiv论文略读(137)

因此,研究团队设计了VidEgoThink,一个全面的以自我为中心的视频理解基准,旨在评估MLLMs在具身AI中的应用能力,特别是视频问答、层次规划、视觉定位和奖励建模四个关键任务。UI定位模块负责识别目标UI元素的坐标;➡️ 问题背景:当前的图形用户界面(GUI)自动化任务中,单轮代理(Single-turn Agent)在执行用户指定的UI环境中的动作时,如点击图标或在文本框中输入文字,表现出

文章图片
#语言模型#人工智能#机器学习 +1
多模态大语言模型arxiv论文略读(五十八)

➡️ 论文标题:MARVEL: Multidimensional Abstraction and Reasoning through Visual Evaluation and Learning➡️ 论文作者:Yifan Jiang, Jiarui Zhang, Kexuan Sun, Zhivar Sourati, Kian Ahrabian, Kaixin Ma, Filip Ilievski

文章图片
#语言模型#深度学习#人工智能
LLM试用-让Kimi、智谱、阿里通义、腾讯元宝、字节豆包、讯飞星火输出system prompt

做一个简单小实验,让一些商用的LLM输出自己的system prompt

文章图片
多模态大语言模型arxiv论文略读(六十)

➡️ 方法简介:研究团队提出了两种模态非特定损失目标,包括延迟EOS损失和不确定性损失,以及两种模态特定损失目标,即冗长图像的令牌多样性损失和冗长视频的帧特征多样性损失。为了进一步探索这一问题,研究团队提出了一种系统的方法,通过设计延迟EOS损失、增加输出不确定性、提高多样性等手段,来诱导MLLMs生成更长的序列,从而增加能量-延迟成本。➡️ 问题背景:现有的视频生成技术虽然取得了显著进展,但生成

文章图片
#语言模型#计算机视觉#人工智能
多模态大语言模型arxiv论文略读(十九)

实验结果表明,该方法在零样本和微调设置下均显著提高了模型的性能,特别是在图像-文本检索任务中,零样本设置下的R@1指标提高了16.8%至46.1%。最近的研究表明,可以利用大型语言模型(LLMs)和多模态大型语言模型(MLLMs)来重写和增强图像标题,以提高数据质量,但这些方法引入了模型的固有偏差。➡️ 方法简介:RLHF-V框架包括两个关键创新:(1)在数据层面,收集以细粒度段落级校正形式的人类

文章图片
#语言模型#人工智能#深度学习
算法之美 | 几行代码勾勒出生命体

这个生物完全由代码生成,它在幽暗的世界里,摇曳着尾鳍、腹鳍,来回游啊游,但永远也逃离不了。实现这个赛博生物的公式来自于X上的大佬@yuruyurau用p5.js实现了各式各样的赛博生物,感兴趣的可以去看看。基于大佬分享的代码公式,笔者也用python复现了几个赛博生物是不是有点像《小鲤鱼历险记》里头的小美美。

文章图片
#算法#python
    共 108 条
  • 1
  • 2
  • 3
  • 11
  • 请选择