logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

(NIPS-2024) - GITA: Graph to Visual and Textual Integration for Vision-Language Graph Reasoning

本研究提出GITA框架,首次将视觉信息引入大语言模型处理图论任务的过程。通过Graphviz生成可视化图表,结合文本描述构建多模态输入,在GVLQA数据集上训练VLM模型。实验表明,该方法在零样本和微调场景下均显著优于纯文本LLM,验证了视觉信息对图推理的增强作用。但受限于自然语言输出形式,该方法尚无法直接生成可执行代码,且难以处理大规模图。该工作为图论任务的多模态推理提供了新思路,后续可结合代码

文章图片
#图论#计算机视觉#语言模型
重塑优化建模与算法设计:2025年大模型(LLM)在优化领域的应用盘点 - 1

本文综述了2025年1-2月发表的10篇关于大语言模型(LLM)在优化问题中应用的创新研究,主要分为三类:启发式算法设计、图组合优化和自动求解器开发。

#算法
论文分享 - Large Language Model-driven Large Neighborhood Search for Large-Scale MILP Problems

本文提出了一种基于大语言模型(LLM)的双层自演化框架LLM-LNS,用于自动设计混合整数线性规划(MILP)问题的邻域搜索策略。该框架包含内层策略进化和外层提示词进化的双层结构,通过差分记忆的定向进化机制引导优化过程。实验表明,该方法在在线装箱和旅行商等组合优化问题上优于现有方法,在200万变量的大规模集合覆盖问题上性能提升9.20%。研究创新性地将进化算法思想融入提示词工程,实现了策略的元学习

文章图片
#语言模型#人工智能#自然语言处理
重塑优化建模与算法设计:2025年大模型(LLM)在优化领域的应用盘点 - 2

本文总结了2025年3-4月间10篇关于大语言模型(LLM)在优化问题中应用的关键研究。这些工作展示了从可行性验证到理论深化的快速演进过程,主要聚焦于三个方向:新兴优化问题的启发式算法生成(如CEoH框架)、运筹学问题的自动化建模与求解(如OR-LLM-Agent)、以及算法设计过程的优化(如EvoTune结合强化学习)。研究显示,LLM不仅能处理经典优化问题,还能为小众问题生成高质量算法(最优解

#算法
重塑优化建模与算法设计:2024下半年大模型(LLM)在优化领域的应用盘点

以下,我们将按照发表时间的顺序,逐一梳理这些代表性研究的核心内容。每一篇笔记都将聚焦于论文所解决的关键问题、提出的创新方法及其取得的实验效果,从而为引言中勾勒的宏观趋势提供具体的案例支撑。

#算法#人工智能#机器学习
RLHF 大模型对齐算法“填坑”史:从 PPO 的痛,到 DAPO

PPO是请了 4 个私教(模型)全方位辅导,效果好但学费极其昂贵。DPO是直接刷《五年高考三年模拟》,只看标准答案,效率高但缺乏举一反三的能力。GRPO是搞“学习小组”,大家互相批改作业,比平均分好的受表扬,既省了老师又保持了竞争。DAPO则是升级版的“精英学习小组”,只攻坚难题,并且鼓励尖子生“抢跑”。

文章图片
#算法#人工智能
编码注意力机制 [ Self - Attention, Attention, Causal Attention, Multi-head Attention ]

允许输入序列的每个位置在计算序列的表示时关注同一序列的所有位置。

文章图片
#transformer
到底了