logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【LLM】大模型数据清洗&合成&增强方法

数据清洗【数据标准化:统一数据格式,基于提示端到端(LLM-GDO)、代码生成(Evaporate)、智能体辅助(CleanAgent);数据错误处理:检测并修复错误值,提示端到端(IterClean)、函数合成(LLMClean)、任务自适应微调(GIDCL)、混合LLM-ML(ZeroED);数据填补:填充缺失值,提示端到端(CRILM)、检索引导(RetClean)、模型优化(LLM-REC

文章图片
【总结】山顶夕景2025年LLM大模型年度总结

2025年年度总结很难相信一年就这么过去了,很快又过得很充实,从年初deepseek火了一波后大家都进行复现,很多人利用GRPO训练think推理模型复现ds,再到后来年中各种RL算法遍地开花,比如DAPO、GSPO等;同时多模态大模型也发展很快,去年效果一般的视频生成模型在今年效果已经非常惊艳了,同时也有像阿里全模态qwen-omni这样的“全能”(还是偏多模态理解)的模型出现,给我们看到未来的

文章图片
【LLM】多模态智能体Kimi-K2.5模型

原生多模态与早期融合训练:Kimi K2.5 打破"先训文本、后加视觉"的传统范式,采用早期融合策略(预训练早期即以10:90的低比例混合视觉-文本数据)。这种"联合优化"不仅避免了模态冲突,还实现了双向增强——视觉训练竟能提升纯文本推理能力(MMLU-Pro +1.7%),且仅用Zero-Vision SFT(纯文本代码代理)即可激活强大的视觉工具调用能力。Agent Swarm:并行智能体架构

文章图片
解决nvidia-smi无进程,但GPU显存被占用的情况

# 一、问题描述如题,解决nvidia-smi无进程,但GPU显存被占用的情况。# 二、解决方案```python# 查看没有显示出来的进程fuser -v /dev/nvidia*# Kill掉sudo kill -9 pid```如果要`kill`的进程特别多,可以用以下的python脚本:```pythonimport ospid = list(set(os.popen('fuser -v

文章图片
#linux
【Agent】Agentic Reasoning for Large Language Models

Agentic Reasoning for Large Language Models- 自进化推理机制,演化的核心包含两个基本机制:反馈与记忆。反馈为自我修正与优化提供评估信号,使智能体能够根据结果或环境响应来调整其推理策略。记忆则作为持久的基底,用于存储、组织和综合过往交互,从而实现跨任务的知识积累与复用。- 其中,反思包括三种。反思性反馈,模型通过自我批判或验证来修正其推理;参数化适应,将反

文章图片
【Agent】Agentic Reasoning for Large Language Models

Agentic Reasoning for Large Language Models- 自进化推理机制,演化的核心包含两个基本机制:反馈与记忆。反馈为自我修正与优化提供评估信号,使智能体能够根据结果或环境响应来调整其推理策略。记忆则作为持久的基底,用于存储、组织和综合过往交互,从而实现跨任务的知识积累与复用。- 其中,反思包括三种。反思性反馈,模型通过自我批判或验证来修正其推理;参数化适应,将反

文章图片
【Agent】智能体:在循环中自主调用工具的LLM

ReAct范式通过一种特殊的提示工程来引导模型,使其每一步的输出都遵循一个固定的轨迹。智能体将不断重复这个 Thought -> Action -> Observation 的循环,将新的观察结果追加到历史记录中,形成一个不断增长的上下文,直到它在Thought中认为已经找到了最终答案,然后输出结果。Thought (思考): 这是智能体的“内心独白”。它会分析当前情况、分解任务、制定下一步计划,

文章图片
【LLM】Gemini research和LangGraph框架

DeepMind开源全栈「Deep Research」项目:DeepMind开源的「Deep Research」项目是一个面向科研、开发者和普通用户的全栈智能研究工具,它通过AI技术模拟人类研究员的思考方式,提供深度信息整合与分析能力。https://github.com/google-gemini/gemini-fullstack-langgraph-quickstart🔄 智能体通过研究和反

文章图片
【LLM】deepseek多模态之Janus-Pro和JanusFlow框架

# note@[toc]# 一、Janus-Pro:解耦视觉编码,实现多模态高效统一anus-Pro是一个新颖的自回归框架,统一了多模态理解和生成。通过将视觉编码分离为“理解”和“生成”两条路径,同时仍采用单一的Transformer架构进行处理,解决了以往方法的局限性。这种分离不仅缓解了视觉编码器在理解和生成中的角色冲突,还提升了框架的灵活性。## 技术亮点- 视觉编码解耦:采用独立的路径分别处

文章图片
【LLM-Agent】Qwen-Agent智能体框架使用

(数据库小助手、旅行规划、思维导图生成)Qwen-Agent是一个专门设计用于开发基于大型语言模型(LLM)的应用程序的框架。它不仅支持指令遵循、工具使用、规划和记忆能力,还能够处理从8K到100万tokens的文档,超越了传统长上下文模型的限制。这意味着开发者可以利用Qwen-Agent构建出能够理解和生成自然语言、执行复杂任务的智能代理应用。核心功能

文章图片
    共 330 条
  • 1
  • 2
  • 3
  • 33
  • 请选择