山顶夕景个人主页

@qq_35812205

山顶夕景

2022-06-23 14:58:44 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

【LLM】Qwen-Agent框架使用和源码解读

Qwen-Agent是一个专门设计用于开发基于大型语言模型（LLM）的应用程序的框架。它不仅支持指令遵循、工具使用、规划和记忆能力，还能够处理从8K到100万tokens的文档，超越了传统长上下文模型的限制。这意味着开发者可以利用Qwen-Agent构建出能够理解和生成自然语言、执行复杂任务的智能代理应用。核心功能：更强的工具调用（Function Calling）能力:框架支持智能体自动调用外部

【LLM】Qwen-Agent框架使用和源码解读

【VLM】vLLM-Omni多模态推理框架

今天的生成式模型已经远不止“文本输入、文本输出”：新的模型可以同时理解和生成文本、图像、音频、视频，背后也不再是单一自回归架构，而是由编码器、语言模型、扩散模型等异构组件拼接而成。随着模型进化为可以“看、听、说”的全能代理（omni agents），底层推理系统也不得不同时面对：真·全模态：一条请求里既有文本，又有图片、音频甚至视频，输出形式也不再单一。超越自回归：扩散 Transformer（D

【VLM】vLLM-Omni多模态推理框架

【LLM】使用DSA和改进GRPO的DeepSeek-V3.2模型

DSA 训练的两个阶段阶段一：Dense Warm-up先冻住主模型，只训练 Lightning Indexer训练目标是让 Indexer 的输出分布对齐主注意力的分布只训练了 1000 步，共 2.1B tokens阶段二：Sparse Training放开所有参数，让模型适应稀疏注意力模式继续用 KL 散度对齐 Indexer 和主注意力训练了 15000 步，共 943.7B tokens

机器人操作系统ROS浅析

文章目录一、ROS简介二、学习路径三、ROS的核心概念3.1 ROS是一种跨平台模块化软件通讯机制（1）节点Node——执行单元（2）节点管理器（ROS Master）—— 控制中心3.2 话题通信3.2 服务通信3.3 文件系统R eference一、ROS简介ROS是Robot Operating System的缩写，原本是斯坦福大学的一个机器人项目，后来由Willow Garage公司发展

【MLLM】语音端到端大模型和Voice Agent发展

主流方案：端到端 or 级联方案（ASR + LLM + TTS）级联方案：语音输入 → ASR（语音转文本） → LLM（文本理解与生成） → TTS（文本转语音） → 语音输出CosyVoice模型：对于交互应用（如语音助手），用户希望一说话就有回应。Flow Matching 的确定性特性（每一步计算都是确定的，不像扩散模型可能有随机性）和可控的路径规划，使得 CosyVo

【深度学习】batch normalization和layer normalization区别

文章目录零、基础铺垫一、batch normalization二、layer normalization三、应用场景Reference零、基础铺垫“独立同分布”的数据能让人很快地发觉数据之间的关系，因为不会出现像过拟合等问题。一般在模型训练之前，需要对数据做归一化。为了解决ICS问题，即internal covarivate shift（内部协变量漂移）问题，即数据分布会发生变化，对下一层网络的学

#深度学习

【LLM】强化学习训练框架（slime、verl框架）

R1 出现后，RL 从 Human Alignment 向 Reasoning 转变，除对齐任务外，还可用于代码生成、数学推理等领域。这些任务有明确 ground truth，可通过评估代码在测试用例中的正确性或验证数学结果准确性确定。奖励模型可用非神经网络的奖励模块替代，如代码生成任务用沙箱环境评估执行结果，数学推理任务用奖励函数验证结果正确性。SLIME 框架中的 Rollout 部分

【CV】Yolov8：ultralytics目标检测、关键点检测、语义分割

Yolov8提供了一个全新的 SOTA 模型，包括 P5 640 和 P6 1280 分辨率的目标检测网络和基于 YOLACT 的实例分割模型。和 YOLOv5 一样，基于缩放系数也提供了 N/S/M/L/X 尺度的不同大小模型，用于满足不同场景需求骨干网络和 Neck 部分可能参考了 YOLOv7 ELAN 设计思想，将 YOLOv5 的 C3 结构换成了梯度流更丰富的 C2f 结构，并对不同尺

#目标检测 #计算机视觉

共 371 条

请选择