logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

DeepSeek V4

DeepSeek V4技术报告摘要(150字): DeepSeek V4是新一代大语言模型,重点突破超长上下文处理与稀疏专家架构(MoE)。模型采用1.6万亿参数规模,支持百万token上下文窗口,通过动态专家路由机制实现高效计算。相比传统模型,V4在华为Ascend等国产硬件上优化适配,并创新性提出"Think Mode"动态推理机制,根据问题复杂度自动调整推理深度。其核心价

#人工智能#算法
DeepSeek V4

DeepSeek V4技术报告摘要(150字): DeepSeek V4是新一代大语言模型,重点突破超长上下文处理与稀疏专家架构(MoE)。模型采用1.6万亿参数规模,支持百万token上下文窗口,通过动态专家路由机制实现高效计算。相比传统模型,V4在华为Ascend等国产硬件上优化适配,并创新性提出"Think Mode"动态推理机制,根据问题复杂度自动调整推理深度。其核心价

#人工智能#算法
DeepSeek V4

DeepSeek V4技术报告摘要(150字): DeepSeek V4是新一代大语言模型,重点突破超长上下文处理与稀疏专家架构(MoE)。模型采用1.6万亿参数规模,支持百万token上下文窗口,通过动态专家路由机制实现高效计算。相比传统模型,V4在华为Ascend等国产硬件上优化适配,并创新性提出"Think Mode"动态推理机制,根据问题复杂度自动调整推理深度。其核心价

#人工智能#算法
音频生成器AudioLDM的框架原理

摘要: AudioLDM是一种基于潜在扩散模型的文本生成音频方法。其核心思想是通过CLAP模型将文本和音频映射到共享语义空间,在VAE压缩的梅尔频谱潜在空间中进行扩散生成。训练时,模型学习以音频CLAP嵌入为条件去噪;推理时则替换为文本嵌入,实现文本控制。生成过程包含:文本→CLAP编码→潜在扩散去噪→VAE解码为梅尔谱→HiFi-GAN合成波形。关键创新在于结合CLAP的跨模态对齐能力与潜在扩散

#音视频#人工智能#深度学习
ImageBind详解

统一六种模态的 embedding space:图像/视频、文本、音频、深度、热成像、IMU。用图像作为 hub:不需要所有模态两两配对。产生 emergent alignment:没直接训练过的模态对,例如音频-文本,也能互相对齐。支持跨模态检索、零样本分类、embedding 组合、音频驱动检测/生成等能力。对机器人融合感知很有启发:尤其适合做多传感器开放语义理解,但不能替代几何定位、控制和传

#计算机视觉#深度学习#人工智能
openclaw的gateway详解

OpenClaw Gateway 是整个 OpenClaw 系统的常驻控制面、消息路由器、Agent 运行入口、OpenAI-compatible API server、设备节点调度器和运维面板后端。HTTP 请求 → LLM provider → 返回多渠道消息→ 身份/权限/配对→ agent/session 路由→ 模型/工具/技能/节点调用→ 状态/日志/健康/配置管理→ 多渠道投递本机开

#gateway#人工智能
Dockerfile方式安装与使用 Claude Code

摘要:本文介绍了在Dev Container中使用Claude Code的两种方案。推荐使用官方Dev Container Feature方式安装,支持VS Code等开发环境集成。方案一详细说明了通过Dockerfile安装的步骤:创建包含必要工具的Ubuntu镜像,创建非root用户,通过官方脚本安装Claude Code,并配置持久化存储。文章还介绍了登录方式(浏览器OAuth或API Ke

#人工智能#docker
Claude Code介绍以及( 和Cursor / Cline / OpenAI Codex 类工具对比)

摘要: Claude Code是Anthropic推出的智能编程代理工具,支持终端/IDE/Slack等环境,能理解代码库、跨文件修改、运行测试并提交改动。与Cursor(AI原生IDE)、Cline(开源可定制代理)和OpenAI Codex(多代理云端平台)相比,其核心优势在于深度集成Claude模型,适配终端开发流程,适合偏好命令行操作、需自动化重构/调试的场景。选型建议:追求终端高效协作选

#transformer#人工智能
OpenPI / π₀ 系列算法详解、创新点及 Jetson Orin NX 16GB 边缘端部署

OpenPI/π₀系列算法技术报告摘要 OpenPI是面向机器人控制的开源基础模型工具链,包含π₀、π₀-FAST和π₀.₅三个核心模型。该系列采用Vision-Language-Action范式,通过多模态输入(视觉/语言/本体状态)直接生成连续动作序列。关键技术突破包括:1)Flow Matching连续动作生成机制;2)Action Expert模块实现控制参数隔离;3)Action Chu

#transformer#人工智能
OpenPI / π₀ 系列算法详解、创新点及 Jetson Orin NX 16GB 边缘端部署

OpenPI/π₀系列算法技术报告摘要 OpenPI是面向机器人控制的开源基础模型工具链,包含π₀、π₀-FAST和π₀.₅三个核心模型。该系列采用Vision-Language-Action范式,通过多模态输入(视觉/语言/本体状态)直接生成连续动作序列。关键技术突破包括:1)Flow Matching连续动作生成机制;2)Action Expert模块实现控制参数隔离;3)Action Chu

#transformer#人工智能
    共 66 条
  • 1
  • 2
  • 3
  • 7
  • 请选择