logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型本地化微调部署

Instruct 小模型(1B–8B) + QLoRA + 高质量问答/对话数据 + 本地导出到 GGUF/Ollama。在框架上,Linux/Windows 先选 Unsloth 或 LLaMA-Factory,Mac 选 MLX-LM。这样最容易把“微调”和“本地部署”打通。

#人工智能
Jetson Orin NX 16G设备上配置AI服务自动启动的方案,包括Ollama、llama-server和OpenClaw Gateway三个组件

本文介绍了在Jetson Orin NX 16G设备上配置AI服务自动启动的方案,包括Ollama、llama-server和OpenClaw Gateway三个组件。Ollama通过官方推荐的override.conf方式进行定制;llama-server采用保守参数配置,支持统一内存回退;OpenClaw Gateway从用户服务改为系统服务,便于无人值守运行。文中详细说明了各服务的配置文件内

#gateway#数据库#人工智能 +2
完成ros2-mcp-openclaw常驻服务,并把 mcp.servers.ros2、ollama、llama.cpp、openclaw-gateway 放到同一套最终配置里。

摘要: 本文针对 ros2_mcp 与 OpenClaw 的本地化集成提出解决方案。由于 ros2_mcp 作为 stdio transport 不适合作为常驻守护进程,建议采用按需拉起模式:将 ollama、llama-server 和 openclaw-gateway 设为 systemd 常驻服务,而 ros2_mcp 通过包装器脚本由 OpenClaw 动态调用。文中提供了完整的实现方案,

#gateway
Llama 3 本地部署与量化选型技术报告

摘要 Llama 3系列模型因其完善的生态支持成为本地部署的首选,覆盖从1B到405B的不同规模需求。当前主流部署路线包括:llama.cpp+GGUF(通用本地推理)、Ollama(一键部署)、Transformers+bitsandbytes(研究微调)、vLLM(高吞吐服务)和MLX-LM(苹果设备优化)。量化方法选择需根据场景:GGUF Q4/Q5适合轻量本地运行,AWQ/GPTQ适合GP

Llama 3详解

摘要 Llama 3是Meta在2024-2025年推出的开放权重基础模型家族,包含多个版本和规模的模型。初版提供8B和70B文本模型,后续扩展至405B参数并支持128K上下文窗口,还增加了轻量级文本模型和视觉模型。技术架构采用dense decoder-only Transformer,支持GQA提升推理效率,预训练数据超过15T token。Llama 3的价值不仅在于模型性能,更在于其完整

#人工智能
2024多模态视觉:Qwen2-VL / SAM 2 / Molmo

2024年多模态视觉研究在三大方向取得突破性进展:1)通用视觉语言模型(如Qwen2-VL)通过动态分辨率机制和统一多模态位置编码实现图像、视频与文本的统一建模;2)视觉基础模型(如SAM 2)引入流式记忆机制将图像分割能力扩展到视频时序场景;3)开放多模态体系(如Molmo)构建开放数据与训练配方,推动开源生态发展。三者分别聚焦通用理解能力、时序视觉能力和开放生态能力,共同推动了多模态视觉领域的

#transformer
2025年的大模型论文的经典性

2025年AI研究重点聚焦三大方向:推理与智能体能力、多模态统一建模和高难度评测。在推理领域,DeepSeek-R1通过强化学习激发推理能力,Qwen3探索开源模型的双模式设计,Kimi K2则推进智能体研究。多模态方面,Qwen2.5-VL和Kimi-VL展示了视觉语言模型的突破,Qwen3-Omni实现真正全模态统一。评测领域涌现Humanity's Last Exam和ARC-AGI-2等高

#transformer#人工智能
Qwen3详解

Qwen3技术报告摘要(148字) Qwen3是2025年发布的新一代开源大语言模型,创新性地整合了通用对话与可控推理能力。其核心突破包括:1)"thinking/non-thinking"双模式统一架构,支持按需切换推理深度;2)thinking budget机制实现推理成本动态调控;3)36T token预训练数据体系覆盖119种语言;4)MoE架构实现128专家系统与8专

#transformer#人工智能
Qwen3 训练代码逐文件解析

摘要(149字): 本文解析Qwen3公开训练代码栈,分为三层:官方文档层(训练入口与框架推荐)、公开训练框架层(MS-SWIFT/Megatron的SFT/RLHF实现)、模型定义层(Transformers中的Qwen3结构)。核心训练逻辑由swift/pipelines/train/sft.py控制,通过模板绑定、数据集预处理和Trainer工厂模式实现多任务适配。关键优化包括Packing

#transformer#人工智能
    共 151 条
  • 1
  • 2
  • 3
  • 16
  • 请选择