
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
Instruct 小模型(1B–8B) + QLoRA + 高质量问答/对话数据 + 本地导出到 GGUF/Ollama。在框架上,Linux/Windows 先选 Unsloth 或 LLaMA-Factory,Mac 选 MLX-LM。这样最容易把“微调”和“本地部署”打通。
jetson orin NX 16G部署llama.cpp服务
本文介绍了在Jetson Orin NX 16G设备上配置AI服务自动启动的方案,包括Ollama、llama-server和OpenClaw Gateway三个组件。Ollama通过官方推荐的override.conf方式进行定制;llama-server采用保守参数配置,支持统一内存回退;OpenClaw Gateway从用户服务改为系统服务,便于无人值守运行。文中详细说明了各服务的配置文件内
摘要: 本文针对 ros2_mcp 与 OpenClaw 的本地化集成提出解决方案。由于 ros2_mcp 作为 stdio transport 不适合作为常驻守护进程,建议采用按需拉起模式:将 ollama、llama-server 和 openclaw-gateway 设为 systemd 常驻服务,而 ros2_mcp 通过包装器脚本由 OpenClaw 动态调用。文中提供了完整的实现方案,
摘要 Llama 3系列模型因其完善的生态支持成为本地部署的首选,覆盖从1B到405B的不同规模需求。当前主流部署路线包括:llama.cpp+GGUF(通用本地推理)、Ollama(一键部署)、Transformers+bitsandbytes(研究微调)、vLLM(高吞吐服务)和MLX-LM(苹果设备优化)。量化方法选择需根据场景:GGUF Q4/Q5适合轻量本地运行,AWQ/GPTQ适合GP
摘要 Llama 3是Meta在2024-2025年推出的开放权重基础模型家族,包含多个版本和规模的模型。初版提供8B和70B文本模型,后续扩展至405B参数并支持128K上下文窗口,还增加了轻量级文本模型和视觉模型。技术架构采用dense decoder-only Transformer,支持GQA提升推理效率,预训练数据超过15T token。Llama 3的价值不仅在于模型性能,更在于其完整
2024年多模态视觉研究在三大方向取得突破性进展:1)通用视觉语言模型(如Qwen2-VL)通过动态分辨率机制和统一多模态位置编码实现图像、视频与文本的统一建模;2)视觉基础模型(如SAM 2)引入流式记忆机制将图像分割能力扩展到视频时序场景;3)开放多模态体系(如Molmo)构建开放数据与训练配方,推动开源生态发展。三者分别聚焦通用理解能力、时序视觉能力和开放生态能力,共同推动了多模态视觉领域的
2025年AI研究重点聚焦三大方向:推理与智能体能力、多模态统一建模和高难度评测。在推理领域,DeepSeek-R1通过强化学习激发推理能力,Qwen3探索开源模型的双模式设计,Kimi K2则推进智能体研究。多模态方面,Qwen2.5-VL和Kimi-VL展示了视觉语言模型的突破,Qwen3-Omni实现真正全模态统一。评测领域涌现Humanity's Last Exam和ARC-AGI-2等高
Qwen3技术报告摘要(148字) Qwen3是2025年发布的新一代开源大语言模型,创新性地整合了通用对话与可控推理能力。其核心突破包括:1)"thinking/non-thinking"双模式统一架构,支持按需切换推理深度;2)thinking budget机制实现推理成本动态调控;3)36T token预训练数据体系覆盖119种语言;4)MoE架构实现128专家系统与8专
摘要(149字): 本文解析Qwen3公开训练代码栈,分为三层:官方文档层(训练入口与框架推荐)、公开训练框架层(MS-SWIFT/Megatron的SFT/RLHF实现)、模型定义层(Transformers中的Qwen3结构)。核心训练逻辑由swift/pipelines/train/sft.py控制,通过模板绑定、数据集预处理和Trainer工厂模式实现多任务适配。关键优化包括Packing







