logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

别再复制粘贴代码了!OpenFang:拥有“系统级权限”的开源 Agent OS,让 AI 真正为你干活。

OpenFang 不是一个简单的聊天机器人,OpenFang 是一个运行在硬件层之上的开源代理操作系统(Agent OS),它是为了让 AI 像人类一样拥有“手脚”并操作电脑而生的智能调度层。它不同于 ChatGPT、Claude 这类仅存在于云端的 AI,也不同于 Siri 这种被阉割的语音助手。市面上的 AI 助手大多停留在“信息交换”层面:你问,它答。而 OpenFang 的设计哲学是**“

文章图片
从视觉感知到 C++ 底层执行:Qwen3.5-9B 边缘侧多模态 Agent 开发全揭秘

llama.cpp是心脏与血液。它本身没有知识,但它提供动力,负责调度硬件资源(CPU/内存),执行矩阵运算。主.gguf是大脑的说明书与语言中枢。它包含了建筑图纸(层数/头数)、沟通协议(Chat Template)和字典(Tokenizer)。主.gguf是大脑的实体神经元网络。这里面存储着 90 亿个被高度压缩(Q4)的参数,蕴含着它所有的编程知识、语言理解能力和逻辑推演法则。是视神经与翻译

文章图片
防注入、防泄漏、断网可用:用Rust重构的IronClaw教你把AI“关在笼子里干活”

IronClaw不仅是一个能帮你做事的个人AI助手,IronClaw是一个基于Rust构建的、以隐私和安全为绝对核心的AI代理执行环境,它是一个坚不可摧的"本地隔离操作系统"。它不同于ChatGPT这类索取你隐私的云端模型,也不同于那些仅仅依靠系统命令裸奔的本地脚本。在AI系统越来越不透明、厂商肆意收集用户数据的今天,IronClaw的设计哲学是**"深度防御 (Defense in depth)

文章图片
告别套壳 Chat!网易有道开源 LobsterAI:基于沙箱隔离与 Cowork 引擎的桌面级超级 Agent

LobsterAI 不是一个简单的套壳聊天框,它是一个运行在本地的、具备全天候待命能力的全场景个人助理 Agent(All-in-One Personal Assistant Agent)。市面上绝大多数的 AI 依然停留在“信息交换”的维度:你问,它答,然后你自己去执行。而 LobsterAI 的底层设计哲学是**“任务共创(Cowork)”与“意图执行”**。它的核心系统基于 Claude A

文章图片
放弃复制粘贴!爆斩50K Star的ECC引擎,如何用Hooks与持久记忆接管你的IDE?

ECC不是一堆Markdown配置文件的无脑拼凑,也不是那种只会念咒语的Prompt库。ECC是一个完整的智能体外壳性能优化系统(Agent Harness Performance Optimization System)。它为你的AI助手注入了技能(Skills)、直觉(Instincts)、持久化记忆(Memory)和安全基线。它不同于原生Copilot或Claude那种“你给指令,它吐代码”

文章图片
榨干 RTX 4090!PowerInfer 用“冷热神经元”调度让 40B 大模型单卡逆天狂飙

PowerInfer 不是一个简单的模型加载器,它是一个针对大语言模型高度局部性(Locality)特征而设计的 CPU/GPU 混合推理引擎。它不同于 vLLM 这种纯吃 GPU 显存的吞金兽。市面上的推理框架大多采用一刀切的策略:要么全放 GPU,要么全放 CPU。而 PowerInfer 的设计哲学是**“冷热分级、各取所长”**。维度传统推理框架 (vLLM/llama.cpp)Power

文章图片
别再盲目喂数据了!DataFlex:像调音师一样驯服 LLM 训练的“数据流水线”

DataFlex 告诉我们:大模型的决胜局,不在于你拥有多少服务器,而在于你如何构建一套自动化的、具备自我演化能力的数据调度系统。如果你只想当一个“调包仔”,那你只需要学会运行脚本;但如果你想成为理解**“系统哲学”**的架构师,DataFlex 就是你 2026 年绝对不能错过的开源宝库。数据的质量决定了模型的上限,而调度的算法决定了你达到上限的速度。

文章图片
#LLaMA-Factory
彻底根治 AI 编程“坏毛病”:从 Karpathy 的吐槽到神级开源工具深度解析

在 AI 时代,所谓的“会写提示词(Prompt Engineering)”正在迅速贬值,因为你再怎么堆砌形容词,也无法精确控制 AI 的行为。未来的核心竞争力将彻底演变为**“定义成功标准(Criteria Engineering)”**。正如项目中的“目标驱动(Goal-Driven)”原则一样,未来无论是让 AI 写文案、做 PPT 还是分析数据,业务人员必须学会抛弃模糊的指令,转而输入强逻

文章图片
爆肝万字!DeepSeek-V4硬核解析:白菜价Token与开源如何重塑AI Agent生态?

DeepSeek-V4 的出现,宣告了大模型“拼参数、拼财力、秀跑分”的 1.0 时代已经终结,我们正在大跨步迈向“拼效率、拼落地应用、拼端云融合”的 2.0 时代。对于我们每一个普通的技术人(无论是写 C++ 的底层老哥,还是搞 Python 的算法新锐),请不要把时间浪费在无休止的“模型对比争论”上。算力已经民主化,接下来拼的是想象力和工程落地能力。还在等什么?赶紧打开你的 VS Code,拉

文章图片
大模型推理与工程优化全景指南

工程逻辑:当对话 Token 达到危险水位(如 80%)时,在后台触发一个低成本、高速度的小模型(如 Qwen-1.5B 或 GPT-3.5-Turbo),让它将前MMM轮对话压缩成一段 200 字的摘要。架构运用:将这段摘要存放在 System Prompt 的下方作为[背景记忆],然后丢弃原始的MMM轮对话,只保留最近几轮的原文。进阶技巧:为了不阻塞主线程,摘要操作通常是异步 (Asynchr

文章图片
    共 184 条
  • 1
  • 2
  • 3
  • 19
  • 请选择