
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
大模型的落地应用中,Ollama和vLLM作为当下最热门的两款大模型部署工具,分别适配了不同的使用场景和需求——前者主打轻量化、易上手,后者聚焦高性能、生产级。怎样才能做出不同场景下的最优选择。

最近关于Qwen3.5还有其幕后团队,市场上的讨论沸沸扬扬,但今天我们不聊八卦,主要讲讲干货。

在微调 Qwen3.5 模型时,你是否遇到过这些困惑:

看来你已经准备好了项目的核心结构和路线图。这份内容非常扎实,它不仅是一个代码库,更像是一套 **Agent 架构师的修炼路径**。

自从 OpenAI 推出 ChatGPT 之后,大模型能力迅速普及。越来越多的开发者开始将 LLM 接入业务系统,但很快会遇到三个现实问题:

最近和开发者交流,发现一个很有意思的现象,很多初学者做RAG,一上手就直奔OpenAI的text-embedding-3-small。的确,这是个无功无过的模型。

388🌟,Datawhale出品。目前已继承到 23.4K🌟的项目Happy-LLM中,二者都是中文原生,非常适合从零手搓详细学习的项目。能够提供大规模框架如llama-index/langchain所不具备的灵活性和可魔改性。

在平时的学习过程中,我都会将与 ChatGPT 之间的对话整理对应的知识文档,但是这却给我带来了一个难题。

你有没有遇到过这种情况?想让 Claude 帮你自动处理某个重复性任务,却发现它总是"忘记"该用什么工具、该按什么步骤执行。你一遍遍地在对话里教它,结果下次还得重新教。

现在人人都在做 LLM Agent,Claude Code、Codex、AutoResearch、OpenClaw,产品已经真实落地了。但到底怎么构建一个好用的 Agent?








