logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Ollama vs vLLM大模型部署该怎么选-优缺点全解析

大模型的落地应用中,Ollama和vLLM作为当下最热门的两款大模型部署工具,分别适配了不同的使用场景和需求——前者主打轻量化、易上手,后者聚焦高性能、生产级。怎样才能做出不同场景下的最优选择。

文章图片
#人工智能#算法#机器学习 +1
基于PDF的多模态RAG知识库搭建教程(非常详细):Qwen3.5+Milvus+ColQwen2实战,从入门到精通,收藏这一篇就够了!

最近关于Qwen3.5还有其幕后团队,市场上的讨论沸沸扬扬,但今天我们不聊八卦,主要讲讲干货。

文章图片
#milvus#架构#深度学习 +3
从零构建 AI Coding Agent 实战教程(保姆级),Claude Code 架构演进深度解析,收藏这一篇就够了!

看来你已经准备好了项目的核心结构和路线图。这份内容非常扎实,它不仅是一个代码库,更像是一套 **Agent 架构师的修炼路径**。

文章图片
#架构#人工智能#知识图谱 +1
LangChain开发实战教程(非常详细),从LLM调用到Agent架构精通,收藏这一篇就够了!

自从 OpenAI 推出 ChatGPT 之后,大模型能力迅速普及。越来越多的开发者开始将 LLM 接入业务系统,但很快会遇到三个现实问题:

文章图片
#架构#人工智能#知识图谱 +1
2026 年,Embedding要怎么选?(实测Gemini 、jina、Qwen、BGE、OpenAI十大模型)

最近和开发者交流,发现一个很有意思的现象,很多初学者做RAG,一上手就直奔OpenAI的text-embedding-3-small。的确,这是个无功无过的模型。

文章图片
#jina#java#人工智能 +3
RAG 构建,学这四个神级项目就够了

388🌟,Datawhale出品。目前已继承到 23.4K🌟的项目Happy-LLM中,二者都是中文原生,非常适合从零手搓详细学习的项目。能够提供大规模框架如llama-index/langchain所不具备的灵活性和可魔改性。

文章图片
#数据库#服务器#网络 +2
你的 RAG 检索效果差?可能是结构用错了!

在平时的学习过程中,我都会将与 ChatGPT 之间的对话整理对应的知识文档,但是这却给我带来了一个难题。

文章图片
#数据库#服务器#网络 +2
终于有人把 AI Agent Skill 开发流程整明白了——Anthropic skill-creator 实战解读

你有没有遇到过这种情况?想让 Claude 帮你自动处理某个重复性任务,却发现它总是"忘记"该用什么工具、该按什么步骤执行。你一遍遍地在对话里教它,结果下次还得重新教。

文章图片
#人工智能#数据库#服务器 +3
如何打造真正好用的Agent(非常详细),LLM应用落地全攻略,收藏这一篇就够了!

现在人人都在做 LLM Agent,Claude Code、Codex、AutoResearch、OpenClaw,产品已经真实落地了。但到底怎么构建一个好用的 Agent?

文章图片
#spring#java#后端 +4
    共 2036 条
  • 1
  • 2
  • 3
  • 204
  • 请选择