davidwang456 个人主页

@davidwang456

davidwang456

2023-01-05 10:14:18 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

写客服机器人别只会调 GPT：传统NLP也可以大展手脚

《智能客服进化史：从正则表达式到GPT的实用主义架构》文章回顾了NLP技术的演变历程：从规则时代的穷举if-else（如ELIZA机器人），到统计时代的特征工程与分类器（如SVM），再到深度学习的预训练模型（如BERT），最终进入大模型时代（如GPT）。尽管GPT展现出强大意图识别能力，但实际生产环境中，纯依赖大模型会导致高昂成本、延迟和不可控风险。作者提出"漏斗架构"解决方案：规则层处理高频

#机器人 #自然语言处理

转型AI之路：LLM大语言模型从底层到应用层

在LLM应用开发中，Transformers是底层基础库，用于模型微调和研究；vLLM是生产级推理引擎，优化并发性能；Ollama简化本地模型运行，适合开发调试；LlamaIndex专注数据连接，构建RAG系统。典型开发链路包括：用LlamaIndex处理数据，Ollama本地测试，Transformers微调，最终通过vLLM部署。选择工具时，建议本地开发用Ollama+LlamaIndex，生

#人工智能 #语言模型 #自然语言处理 +2

不再依赖 OpenAI：开源 AI 技术栈如何让你构建完全自主的智能应用

开源AI技术栈五层架构解析：从大语言模型到前端交互的完整自主解决方案摘要：开源AI生态已形成完整五层技术栈，让开发者摆脱商业API依赖。1）大语言模型层（Llama、Mistral等）提供媲美商业模型的智能核心；2）数据检索层（Milvus、Weaviate等）实现私有知识管理；3）后端层（LangChain、Ollama等）处理模型调用与流程编排；4）嵌入与RAG层（Nomic、LLMWar

#开源 #人工智能 #语言模型 +2

零基础玩转 MCP：这些开源框架，让你 10 分钟给 AI 装上“手脚”

MCP Server框架指南：为AI模型扩展外部能力 MCP（模型上下文协议）是连接AI模型与外部工具/数据的标准化接口协议，本文介绍了主流MCP Server开发框架及其应用场景。主要内容包括：官方基础SDK： Python SDK提供底层控制能力 TypeScript SDK适配全栈JS生态 Kotlin/Java SDK面向JVM企业应用社区高效框架： FastMCP（Python）：类

#开源 #人工智能

告别“聊完就忘”的 AI：程序员必看的 AI Agent Harness 与 Hermes 深度解析

从“写代码让机器执行（传统编程）”，到“写 Prompt 让 AI 写代码（Copilot 时代）”，再到如今“配置 Harness 让 AI 自主工作并自我进化（Agentic 时代）”，软件工程的范式正在发生十年未有之剧变。作为程序员，我们的核心竞争力不再是手写 CRUD 的速度，而是构建、调度和管理 AI Agent 系统的能力。现在就打开终端，去 GitHub 上拉取 Hermes 的代码

#人工智能 #语言模型 #python

后端工程师转型AI第一课--Ollama与私有化大模型实战

过去一年，越来越多开发者开始接触本地大模型。很多人的第一步都是一样的：安装 Ollama，拉一个模型，输入一句 `ollama run`，看到模型开始回答，心里一阵兴奋。但兴奋过后，问题很快就来了。模型到底该选哪个？为什么别人跑得很快，我这里一卡一卡？为什么同一个问题，有时候回答靠谱，有时候开始胡说？怎么把它接进 Python、Node.js、Web 页面？怎么做企业知识库问答？怎么让团队多人使用

#人工智能 #机器学习 #容器 +2

从大模型到自主智能：开发者必看的 AI Agent 全栈技术指南

当前AI Agent生态已形成标准化分层架构，主要包括六大核心组件：基础模型层（如Llama、GPT系列）作为"大脑"负责推理；数据存储层（Weaviate、Pinecone）构建知识库；开发框架层（LangChain、AutoGen）提供工作流编排；工具执行层（Composio）实现外部系统交互；记忆管理层（Mem0）处理状态持久化；可观测性工具（Langfuse）保障系统监控。掌握这一技术栈将

#人工智能 #架构 #python

从大模型到自主智能：开发者必看的 AI Agent 全栈技术指南

#人工智能 #架构 #python

从大模型到自主智能：开发者必看的 AI Agent 全栈技术指南

#人工智能 #架构 #python

从大模型到自主智能：开发者必看的 AI Agent 全栈技术指南

#人工智能 #架构 #python

共 15 条

请选择