
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
最近在开发一个开源 Agent 项目 ZenoAgent。因为调用商用大模型 API 成本太高,所以决定华为云 ECS 上部署一套本地开源大模型服务。本文记载了服务器部署大模型过程中踩的坑

MCP(Model Context Protocol)是Anthropic推出的标准化协议,旨在解决AI能说不能做的困境。该协议为AI与外部工具/数据源建立统一接口,支持工具发现、调用和资源访问。MCP采用三层架构(Host-Client-Server)和JSON-RPC通信,包含工具、资源和提示三大核心组件,实现AI与外部世界的安全交互。相比传统插件系统,MCP降低了开发成本,解决了工具碎片化和

AI的本质是基于海量数据训练出的概率分布拟合器,所有输出都是对“最可能符合输入需求的结果”的预测。而Dify这类开源平台,通过封装Prompt工程、上下文管理等核心模块,让大模型的工程化落地变得更简单。

在上一篇中,我们聊到AI的本质是概率模型,核心是通过计算概率分布输出最优结果,还通过Dify开源平台了解了大模型交互的工程化逻辑。但实际使用中,让大模型回答“李白哪年出生”这种常识问题时顺风顺水,可一旦问“2025年某行业最新政策解读”“某企业内部产品研发规范”这类专业或时效性强的问题,它要么答非所问,要么“一本正经地胡说八道”。这并不是大模型“变笨了”,而是它从根源上就存在“知识短板”。今天我们

本文讨论了一致性中比较典型的两种场景——冗余数据存储&分布式共识决策中的一致性问题,并且根据总结了常见的解决范式,通过归纳,我们发现很多场景的解决思路非常相似,比如CPU多级缓存和redis-mysql的一致性问题,都是通过同步写+“读屏障”去解决冗余数据的一致性问题...

在上一篇中,我们聊到AI的本质是概率模型,核心是通过计算概率分布输出最优结果,还通过Dify开源平台了解了大模型交互的工程化逻辑。但实际使用中,让大模型回答“李白哪年出生”这种常识问题时顺风顺水,可一旦问“2025年某行业最新政策解读”“某企业内部产品研发规范”这类专业或时效性强的问题,它要么答非所问,要么“一本正经地胡说八道”。这并不是大模型“变笨了”,而是它从根源上就存在“知识短板”。今天我们

AI的本质是基于海量数据训练出的概率分布拟合器,所有输出都是对“最可能符合输入需求的结果”的预测。而Dify这类开源平台,通过封装Prompt工程、上下文管理等核心模块,让大模型的工程化落地变得更简单。

本文介绍是GoDance团队在字节青训营中的一些团队协作,大家从对搜索引擎一无所知到渐渐独立去开发的过程,本文主要以截图方式展现
写这篇文章的目的主要是对过去做过的项目做一个整理,梳理项目中遇到问题和我当时的解决方案,回顾我做项目的过程,总结经验和教训,以便在来年找实习时有一个较好的思路去展示我做过的项目。

这是我在准备软件工程基础考试时根据考点整理的一份知识点汇总。







