
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
最近写代码有了好的助手cursor,大部分的轮子代码我都是让它帮我写,我主要是python,但是我用cursor帮媳妇写java和前端,哈哈,完全能hold住,但是有个问题,国内没有梯子使用cursor不太友好,而且cursor还要花钱,本着开源至上(白嫖^\_^),最近发现了一个效果很不错的大模型,这里推荐给大家。

ollama 是一个开源的本地大语言模型运行框架,它提供了非常简单便捷的使用形式,让用户可以十分方便的在本地机器上部署和运行大型语言模型,从而实现免费离线的方式使用 LLM 能力,并确保私有数据的隐私和安全性。

在日常业务场景中,业界普遍使用 DeepSeek 全量版、阿里千问等大型语言模型。与此同时模型生态平台上,还存在大量轻量级模型,其参数规模仅为数 B 级别,甚至如 Qwen3 0.6B 这类更小规格的模型也有其生存空间,与 DeepSeek 671B 的全量版本形成非常大的差异。那么小型语言模型存在的价值和使用场景在哪里。要回答这一问题,企业可从以下维度评估自身实际情况:

AI 智能体已经在企业的众多场景中落地,比如:对话与问答、报告生成、内容审核、流程自动化、可视化数据分析、AI 编程等。

AI Agent是模型、工具、编排层和运行时服务的有机组合,通过上下文策略管理循环工作。与传统软件开发不同,Agent更像导演,通过组装上下文、提示模型、观察结果和重新组装的循环解决问题。随着技术发展,重点从提示词工程转向上下文工程,需管理包含指令、工具、记忆和用户画像的动态环境。配置良好的Agent能成为应对未知挑战的智能团队成员。

AI Agent已超越对话机器人,发展为感知环境、自主决策的智能系统。文章详解其六大核心模块:感知模块负责信息标准化;决策引擎通过思维链推理进行动态规划;执行系统将决策转化为可靠指令;记忆管理实现分层知识存储;反馈优化模块推动持续进化。这种模块化架构使AI Agent具备自主性、适应性和成长性,推动AI从实验室走向实际应用场景。

本文详细介绍了Agent规划(planning)的核心概念和工作流程。规划是指Agent根据用户任务目标及约束条件,生成并执行最优解决方案的过程。文章阐述了规划的三个关键组件:计划生成、验证和执行,指出复杂任务需要解耦这三个阶段以提高效率。作者讨论了大型语言模型(LLM)在规划中的作用,认为虽然LLM可能存在规划能力局限,但通过提示工程和工具集成仍可有效完成规划任务。文中还比较了强化学习(RL)A

本文介绍了AI Agent开发中面临的多租户存储挑战,提出Agent Bucket解决方案,通过在Bucket和Object之间引入ObjectSet层级,为每个用户提供专属"数据保险箱"。这种设计实现了原生隔离、权限控制、精细监控、精确计量等能力,有效解决了传统对象存储在多租户场景下的扩展性、安全性和管理复杂度问题,助力开发者高效构建可扩展的AI Agent应用。

本文系统介绍大语言模型基础知识,从N-gram、RNN到Transformer架构演进,详解自注意力机制等核心组件。涵盖提示工程、文本分词、模型调用等交互方法,以及模型选型考量因素。同时探讨缩放法则与幻觉等局限性,为构建智能体提供理论基础和实践指导。

文章探讨了企业AI Agent项目面临的困境,包括幻觉、语义不一致和决策难以解释等问题。现有解决方案如Skills/RAG和工作流仅能局部"止痛"。作者提出引入本体(Ontology)作为企业"语义层",通过构建业务世界的数字化模型,实现复杂业务推理并解放业务规则。本体由类、实例、关系、属性、约束和推理六块核心积木构成,能有效解决企业AI的"盲目"问题,是构建可靠AI Agent的关键。








