
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
如agent接到用户指令后,一步一步思考分解任务,去调用天气情况API、检索知识库Rag系统或LLM自身知识回答与执行任务,同时本文也会详细展示与分析AI Agent再执行任务的整个详细思考过程。

今天给大家推荐的开源项目是来自于 Hugging Face 推出的免费 AI Agents 免费课程。这门课程从基础入门,到掌握如何使用和构建 AI 代理。

随着国内外井喷式的 LLM API 服务开放,如何基于 LLM API 快速、便捷地开发具备更强能力、集成 LLM 的应用,开始成为开发者的一项重要技能。

本文将为你提供一个雄心勃勃但完全可行的计划:在一个月内,快速建立对AI大模型的系统性认知,并具备动手实践和应用开发的能力。
要使用 Ollama 和 Chatbox 实现 DeepSeek R1 的本地 AI 助手,你需要完成以下几个步骤。这个过程包括。

GPT-3 使用大量互联网上的语料,训练完成后,并不适合对话这个场景。如给到 GPT3 输入“中国的首都是哪里?” GPT3 基于训练后的模型的参数进行推理,结果可能是“美国的首都是哪里?训练数据中,这两句话一起出现的概率非常高,在GPT3的训练预料里面可能也会出现多次。但这种输出明显不满足 ChatGPT 的场景。还需要多阶段的优化过程使 ChatGPT 更擅长处理对话,并且能够更好地理解和回应

今天带来的是AIAgent 的另外一个流派,可以支持本地化部署的开源 AIAgent 平台Dify。Dify 是一个开源的 LLMOps(大语言模型运营)平台,它允许开发者能够在本地快速创建和部署 AI 应用。Dify 和 Coze 类似,也是通过可视化的方式进行 AI 应用构建,而且支持多种大语言模型,包含 GPT-3.5 、 GPT-4 等,同时,Dify 的另外一大优势是能接入本地化部署的大

这是一篇入门级大模型应用开发教程,适合后端开发工程师,数据工程师以及大模型应用开发工程师的动手实践教程。需要你具备一丢丢Python语言开发基础,但也仅仅需要基础。

本文讲述评估和量化训练大规模语言模型,尤其是Qwen2-72B模型,所需的时间、资源和计算能力。update:qwen2公布了技术报告[1]。和本文里依赖的基础信息的基本没差。但训练数据集变成7t了。笔者已经在文章中修正。另外训练语料的长度也是在最后阶段才从4096拓展到32768。所以本文预估的算力需求会有一定程度高估,但不到一倍。

LlamaIndex 支持把 Agent 的回答“收口”成结构化 JSON / Pydantic 模型。本文带你理解背后的原理、常见方案、实践示例与工程思考。








