
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
会更新大模型每一层的所有权重参数。,这也是模型学习风格、语义、领域知识的关键位置。应运而生,是目前轻量化微调的主流方案。完整流程和标准 SFT 大体一致,仅多了。大模型的核心计算集中在。
SFT 全称是Supervised Fine-Tuning(有监督微调),是大模型微调的基础步骤,也是目前工业界最主流的微调方式。给大模型喂「输入(prompt)+ 期望输出(response)」的配对数据,让模型学习这种固定的对应关系,从而学会按你的要求说话、输出固定格式或特定风格。模型是个通用员工,会做所有事但没固定章法SFT 就是公司给它做岗前培训,教它「遇到这种问题就这么回答」培训完,它就
框架选择:本节课使用 FastAPI 封装接口,轻量易用,适合 AI 服务开发请求方式GET:参数拼在 URL,适合简单查询POST:参数放请求体,适合长文本、复杂数据,业务首选跨域:前后端分离项目必须配置,否则前端无法调用流程链路前端页面 → HTTP 请求 → FastAPI 接口 → LangChain 逻辑 → 返回结果给前端。
单个任务:用LLMChain。
LangChain 是一个,专门解决 “如何基于大模型快速搭建业务应用” 的问题。
目标:吃透提示词模板与 Chain 核心用法,能独立写出基础问答、串行流程代码,为后续 RAG/Agent 打牢基础。
回调就是钩子函数打印日志、记录耗时监控模型调用次数、token 消耗给前端实时推送生成进度做错误捕获、重试逻辑如果想把日志存到文件、数据库,或者做更复杂的监控,可以继承写自定义回调:python运行print(f"[日志] 模型开始调用,prompt:{prompts[0][:100]}...")print(f"[日志] 模型调用结束,耗时:{duration:.2f}秒")
普通 LLM/Chain 只能被动执行预设逻辑;Agent(智能代理)可以让大模型自主思考、自主选择工具、自主分步完成复杂任务。核心流程:思考 → 选工具 → 调用工具 → 拿到结果 → 再思考,循环直到任务完成。Calculator:数学计算:联网搜索PythonREPL:执行 Python 代码:维基百科查询当内置工具不满足需求时,可以自己封装工具,固定写法:继承BaseTool。python
普通 LLM/Chain 只能被动执行预设逻辑;Agent(智能代理)可以让大模型自主思考、自主选择工具、自主分步完成复杂任务。核心流程:思考 → 选工具 → 调用工具 → 拿到结果 → 再思考,循环直到任务完成。Calculator:数学计算:联网搜索PythonREPL:执行 Python 代码:维基百科查询当内置工具不满足需求时,可以自己封装工具,固定写法:继承BaseTool。python







