logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Day3 LoRA 低秩适配 完整精讲

会更新大模型每一层的所有权重参数。,这也是模型学习风格、语义、领域知识的关键位置。应运而生,是目前轻量化微调的主流方案。完整流程和标准 SFT 大体一致,仅多了。大模型的核心计算集中在。

#人工智能
Day2:SFT 有监督微调原理

SFT 全称是Supervised Fine-Tuning(有监督微调),是大模型微调的基础步骤,也是目前工业界最主流的微调方式。给大模型喂「输入(prompt)+ 期望输出(response)」的配对数据,让模型学习这种固定的对应关系,从而学会按你的要求说话、输出固定格式或特定风格。模型是个通用员工,会做所有事但没固定章法SFT 就是公司给它做岗前培训,教它「遇到这种问题就这么回答」培训完,它就

#人工智能#深度学习#机器学习
LangChain Day6 前端视角:简易接口联调思路

框架选择:本节课使用 FastAPI 封装接口,轻量易用,适合 AI 服务开发请求方式GET:参数拼在 URL,适合简单查询POST:参数放请求体,适合长文本、复杂数据,业务首选跨域:前后端分离项目必须配置,否则前端无法调用流程链路前端页面 → HTTP 请求 → FastAPI 接口 → LangChain 逻辑 → 返回结果给前端。

#状态模式
[特殊字符] LangChain Day1:核心架构与组件(第一课)

LangChain 是一个,专门解决 “如何基于大模型快速搭建业务应用” 的问题。

#人工智能
LangChain Day2 课程:提示词模板 + Chain 链精讲

目标:吃透提示词模板与 Chain 核心用法,能独立写出基础问答、串行流程代码,为后续 RAG/Agent 打牢基础。

LangChain Day4 课程:回调、持久化、日志追踪

回调就是钩子函数打印日志、记录耗时监控模型调用次数、token 消耗给前端实时推送生成进度做错误捕获、重试逻辑如果想把日志存到文件、数据库,或者做更复杂的监控,可以继承写自定义回调:python运行print(f"[日志] 模型开始调用,prompt:{prompts[0][:100]}...")print(f"[日志] 模型调用结束,耗时:{duration:.2f}秒")

#python#开发语言
LangChain Day5 课程:Agent 智能代理

普通 LLM/Chain 只能被动执行预设逻辑;Agent(智能代理)可以让大模型自主思考、自主选择工具、自主分步完成复杂任务。核心流程:思考 → 选工具 → 调用工具 → 拿到结果 → 再思考,循环直到任务完成。Calculator:数学计算:联网搜索PythonREPL:执行 Python 代码:维基百科查询当内置工具不满足需求时,可以自己封装工具,固定写法:继承BaseTool。python

#前端
LangChain Day5 课程:Agent 智能代理

普通 LLM/Chain 只能被动执行预设逻辑;Agent(智能代理)可以让大模型自主思考、自主选择工具、自主分步完成复杂任务。核心流程:思考 → 选工具 → 调用工具 → 拿到结果 → 再思考,循环直到任务完成。Calculator:数学计算:联网搜索PythonREPL:执行 Python 代码:维基百科查询当内置工具不满足需求时,可以自己封装工具,固定写法:继承BaseTool。python

#前端
LLM-Day3

检索增强生成(Retrieval-Augmented Generation)作用:让大模型基于私有文档 / 本地知识库回答问题,解决 “模型不知道的内容”核心流程:文档加载:从文件 / 网页 / 数据库读取数据文本分块:把长文档切分成小片段(Chunk)向量化:把文本片段转成向量存入向量库用户提问:问题也转为向量检索召回:从向量库找到和问题最相似的文档片段生成答案:把问题 + 召回片段一起交给大模

#数据库
    共 34 条
  • 1
  • 2
  • 3
  • 4
  • 请选择