JLY19970726 个人主页

@JLY19970726

JLY19970726

2022-10-16 16:20:12 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Day3 LoRA 低秩适配完整精讲

会更新大模型每一层的所有权重参数。，这也是模型学习风格、语义、领域知识的关键位置。应运而生，是目前轻量化微调的主流方案。完整流程和标准 SFT 大体一致，仅多了。大模型的核心计算集中在。

#人工智能

Day2：SFT 有监督微调原理

SFT 全称是Supervised Fine-Tuning（有监督微调），是大模型微调的基础步骤，也是目前工业界最主流的微调方式。给大模型喂「输入（prompt）+ 期望输出（response）」的配对数据，让模型学习这种固定的对应关系，从而学会按你的要求说话、输出固定格式或特定风格。模型是个通用员工，会做所有事但没固定章法SFT 就是公司给它做岗前培训，教它「遇到这种问题就这么回答」培训完，它就

#人工智能 #深度学习 #机器学习

LangChain Day6 前端视角：简易接口联调思路

框架选择：本节课使用 FastAPI 封装接口，轻量易用，适合 AI 服务开发请求方式GET：参数拼在 URL，适合简单查询POST：参数放请求体，适合长文本、复杂数据，业务首选跨域：前后端分离项目必须配置，否则前端无法调用流程链路前端页面 → HTTP 请求 → FastAPI 接口 → LangChain 逻辑 → 返回结果给前端。

#状态模式

LangChain 第三课：Chain 链精讲

单个任务：用LLMChain。

#python #人工智能

[特殊字符] LangChain Day1：核心架构与组件（第一课）

LangChain 是一个，专门解决 “如何基于大模型快速搭建业务应用” 的问题。

#人工智能

LangChain Day2 课程：提示词模板 + Chain 链精讲

目标：吃透提示词模板与 Chain 核心用法，能独立写出基础问答、串行流程代码，为后续 RAG/Agent 打牢基础。

LangChain Day4 课程：回调、持久化、日志追踪

回调就是钩子函数打印日志、记录耗时监控模型调用次数、token 消耗给前端实时推送生成进度做错误捕获、重试逻辑如果想把日志存到文件、数据库，或者做更复杂的监控，可以继承写自定义回调：python运行print(f"[日志] 模型开始调用，prompt：{prompts[0][:100]}...")print(f"[日志] 模型调用结束，耗时：{duration:.2f}秒")

#python #开发语言

LangChain Day5 课程：Agent 智能代理

普通 LLM/Chain 只能被动执行预设逻辑；Agent（智能代理）可以让大模型自主思考、自主选择工具、自主分步完成复杂任务。核心流程：思考 → 选工具 → 调用工具 → 拿到结果 → 再思考，循环直到任务完成。Calculator：数学计算：联网搜索PythonREPL：执行 Python 代码：维基百科查询当内置工具不满足需求时，可以自己封装工具，固定写法：继承BaseTool。python

#前端

LangChain Day5 课程：Agent 智能代理

#前端

LLM-Day3

检索增强生成（Retrieval-Augmented Generation）作用：让大模型基于私有文档 / 本地知识库回答问题，解决 “模型不知道的内容”核心流程：文档加载：从文件 / 网页 / 数据库读取数据文本分块：把长文档切分成小片段（Chunk）向量化：把文本片段转成向量存入向量库用户提问：问题也转为向量检索召回：从向量库找到和问题最相似的文档片段生成答案：把问题 + 召回片段一起交给大模

#数据库

共 34 条

请选择