
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
Re77 读论文:LoRA: Low-Rank Adaptation of Large Language Models
论文阅读笔记:《LoRA: Low-Rank Adaptation of Large Language Models》

专栏《大模型+RAG原理与实战》目录
专栏《大模型+RAG原理与实战》目录
混合专家模型(MoE)详解
混合专家模型(MoE)详解

LangChain v0.3 langchain.chat_models.init_chat_model调用现成大模型接口进行智能问答教程
LangChain v0.3 langchain.chat_models.init_chat_model调用现成大模型接口进行智能问答教程

Re 81 读论文:AlphaEvolve: A Gemini-powered coding agent for designing advanced algorithms
论文阅读笔记:《AlphaEvolve: A coding agent for scientific and algorithmic discovery》
langchain.text_splitter:用RecursiveCharacterTextSplitter而不是CharacterTextSplitter,解决chunk过长的问题
langchain.text_splitter:用RecursiveCharacterTextSplitter而不是CharacterTextSplitter,解决chunk过长的问题
GPT-1论文阅读笔记_Improving Language Understanding by Generative Pre-Training
这是2018年OpenAI关于初代GPT的论文阅读笔记。先在无监督数据上预训练Transformer decoder语言模型,再在有监督数据上微调。测试了NLI、QA等4个NLU子任务,还介绍了模型结构、优化目标,展示实验数据及模型分析结果。

Re 82:读论文:qwen 3
Qwen3论文阅读笔记
如何使用大语言模型进行事件抽取与关系抽取
本文介绍如何使用大语言模型进行事件抽取与关系抽取

模型量化:轻量化你的深度学习模型
本文介绍模型量化








