supplycc 个人主页

@supplycc

supplycc

2024-03-08 18:24:16 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

【考研复试·项目实战】基于BART的特定领域文本生成系统：从预训练到推理全流程解析

针对通用预训练模型在特定领域（如医疗报告、法律文书、竞赛数据）中表现不佳的问题，本项目实现了一个基于 BART (Bidirectional and Auto-Regressive Transformers) 的文本生成系统。项目采用 “领域自适应预训练 (Domain Adaptive Pre-training)” + “下游任务微调 (Fine-tuning)” 的两阶段训练策略。本文将结合源

#考研

深度学习生成任务 (Seq2seq & Transformer) 核心考点全解析

本文系统讲解了Transformer架构在生成任务中的核心原理与应用。重点解析了Encoder-Decoder结构、MaskedAttention机制和位置编码等关键技术，并深入对比了训练时的TeacherForcing与推理时的Autoregressive模式差异。文章还介绍了KVCache优化和BeamSearch等实用技巧，为理解现代大模型工作原理提供了清晰框架，特别适合考研复试准备。

#深度学习 #transformer #nlp

到底了