logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Datawhale Happy-LLM 202509 第8次作业

架构就像一位专业的"作家",它不需要深度理解输入,而是专注于如何流畅地生成文本。正是这种专注,让它成为了当今大语言模型的基石。想象一下,如果AI模型不是"全才",而是专攻"创作"的"作家",会是什么样子?让GPT掌握了语言的生成规律,成为真正的"文本创作专家"。——当今所有大语言模型(如ChatGPT)的核心架构!模型通过看例子就能学会判断,不再需要大量训练数据。当GPT系列闭源发展时,Meta公

#人工智能
Datawhale Happy-LLM 202509 第8次作业

架构就像一位专业的"作家",它不需要深度理解输入,而是专注于如何流畅地生成文本。正是这种专注,让它成为了当今大语言模型的基石。想象一下,如果AI模型不是"全才",而是专攻"创作"的"作家",会是什么样子?让GPT掌握了语言的生成规律,成为真正的"文本创作专家"。——当今所有大语言模型(如ChatGPT)的核心架构!模型通过看例子就能学会判断,不再需要大量训练数据。当GPT系列闭源发展时,Meta公

#人工智能
Datawhale 理工科-大模型入门实训课程 202509 第4次作业

因此,当我们进行 LLM SFT 以提升 LLM 在指定下游任务的表现时,我们需要将训练数据构造成上述格式,并对数据集进行处理来支持模型微调。接下来,我们以角色扮演任务(要求 LLM 扮演甄嬛,以甄嬛的语气、风格与用户对话)为例,演示如何进行微调数据集构造。请大家选择一个 NLP 经典任务(例如情感分类、命名实体识别等),收集该任务的经典训练数据对 Qwen3-4B 进行微调,并评估微调后模型在该

#人工智能
Datawhale AI 夏令营 202507:让AI学会数学推理

科大讯飞AI大赛(模型蒸馏) - Datawhale。

#人工智能
Datawhale AI 夏令营 让AI读懂财报PDF(多模态RAG)202508

跨模态检索与关联 (Cross-Modal Retrieval)、大语言模型(LLM)的应用与推理 (LLM Application & Reasoning)多模态信息处理 (Multimodal Information Processing)、向量化与检索技术 (Embeddings & Retrieval)通义千问Qwen大模型官方仓库 (含多模态VL模型):https://github.co

#人工智能
Datawhale 数学建模导论二 笔记5 多模数据与智能模型

主要涉及到的知识点有:数字图像处理与计算机视觉计算语言学与自然语言处理数字信号处理与智能感知。

文章图片
    共 14 条
  • 1
  • 2
  • 请选择