X.AI666 个人主页

@chen695969

X.AI666

2024-02-08 22:50:05 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

【大模型LLM面试合集】有监督微调_lora

LoRA系列方法通过低秩分解实现大模型高效微调。LoRA利用降维矩阵模拟参数更新，显著减少参数量；AdaLoRA动态分配参数预算，基于重要性评分调整矩阵秩；QLoRA结合4bit量化与适配器微调，在保证性能的同时降低显存消耗。实验表明，这些方法在不同任务中均能媲美全量微调效果，且QLoRA首次实现4bit量化下的无损微调。这些技术为大规模语言模型的高效适配提供了实用解决方案。

#人工智能

【大模型LLM面试合集】有监督微调_adapter-tuning

大模型参数高效微调技术：Adapter Tuning及其变体本文综述了Adapter Tuning及其几种改进变体，这些技术旨在解决大模型全量微调的高计算成本问题。核心方法是在预训练模型的Transformer层中插入少量任务特定参数（Adapter模块），仅微调这些新增参数而非整个模型。主要变体包括： AdapterFusion：通过两阶段学习（知识提取+组合）实现多任务知识融合 Adapte

#人工智能

【大模型LLM面试合集】有监督微调_预训练

摘要增量预训练是将领域知识注入大模型的有效方法，其流程包括：选择底座模型、收集TB级数据并进行清洗、选用合适训练框架（3D并行/张量并行/LoRA）、确定数据混合策略。训练时需处理数据至统一长度、调整分词器和模型层名，最后进行模型转换和基础测试。关键是通过高质量数据提升信息密度，优化模型学习效率。

#人工智能

【大模型LLM面试合集】有监督微调_prompting

本文介绍了四种高效微调预训练语言模型的方法：BitFit、Prefix Tuning、Prompt Tuning和P-Tuning。BitFit通过仅更新模型中的bias参数实现微调，参数量仅占0.08%-0.09%，效果接近全量微调；Prefix Tuning为不同任务添加可训练的前缀参数，在生成任务中表现优异；Prompt Tuning简化了Prefix Tuning，仅在输入层添加可学习的p

#人工智能

【大模型LLM面试合集】有监督微调_微调

本文系统梳理大模型微调关键问题，涵盖显存估算、灾难性遗忘、数据构建、领域适配及训练优化等20个核心议题，为高效、稳定地开展全参数微调与指令微调提供实践指南

#人工智能

深度学习新进展：探析AI领域的最新发展

近年来，随着Transformer模型的出现，BERT、GPT-3等模型在语义分析、情感分析、机器翻译和问答系统等任务上不仅效果更好，而且速度更快。近年来，深度学习技术取得了惊人的发展，应用范围不断扩大，涵盖了社交网络、自动驾驶、医疗诊断、金融预测等众多领域。另外，生成对抗网络（GAN）的出现，则引领了计算机视觉领域新的发展方向，如图像合成、图像到图像翻译、视频生成等。深度学习源于人工神经网络，这

#人工智能 #深度学习

人工智能在音乐创作中的双刃剑：创新与挑战

AI生成音乐技术近年来迅猛发展，不仅使音乐创作的门槛大幅降低，还使得创意过程变得更加高效和多样化。精英创企和大厂在这场音乐革命中扮演了重要角色，分别在技术创新和市场推广方面起到了至关重要的作用。AI技术在音乐创作中的应用，既带来了前所未有的机遇，也引发了诸多挑战。通过合理利用AI技术，音乐人可以获得更多灵感和技术支持，创作出更加丰富多样的音乐作品。同时，通过制定相关法规和开展教育培训，可以有效应对

#人工智能

人工智能在音乐创作中的双刃剑：创新与挑战

#人工智能

DeepSeekMine个人知识库，可吞下20G文件，初版Windows和Mac安装包发布！

DeepSeekMine是我们团队开发的一款本地知识库管理软件，历时近四个月，现已推出支持Windows、Mac和Linux的Docker版本，实现一键安装。软件支持完全本地运行，具备高效的RAG查询生成能力，可处理数十至数百GB本地文件。用户只需安装Docker并部署DeepSeekMine镜像，即可通过浏览器访问localhost:3000使用。支持文件/文件夹上传、快速加载、多轮对话及多模型

#人工智能 #AIGC

到底了