logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

如何使用Hugging Face微调大语言模型(LLMs)

而且无需进行额外的训练。但是,如果你想为你的应用定制模型,可能需要在你的数据集上对模型进行微调,以获得比直接使用或训练更小型模型更高质量的结果。本文将介绍如何使用Hugging Face的。

#语言模型#人工智能#自然语言处理 +3
大语言模型在行业中的应用(二):各行业的应用案例解析

随着人工智能技术的不断发展,大语言模型已经逐渐成为了各行各业的得力助手。本文将为大家分析金融、医疗、教育等行业中大模型的应用案例,带你领略这些行业的智能化变革。一、金融行业\1. 背景:金融机构在风险评估、信贷审批等方面需要对大量文本数据进行分析。\2. 应用场景:通过大语言模型对用户的信用报告、还款记录等文本数据进行深度分析,评估用户的信用等级。\3. AI 技术:采用自然语言处理(NLP)、大

文章图片
#语言模型#人工智能#自然语言处理 +1
分享一篇2024年最炸裂的大语言模型综述论文!

这是人大的一篇大语言模型发展综述,特别好的一篇文章,读后受益良多。这篇文章讨论了机器语言智能的发展,特别是大规模预训练语言模型。详细介绍了从语言模型到统计语言模型,神经语言模型到预训练语言模型的演变。并且不止有一篇工作提出,大规模LLM超出某一参数大小的模型扩展导致了新的能力的涌现,这种现象导致了强大的人工智能聊天机器人的诞生。该综述还强调了评估和了解LLMs的必要性,包括它们的预训练、适应性调整

文章图片
#语言模型#人工智能#深度学习 +3
值得收藏!GraphRAG:助力大模型突破“健忘”困局,实现逻辑化升级

值得收藏!GraphRAG:助力大模型突破“健忘”困局,实现逻辑化升级

文章图片
#人工智能#面试#职场和发展 +2
干货,人民大学《大语言模型》PDF全文分享

前段时间,人民大学初版了《大语言模型》一书,涵盖了模型架构、模型预训练、部署使用、智能体等内容。整体而言,《大语言模型》全面介绍了大语言模型的技术背景、发展过程、关键技术、资源、训练方法、微调技术、人类对齐、部署应用以及未来趋势,为读者提供了一个关于大语言模型技术的深入视角。大语言模型的发展历程:文章首先介绍了大语言模型的背景,包括ChatGPT的上线、大语言模型技术的重要性以及其发展历程,从统计

文章图片
#语言模型#人工智能#AIGC +3
【干货收藏】大模型副业掘金手册:从入门到月入过万的AI变现实战指南

【干货收藏】大模型副业掘金手册:从入门到月入过万的AI变现实战指南

文章图片
#人工智能#深度学习#面试 +1
231页pdf大模型新书!《大型语言模型基础》东北大学NLP实验室出品

此外,这一过程是可以迭代优化的。最近的研究表明,一个单一的、训练良好的大型语言模型可以处理大量任务,并通过少量的适配实现对新任务的泛化 [Bubeck et al., 2023]。这里有一个有趣的问题:由于大型语言模型是在海量数据上训练的,我们有理由相信,如果我们能够收集足够多涵盖各种任务并与人类偏好一致的数据,预训练可能使LLMs足够准确和安全,甚至可能消除对齐的需求。大型语言模型带来的重要洞见

文章图片
#自然语言处理#语言模型#pytorch +2
程序员必看!大模型面试刷题攻略:500 + 题刷透,面试稳了》

程序员必看!大模型面试刷题攻略:500 + 题刷透,面试稳了》

#人工智能#面试#职场和发展 +2
程序员必看!大模型面试刷题攻略:500 + 题刷透,面试稳了》

程序员必看!大模型面试刷题攻略:500 + 题刷透,面试稳了》

#人工智能#面试#职场和发展 +2
DeepSeek 开源周技术革新与行业影响深度解析

2025年2月24日至28日,DeepSeek发起的项目,并结合其他四大开源项目的技术突破,解读其对AI行业生态的深远影响。

文章图片
#开源#人工智能#深度学习 +2
    共 648 条
  • 1
  • 2
  • 3
  • 65
  • 请选择