logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Hugging Face Trainer:一站式深度学习训练解决方案

Hugging Face是一个非常流行的自然语言处理工具库,其中的Trainer类是它的一个重要组件。Trainer类提供了一个一站式的深度学习训练解决方案,使得开发者可以快速构建和训练深度学习模型。本文将对Hugging Face Trainer类进行详细介绍,并结合具体的原理和代码进行讲解。

文章图片
#深度学习#人工智能#机器学习
深入浅出——深度学习训练中的warmup

深度学习已经成为了机器学习领域的热门话题之一。在深度学习中,神经网络是最为常用的模型之一。神经网络的训练是深度学习的核心环节之一,而在神经网络训练过程中,warmup技术已经成为了一种非常重要的技术。它可以加速模型的收敛速度,提高模型的泛化能力,解决深度神经网络训练初期的不稳定性等问题。本文将从原理和实践两个方面,深入浅出地介绍深度学习训练中的warmup技术,帮助读者更好地理解和应用这一重要技术

文章图片
#深度学习#人工智能#神经网络 +2
探索深度学习中的计算图:PyTorch的动态图解析

深度学习已经成为人工智能领域的重要研究方向之一。在深度学习中,计算图扮演着至关重要的角色。PyTorch是一种广泛使用的深度学习框架,它采用了动态图的概念,为用户提供了灵活且易于使用的计算图工具。本文将深入介绍PyTorch中的计算图,包括原理讲解、代码示例和计算图在深度学习中的作用。

文章图片
#深度学习#pytorch#人工智能
情感分析实战:自然语言处理领域中的热门任务

自然语言处理(NLP)是人工智能领域中的一项重要技术,它的目标是让计算机能够理解、处理和生成人类的自然语言。情感分析(Sentiment Analysis)是NLP中的一项重要任务,它的目标是自动判断一段文本中所表达的情感是正面、负面还是中性的。情感分析在商业、政治、社交媒体等领域都有着广泛的应用,例如在产品评价、舆情分析、政治选举等方面。

文章图片
#自然语言处理#人工智能
大模型部署实战(二)——Ziya-BLIP2-14B-Visual

Ziya-Visual多模态大模型基于姜子牙通用大模型V1训练,具有视觉问答和对话能力。今年3月份OpenAI发布具有识图能力的多模态大模型GPT-4,遗憾的是,时至今日绝大部分用户也都还没有拿到GPT-4输入图片的权限,Ziya-Visual参考了Mini-GPT4、LLaVA等优秀的开源实现,补齐了Ziya的识图能力,使中文用户群体可以体验到结合视觉和语言两大模态的大模型的卓越能力。本文主要用

文章图片
#python#人工智能#深度学习
Atom of Thoughts for Markov LLM Test-Time Scaling论文解读

近年来,大型语言模型在训练规模的扩展上取得了显著的性能提升。然而,随着模型规模和数据量的增长遇到瓶颈,测试时扩展(test-time scaling)成为进一步提升模型能力的新方向。传统的推理方法,如思维链(Chain of Thought, CoT)和思维树(Tree of Thought, ToT),在推理过程中过度依赖完整的历史信息,导致计算资源浪费,并可能干扰有效的推理。

文章图片
【NLP应用场景全解】自然语言处理如何改变世界?

自然语言处理作为人工智能的重要分支,正在加速改变各行各业。根据Statista预测,到2025年,全球NLP市场规模将达到438亿美元。本文将系统梳理NLP的主要应用场景,结合最新技术趋势,帮助你了解NLP技术的落地现状与未来发展方向。

文章图片
#自然语言处理#人工智能
NLP/大模型八股专栏结构解析

🎯 专栏推荐 | 搞定NLP面试,从这里开始! NLP面试到底考啥?这套专栏替你总结好了!基础知识、经典算法、热门应用,还有面试官爱问的坑题,统统带解析。 不想临时抱佛脚?不想面试时一脸懵?来这里,轻松搞懂,稳稳拿Offer。 适合自学提升,也适合面试突击,赶紧收藏,一起上岸!

文章图片
#自然语言处理#人工智能
优质LLM Agent项目推荐清单

1. Camel:基于角色扮演的多智能体对话系统 简介:让两个或多个Agent通过角色扮演自然对话,合作完成任务。特点:引入“用户代理”和“助手代理”设定,自主沟通任务细节。应用场景:复杂任务分解、对话型协作、问题求解。GitHub地址:Camel-AI/camel 2. GPT-Engineer:自动化的软件工程师助手 简介:根据自然语言需求自动生成完整的软件项目(包括代码结构、文档等)。特点:

#自然语言处理#人工智能#语言模型
LLM Agents项目推荐:MetaGPT、AutoGen、AgentVerse详解

和,包括它们的背景、设计思路、主要功能、技术亮点以及典型应用场景。这一部分我们将深入介绍三大备受关注的LLM Agents项目:**MetaGPT**、**AutoGen**和**AgentVerse**,包括它们的背景、设计思路、主要功能、技术亮点以及典型应用场景。

#自然语言处理#语言模型#人工智能
    共 75 条
  • 1
  • 2
  • 3
  • 8
  • 请选择