logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

FuseLLM-LLMs知识融合

尽管大型语言模型(LLMs)的参数数量庞大,从数十亿到数万亿不等,但现有LLMs仍存在知识空白,限制了它们的能力。这激发了对增强LLMs外部知识和融合不同模型的技术的兴趣。

#人工智能#自然语言处理#生成式AI +1
BYOL:自监督学习的新突破

BYOL(Bootstrap Your Own Latent)是一种创新的自监督学习方法,通过消除对负样本和大批量数据的依赖,显著提高了表示学习的效率。与传统的对比学习方法相比,BYOL在批量大小和数据增强的鲁棒性方面表现更为出色,尤其在ImageNet的线性评估和半监督微调任务中超越了当时的先进模型。其独特的双网络结构(在线网络和目标网络)通过预测机制避免了表示崩溃问题,无需依赖负样本,同时减少

#人工智能
对比学习(Contrastive Learning)作为一种自监督学习的方法

对比学习(Contrastive Learning)作为一种自监督学习的方法,在机器学习和深度学习领域中发挥着越来越重要的作用。其主要目标是优化模型,使得相似的数据样本在特征空间中彼此靠近,而不同的数据样本则被推远

#人工智能#深度学习
PPO:强化学习的核心算法

PPO(Proximal Policy Optimization)是大型语言模型(LLM)对齐的核心算法,尤其在基于人类反馈的强化学习(RLHF)中表现出色。PPO在TRPO(Trust Region Policy Optimization)的基础上进行了简化,通过引入“裁剪”机制,避免了策略更新过大,提高了数据效率和训练稳定性。PPO的简单性、高效性和广泛适用性使其成为RLHF的首选算法,广泛应

文章图片
#算法#人工智能
AdEMAMix: 通过双重EMA优化神经网络训练

在机器学习中,AdamW是用于大型神经网络训练的最常用优化器之一。尽管其广泛使用,但AdamW依赖于单一的指数移动平均(EMA)来对梯度进行加权,这在处理新旧梯度信息时常常表现不足。这种局限性导致在优化过程中难以平衡对较新和较旧梯度的加权,从而影响模型的收敛速度和优化效果。

文章图片
#神经网络#人工智能#深度学习
知识图谱构建:挑战与未来创新

知识图谱作为人工智能革命的基础,其传统构建方法存在耗时、昂贵且依赖大量人工的问题,限制了其广泛应用。Triplex模型通过引入小型语言模型和创新的训练方法,显著降低了构建成本和时间,提高了准确性和可扩展性,为知识图谱技术的普及提供了新的可能性。尽管自动化技术取得了进展,但仍面临准确性、多语言处理、隐私安全等挑战。未来,知识图谱构建技术可能向多模态、主动学习、常识推理等方向发展,进一步提升其应用价值

文章图片
#知识图谱#人工智能
GraphRAG:知识图谱实时更新新突破

GraphRAG的增量更新功能通过优化知识图谱的更新机制,显著提升了大规模数据处理的效率,为知识图谱的实时更新提供了技术支持。LLM辅助的OCR技术结合多模态大语言模型,将OCR扫描的PDF文本转化为高精度、格式化的Markdown文档,提升了数字化文本的准确性和可读性。DocReLM智能文档检索系统通过结合语言模型和文档检索技术,增强了语义理解能力,解决了领域特定语言复杂性和用户查询不精确的问题

文章图片
#知识图谱#人工智能
Long Writer:长文本生成新标杆

Long Writer通过创新的监督微调方法、独特的数据集构建策略以及代理驱动技术(Agent WR),显著提升了长文本生成的连贯性、结构化和质量。其分段生成和逻辑组织技术使模型能够处理复杂主题,生成长达10,000字的高质量文本。这一工具在内容创作、技术写作和教育资源开发等领域展现了强大的应用潜力,满足了不同用户对高质量长文本的需求。Long Writer的开放性和易用性使其成为内容创作者、开发

文章图片
#人工智能
《大语言模型后训练技术:指令、偏好、强化微调的深度解析与发展趋势》

本文系统性地探讨了大语言模型后训练技术的核心内容及发展趋势。首先,详细对比分析了三种主要的微调方法:指令微调(Instruction Finetuning)、偏好微调(Preference Finetuning)和强化微调(Reinforcement Finetuning),阐述了它们在定义、目标、训练方式、优势和局限性等方面的差异。其次,文章归纳了后训练技术的四个关键发展趋势:(1)后训练对模型

文章图片
#语言模型#人工智能#深度学习
知识图谱中的模型之争:RDF vs LPG 及多层图模型的统一方案

在知识图谱(Knowledge Graph)领域,选择使用 RDF(资源描述框架) 还是 LPG(属性图,Property Graph) 一直是社区内备受争议的话题。这种分歧不仅源于两种模型在理论和实现上的差异,还因其对项目整体架构、工具链和开发方法产生了深远的影响。

文章图片
#知识图谱#人工智能
    共 229 条
  • 1
  • 2
  • 3
  • 23
  • 请选择