logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Google DeepMind智能委托框架:AI助手实现领袖级自主决策能力

Google DeepMind智能委托框架:AI助手实现领袖级自主决策能力

文章图片
#人工智能
Google DeepMind智能委托框架:AI助手实现领袖级自主决策能力

Google DeepMind智能委托框架:AI助手实现领袖级自主决策能力

文章图片
#人工智能
KRAFTON揭秘:AI视觉模型在微妙差异识别上的惊人短板

KRAFTON揭秘:AI视觉模型在微妙差异识别上的惊人短板

文章图片
#人工智能
KRAFTON揭秘:AI视觉模型在微妙差异识别上的惊人短板

KRAFTON揭秘:AI视觉模型在微妙差异识别上的惊人短板

文章图片
#人工智能
OpenAI与Anthropic发布推理优化大语言模型

A:OpenAI发布了gpt-oss-120b和gpt-oss-20b两个开源推理模型。Vellante表示:"无论OpenAI的意图如何,开源权重推理模型使前沿模型能力民主化,但将价值对话推向企业智能体、专有数据、强化学习反馈效果和业务上下文的更高层面。OpenAI表示,gpt-oss-120b和gpt-oss-20b在多项推理任务中超越了同等规模的开源模型。OpenAI发布的新算法gpt-os

文章图片
#语言模型#人工智能#自然语言处理
摩根大通开发AI幻觉“疫苗“:让大语言模型不再胡说八道的神奇药方

摩根大通开发AI幻觉"疫苗":让大语言模型不再胡说八道的神奇药方

文章图片
#人工智能
MIT团队发明“智能减肥法“让AI训练快1.6倍:只需要一半的算力就能教会大模型新技能

SparseLoRA提供的解决方案让更多的研究者和开发者能够以更低的成本训练和部署先进的AI模型,这对于AI技术的普及和发展具有重要意义。近年来,研究人员开发了一些"偷懒"的方法,比如LoRA、QLoRA和DoRA,它们通过只训练模型的一小部分参数来节省内存,就像给学生发一本薄薄的补充教材,而不是厚厚的全科教科书。例如,在LLaMA3-8B的数学推理任务中,他们对第3到第30层的FFN应用99%的

文章图片
#人工智能#深度学习#机器学习
大语言模型为什么老是“胡编乱造“?OpenAI团队揭开AI幻觉的真相

大语言模型为什么老是"胡编乱造"?OpenAI团队揭开AI幻觉的真相

文章图片
#人工智能#机器学习
腾讯AI实验室:为什么AI会为“2+3=5“这样的简单问题绞尽脑汁?

腾讯AI实验室:为什么AI会为"2+3=5"这样的简单问题绞尽脑汁?

文章图片
#人工智能
清华大学首次用控制理论破解AI绘画的“高剂量引导“难题

清华大学首次用控制理论破解AI绘画的"高剂量引导"难题

文章图片
#人工智能
    共 873 条
  • 1
  • 2
  • 3
  • 88
  • 请选择