logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

自动钓鱼让大模型“发疯”的token,来自Transformer作者创业公司

现在,来自Cohere的研究人员针对这个问题,提出检测“故障”token的有效方法,他们还发现:在多个主流开源大语言模型上,包括Llama系列、Mistral系列在内,训练不足的token都在不同程度上普遍存在。简单来说,由于大模型tokenizer的创建和模型训练是分开的,可能导致某些token在训练中很少、甚至完全没出现过。值得注意的是,论文提到,基于相同tokenizer的模型表现相似,而不

文章图片
#transformer#AI作画#迁移学习 +2
2024北京市人工智能大模型行业应用分析报告

北京市委市政府高度重视人工智能发展,2023年5月,北京市政府印发《北京市加快建设具有全球影响力的人工智能创新策源地实施方案(2023-2025年)》,强调构建高效协同的大模型技术产业生态,建设大模型算法及工具开源开放平台,构建完整大模型技术创新体系。北京市政府办公厅印发《北京市促进通用人工智能创新发展的若干措施》,强调开展大模型创新算法及关键技术研究、加强大模型训练数据采集及治理工具研发,推动大

文章图片
#人工智能#开源#语言模型 +4
AI如何升级你的“第二大脑”

百模大战之后,大伙儿或许有个共识:现在不缺大模型,缺的是怎么更好地把大模型用起来的方法。有个现成的例子是,一直被很多知识工作者当成自己的“第二大脑”来用,在AIGC时代,用户看到了它更智能的改变。其实早在2018年,印象笔记就在AIGC的领域里开启了自己的摸爬滚打,几年下来,积累了不少经验和思考。在本次中国AIGC产业峰会上,从知识管理的角度,分享了印象笔记在AIGC领域,从技术到应用和产品的所见

文章图片
#人工智能#计算机视觉#生成对抗网络 +2
国产多模态 大模型 开源!性能超Claude 3 Sonnet

在当今快速发展的人工智能领域,国产技术正不断取得突破性进展。最近,由元象公司推出的XVERSE-V多模态大模型,以其卓越的性能和开放的商业模式,引起了业界的广泛关注。

文章图片
#语言模型#人工智能#开源 +2
大模型方向好书推荐

我们已经加速进入了大模型的时代。以ChatGPT为首的一些超强模型服务,背后是百亿或千亿参数的基础模型,它们学到了丰富的世界知识,领悟了“与人类打交道”的门路,甚至开始连接和使用外部工具、成为“万物接口”。新的时代有新的机会,与其担心AI将取代我们的工作,不如学会驾驭它!不远的未来,AI大模型或许将是人人可用、人人可开发。本期大牛书单,我们请来了几位鹅厂同事,为大家推荐一些大模型相关的书籍文献和学

文章图片
#人工智能#microsoft#开源 +4
国产多模态 大模型 开源!性能超Claude 3 Sonnet

在当今快速发展的人工智能领域,国产技术正不断取得突破性进展。最近,由元象公司推出的XVERSE-V多模态大模型,以其卓越的性能和开放的商业模式,引起了业界的广泛关注。

文章图片
#语言模型#人工智能#开源 +2
大模型方向好书推荐

我们已经加速进入了大模型的时代。以ChatGPT为首的一些超强模型服务,背后是百亿或千亿参数的基础模型,它们学到了丰富的世界知识,领悟了“与人类打交道”的门路,甚至开始连接和使用外部工具、成为“万物接口”。新的时代有新的机会,与其担心AI将取代我们的工作,不如学会驾驭它!不远的未来,AI大模型或许将是人人可用、人人可开发。本期大牛书单,我们请来了几位鹅厂同事,为大家推荐一些大模型相关的书籍文献和学

文章图片
#人工智能#microsoft#开源 +4
人工智能的未来?RAG 结合了语言和搜索

随着专家们暗示大型语言模型(LLM)的技术极限即将到来,人们的焦点转向了检索增强生成(RAG)——这是一项很有前途的进步,可以通过将信息检索与自然语言生成相结合来重新定义人工智能(AI)。LLM引领了人工智能技术,并改进了各种应用。然而,他们产生虚假信息的倾向限制了他们的潜力。RAG 允许 AI 访问特定的外部数据并将其纳入其响应中,使其更加有效和准确。

文章图片
#人工智能
    共 14 条
  • 1
  • 2
  • 请选择