logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型在企业知识库场景的落地思考

今天我们深入探讨了企业在知识库场景下运用大型模型的实践策略。我们首先分析了大型模型在企业实际应用中所面临的挑战,包括算力、调度和数据等方面的问题。随后,我们提出了一系列解决方案,包括构建高效管理和自适应扩展的算力资源体系,开发或引进先进的调度系统,以及建立完善的数据处理流程。最后,我们强调了企业在实施大型模型实践策略时,必须关注数据安全、隐私和合规问题,以确保实践方案的可行性和可持续性。

文章图片
#人工智能#架构#语言模型 +2
急!现在转大模型还来得及吗?

大模型的出现,让行内和行外大多数人都感到非常焦虑。行外很多人想了解却感到无从下手,行内很多人苦于没有硬件条件无法尝试。想转大模型方向,相关的招聘虽然层出不穷,但一般都要求有大模型经验。而更多的人,则一直处于观望之中,感觉自己只能每天看看各种自媒体,以及在聊天时的各种口嗨,难以躬身入局。但也有不少人对其表示怀疑,巨大的算力成本和模糊的落地场景是其发展的阻碍。大家更容易将其和元宇宙等概念联系起来,视为

文章图片
#人工智能#学习
小白也能学会:为AI Agent安装MemMachine“大脑“,实现真正的长期记忆

MemMachine为AI Agent提供双层记忆系统(剧情脑和档案脑),解决LLM"金鱼记忆"问题。教程详述其安装配置(支持OpenAI和阿里云API),使AI能持久化记忆用户信息,适用于客服、陪伴型AI等场景,让AI真正"了解你、记得你"。

文章图片
#人工智能
一文讲清楚:大模型Post-Training的完整技术版图

很多人学大模型,学到后面都会卡在一个地方:**模型已经预训练完了,接下来还能干什么?**答案只有一个词:**Post-Training(模型后训练)**。你现在用到的 ChatGPT、通义千问、DeepSeek、Claude,本质上都不是“裸的预训练模型”,而是一整套 **Post-Training 技术堆出来的结果**。今天这篇文章,我结合 **2025 年 ACL 发布的一篇 Post-Tra

文章图片
#人工智能
大语言模型评测方法全面总结!

自2017年Transformer模型提出以来,自然语言处理研究逐步转向基于该框架的预训练模型,如BERT、GPT、BART和T5等。这些预训练模型与下游任务适配后,持续刷新最优结果。然而,现有评测方法存在广度和深度不足、数据偏差、忽视模型其他能力或属性评估等问题。因此,需要全面评测和深入研究模型的各项能力、属性、应用局限性、潜在风险及其可控性等。本文回顾了自然语言处理中的评测基准与指标,将大语言

文章图片
#语言模型#人工智能#自然语言处理 +2
使用Ollama本地部署Llama 3.1大模型

Llama 3.1 介绍2024 年 7 月 24 日,Meta 宣布推出迄今为止最强大的开源模型——Llama 3.1 405B,Llama 3.1 405B 支持上下文长度为 128K Tokens, 增加了对八种语言的支持,号称第一个在常识、可操纵性、数学、工具使用和多语言翻译方面与顶级人工智能模型相媲美的模型。当然 405B 新一代大模型所需要的算力成本也是巨大的,一般的中小型企业和个人需

文章图片
#人工智能#数据库#自然语言处理
企业级智能问答系统踩坑实录:RAG老是达不到效果的优化方案

由于大模型技术的复杂性,再加上不同业务场景的特殊需求,导致大模型应用的开发难度很大;但大模型应用开发最难的不是做出来而是要做好。这次还以作者手里的智能问答项目来说,记录一下智能问答系统的踩坑记录,从怎么都达不到想要的效果,到能够很好的满足业务场景。

文章图片
#人工智能#RAG
AI大模型工业应用模式及其实现

人工智能是引领这一轮科技革命和产业变革的战略性技术,具有“头雁”效应,溢出带动性很强。通用人工智能大模型(以下简称“大模型”)作为人工智能从专用化迈向通用化的发展新阶段,是集智能感知、智能分析、智能决策、智能执行等功能于一体的泛在智能技术,通过数据、算力、算法三要素深度融合,实现生产要素优化配置。从生产结构来看,人工智能技术已成为现代工业生产的核心组成部分,能够大幅提高生产效率、优化资源配置、降低

文章图片
#人工智能#AIGC#自然语言处理 +1
工业大模型为何要落地很难?

AI大模型的落地关键,是解决技术与应用场景间的鸿沟。这涉及如何使大模型更好地适应特定的工业应用场景,以及如何克服不同模型和算力平台特性的差异带来的现实挑战。另外,在高精度要求行业中,应用场景适应性问题难度更大。

文章图片
#人工智能#语言模型#自然语言处理 +1
2024年国内人工智能大模型汇总

作为360鸿图大模型的重要组成,智脑模型拥有多项核心功能,包括多模态理解、多语言处理、知识问答、逻辑推理、多轮对话等。九天人工智能平台提供人工智能算力、算法、数据,汇聚优秀AI能力,打造从智算基础设施、核心算法能力到智能化应用的全栈人工智能服务,全面支持自智网络等多样化运营商智慧运营需求,为工业、医疗、政务、教育、金融等行业客户构建创新解决方案。此外,360智脑模型还积极与各行业合作伙伴共同打造行

文章图片
#人工智能#数据库#搜索引擎
    共 518 条
  • 1
  • 2
  • 3
  • 52
  • 请选择