神州问学个人主页

@2401_82452722

神州问学

2024-08-16 11:31:40 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

AI Agent新对决：LangGraph与AutoGen的技术角力

个人认为这个“Graph”框架使其在构建更复杂和更有见地的工作流程时更具直观性和更好的开发体验，通过对“Graph”的定义，可以对一个 LLM 应用的处理过程进行非常细节的编排设计，从而满足大量复杂场景的 AI Agent 产业应用落地。当然，这一特征也是可选的，如果你不需要要时，就可以选择完全自动的模式。对于简单的问答系统，LCEL都能够提供快速且准确的服务，然而当面对一些更为复杂的任务时，就显

#microsoft #人工智能 #深度学习 +1

有了RAG我们还需要微调吗?

如何在资源受限的环境中有效部署PEFT模型是一个挑战。目前,大模型的热度居高不下,随着大模型的火爆越多的公司和组织开始使用大模型技术,往往大模型可以解决日常中的大部分问题,对于企业的私有知识的问答我们也可以通过RAG技术来进行实现,但是在面对特定任务、领域和场景时,基础大模型的通用知识往往不能给到我们准确的回复,而RAG技术通常依赖于通用知识库,这可能不包含特定领域的最新或者最专业的信息.最终我们

#人工智能

在AI云原生时代应该如何应对复杂的算力环境

目前的算力环境仍然已英伟达的GPU设备为主,但是目前也有很多厂商的设备在被使用,虽然其中主流厂商都有提供自己的卡在K8S上的调度支持,但是这些厂商方案往往比较基础,通常需要按照卡的数量进行调度而没办法进行更细粒度的调度,导致很多计算资源被浪费,HAMI基于这些厂商的开源方案进行集成,主要在使用劫持CUDA的方案来实现计算设备的共享、隔离,在插件层使用一个方案集成多种计算资源.除了列举的几种情况外,

#人工智能 #云原生

读懂RAG这一篇就够了，万字详述RAG的5步流程和12个优化策略

©作者|帅气的桌子来源|神州问学RAG概述ChatGPT、GLM等生成式人工智能在文本生成、文本到图像生成等任务中表现出令人印象深刻的性能。但它们也存在固有局限性，包括产生幻觉、缺乏对生成文本的可解释性、专业领域知识理解差，以及对最新知识的了解有限。为了克服这些限制，提高模型的能力，有两种主要途径：一种是微调（Fine Tune）来更新模型，另一种是让他们能够与外部世界互动，以不同的形式和方式获取

#人工智能 #深度学习 #机器学习

GPT-4o mini发布，轻量级大模型如何颠覆AI的未来？

随着技术的进步和市场需求的增长，未来的大模型将趋向于更高的效率、更轻量的设计以及更广泛的可及性。面壁智能的刘知远教授认为，2023年ChatGPT和GPT-4的推出表明大模型技术路线已经基本确定，接下来的重点是探索其科学机理，并极致地优化效率。大模型进入市场竞争的新阶段，如何打动用户不仅依赖技术实力的展示，还需要证明模型在性能相当的情况下更加小巧、经济，更具性价比。这些技术实现方法通过不同的方式优

#人工智能

到底了