logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

详解-大模型推理(Llama3)相关参数和显存计算!

LLM 推理任务需要大量的算力,将现代 GPU 推向极限。过去两年, LLM 训练和推理优化相关的研究进展速度惊人,每六个月就会出现新的突破。今天的分享主要,为大家介绍LLM 推理领域所必备的一些基本数学与概念,这包含了Llama3的以及,对于张量、矩阵等基本数学原理本文不会赘述。我们先来看看标准的架构。左图来自于大模型技术的起源之作《Attention is all you need》,这是一个

文章图片
#人工智能#大数据#自然语言处理 +1
图解AI技术架构:开发、训练、部署全流程一看就懂

人工智能(AI)技术的快速发展,使得企业在AI模型的开发、训练、部署和运维过程中面临前所未有的复杂性。从数据管理、模型训练到应用落地,再到算力调度和智能运维,一个完整的AI架构需要涵盖多个层面,确保AI技术能够高效、稳定地运行。本文将基于AI技术架构全景图,深入剖析AI的开发工具、AI平台、算力与框架、智能运维四大核心部分,帮助大家系统性地理解AI全生命周期管理。

文章图片
#人工智能#深度学习#transformer +1
大模型时代什么人才最抢手?哪些是万金油岗位?

近些年迅速发展的大规模预训练模型技术,正在让机器逐渐具备像人一样的认知智能,但是也对算法、系统、算力提出新的需求和挑战。那么,未来 AI 的架构将会是怎样的?大概从去年,进入了另外一个新的时代——大模型时代。在大模型时代,算法人员无法从头训练一个模型,而是需要依赖于基础模型,并且以基础模型去适配下游应用场景。

文章图片
#人工智能#产品经理#学习 +1
收藏必备:AI大模型架构全景图:从小白到程序员的完整学习指南

文章系统解析AI架构四大核心部分:AI开发工具(大模型和场景化工具链)、AI平台(数据管理、开发环境、训练部署)、AI算力与框架(资源管理、框架支持、算力平台)以及智能运维(配置管理、资源监控、自动优化)。这些内容帮助读者全面了解AI全生命周期管理,确保AI系统高效稳定运行,为AI项目提供技术支持。

文章图片
#人工智能#学习#产品经理
最新AI大模型10大趋势:人类步入“机器外脑”新时代

‍‍2024年悄然过半,人工智能技术正以前所未有的速度推动着社会的变革。AI大模型技术作为这一浪潮的先锋,正在各行各业中重塑着人类与机器的关系,使之更紧密、更智能。本文将深入探讨AI大模型的十大趋势,揭示其如何成为人类的“机器外脑”。算力是大模型发展的基石,2024年我们见证了算力集群规模的显著增长,从数千卡到十万卡,这不仅是量的飞跃,更是效率的提升。腾讯自研的“星脉”高性能网络解决方案,采用自研

文章图片
#人工智能#学习#自然语言处理 +1
大模型实战:快速搭建基于RAG知识库的智能聊天助手,在本地部署的开源大模型应用平台Dify & Xinference

大语言模型的训练数据一般是基于公开数据,且每一次训练需要消耗大量的算力,这意味着大模型的知识一般不会包含私有领域的知识,同时在公开知识领域存也会在一定的滞后性。目前解决这一问题的通用方案是采用 RAG(检索增强生成)技术,即首先使用用户问题来匹配最相关的外部数据,然后将检索到的相关内容召回后作为模型提示词的上下文和原问题一起提交给大模型来重新组织回复。1.1 RAG 的概念解释。

文章图片
#机器学习#人工智能#深度学习 +2
从零开始构建实用AI智能体:小白程序员专属教程(收藏版)

本文提供了一套完整的AI智能体(AI Agent)搭建教程,面向零基础小白及程序员。内容涵盖智能体工作原理、五种核心工作流模式、实用工具选择与设计、记忆系统应用、测试与调试技巧等。通过结合Anthropic和OpenAI平台,读者可学习如何从定义智能体目标开始,逐步实现具有实际应用价值的AI智能体。教程强调从简单模式入手,逐步迭代,避免过度复杂化,助力初学者快速掌握AI智能体开发的核心技能。

文章图片
#人工智能#学习#产品经理
手把手教你搭建企业级大模型系统:小白也能收藏的实战指南

本文从企业级Agent的难点出发,详细阐述了其核心架构设计,包括七层组件和任务状态机。同时对比了主流框架并提供了选型决策树。通过一个AI新闻助手的实战Demo,展示了任务状态管理、记忆管理、工具编排等功能。此外,还探讨了企业级应用的最佳实践,包括三大落地模式、四大成功关键因素、治理框架、技术选型建议和部署架构。最后,总结了常见的五个坑点,为读者提供了实用的避坑指南。

文章图片
#学习#人工智能#产品经理
AI Agent架构全景指南:从ReAct到龙虾架构的演进之路(收藏版,小白程序员必备)

本文深入解析了AI Agent架构的演进历程,从早期的简单问答模式到如今的架构多样化,重点介绍了ReAct、Multi-Agent协作、知识图谱增强、龙虾架构和Harness Engineering等主流架构模式。文章详细阐述了每种架构的技术原理和适用场景,并提供了架构选择的决策框架。此外,还分享了实战建议与最佳实践,帮助开发者理解Agent运行的底层逻辑,选择适合自身场景的架构方案,并持续优化迭

文章图片
#人工智能#语言模型#产品经理
AI Agent小白必看:收藏!轻松入门大模型核心概念

本文用最通俗易懂的方式解释了AI Agent的概念,核心是“LLM+工具+循环”,就像一个能思考、能行动、能自我修正的智能体。文章通过类比人类工作流程,对比了ChatGPT与Agent的区别,并列举了Cursor、Claude Code等实际应用案例。同时,分析了2024年以来Agent技术爆发的关键因素:模型能力提升、Tool Use协议成熟、上下文窗口增大,说明Agent并非高不可攀,有编程基

#人工智能#深度学习#学习
    共 2130 条
  • 1
  • 2
  • 3
  • 213
  • 请选择