logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

一文详解大模型推理框架vLLM原理,零基础小白收藏这一篇就够了!!

大模型在生产环境中面临显存不足、并发效率低和KV Cache管理困难等挑战。vLLM通过三大核心技术解决这些问题:PagedAttention借鉴操作系统分页机制管理KV Cache,解决显存碎片;Prefix Sharing实现相同前缀请求共享KV Cache,减少重复计算;Continuous Batching实现动态批处理,提高GPU利用率。这些技术使vLLM在高并发、长上下文场景下实现显存

文章图片
#人工智能
【大模型开发必备】使用FastAPI构建DeepSeek和Qwen聚合服务,全程干货,小白也能轻松学会!!

本文详细介绍了如何使用FastAPI框架构建大模型聚合服务,通过集成DeepSeek和Qwen两大主流大模型实现统一API调用。内容涵盖FastAPI框架优势、API Key获取、环境变量配置、依赖库安装及核心代码实现,帮助开发者高效构建自己的大语言模型服务,提升开发效率和应用灵活性。

文章图片
#fastapi#人工智能#DeepSeek
通俗讲解大语言模型内部运行原理Transformer,看到就是赚到!

在过去几年中,大语言模型(Large Language Model, LLMs)成为了人工智能领域的关键突破之一,尤其是GPT-3和GPT-4等模型,它们被广泛应用于自然语言处理(NLP)相关的任务,如文本生成、翻译、对话系统等。这些模型之所以备受瞩目,不仅因为它们能够处理海量数据,还因为它们在理解、生成和推理语言方面表现出强大的能力。

文章图片
#语言模型#transformer#人工智能
【AI大模型大厂面经】百度一面,上来就问RLHF原理...

大模型训练三步走,pre-training、SFT、RLHF。今天来到了第三步,即基于人工反馈的强化学习(Reinforcement learning from human feedback)。对于 NLP 从业者来说,前两步还是比较熟悉的,无非是模型大点、数据多些,但是整个模型的架构、原理和一些 tricks 还是比较容易理解的。但是对于 RLHF,因为其中涉及到了强化学习,所以对于没有接触过强

文章图片
#人工智能#百度#语言模型
搞定大语言模型Decoder-Only结构 VS Encoder-Decoder结构,收藏这一篇就够了!!

Decoder和Encoder结构之间有什么区别?关键区别在于输入注意力是否(因果)被掩码mask掉。Decoder结构使用的是基于掩码mask的注意力。

文章图片
#语言模型#人工智能#自然语言处理
年过30转行AI大模型,职场危机也是转机,程序员的春天又来了!

在职场中,年龄似乎成为了一个无法回避的话题。尤其是对于程序员这一职业,许多人认为到了30岁就应该有所成就,否则就会面临职业发展的瓶颈。然而,在这个人工智能(AI)迅猛发展的时代,年过30的程序员们迎来了新的机遇——转行AI大模型。职场危机不再是困境,而是成为了一个全新的起点。

文章图片
#人工智能#语言模型
从BERT到T5再到Qwen3:一文掌握大模型核心文本嵌入技术,从架构到实战全面解析!

文章系统综述了预训练语言模型(PLM)在通用文本嵌入(GPTE)中的基础与高级角色。PLM使文本嵌入从专用走向通用,并正迈向多模态、多语言、多任务的大一统。数据合成、对比学习和大模型上下文窗口是当前提升性能的关键。未来嵌入模型需具备推理能力、安全意识和解耦能力,而不仅是追求更高维度。

文章图片
#bert#人工智能
【AI大模型】AI智能体意图识别优化进阶指南,从入门到精通的意图识别与槽位抽取全攻略,建议收藏!!

本文详细介绍了AI智能体自然语言理解中意图识别与槽位抽取的四种技术方案演进路径:从初级提示词工程驱动,到中级节点分离架构,再到进阶RAG召回方案,最终到高阶多轮场景解决方案。通过对比各方案在提示词长度、处理耗时和准确率等方面的差异,为开发者提供了基于业务需求的技术选型参考,帮助开发者构建高效可靠的对话系统。

文章图片
#人工智能#AI智能体
为什么你的AI智能体总掉链子?80%的人忽略了这些!AI智能体落地必看的三大坑与实战对策,收藏这一篇就够了!!

本文剖析了AI智能体落地面临的三大挑战:多步骤执行导致错误累积、长对话带来的成本飙升与信息偏差、以及工具链不完善导致模型无法支撑全流程。针对这些痛点,作者提出了可验证的短流程+人工干预、无状态专注工具人设计、以及优先打磨工具链等实用对策。文章强调,AI智能体的真正价值在于"专注场景"、"精细工具"和"人机协同"的有机结合,而非追求全自动通用助手。

#人工智能#AI智能体
为什么你的AI智能体总掉链子?80%的人忽略了这些!AI智能体落地必看的三大坑与实战对策,收藏这一篇就够了!!

本文剖析了AI智能体落地面临的三大挑战:多步骤执行导致错误累积、长对话带来的成本飙升与信息偏差、以及工具链不完善导致模型无法支撑全流程。针对这些痛点,作者提出了可验证的短流程+人工干预、无状态专注工具人设计、以及优先打磨工具链等实用对策。文章强调,AI智能体的真正价值在于"专注场景"、"精细工具"和"人机协同"的有机结合,而非追求全自动通用助手。

#人工智能#AI智能体
    共 664 条
  • 1
  • 2
  • 3
  • 67
  • 请选择