logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

AI模型部署:Triton+vLLM部署大模型Qwen-Chat实践,收藏这一篇就够了!!

Triton是NVIDIA推出的模型推理服务器,vLLM是伯克利大学推出的大模型推理引擎。一般而言,Triton主要负责调度策略来提高服务的吞度,比如动态批处理、多实例并发等,配合TensorRT、ONNX等后端来联合使用,后者负责推理内核来降低延迟;而在Triton+vLLM的组合中,Triton不会做任何的调度处理,而是将请求全部打给vLLM,让vLLM根据PagedAttention和异步A

文章图片
#人工智能#语言模型
收藏必看!大模型应用开发面经:从RAG到Agent,面试通关指南

本文分享了作者近半年在多家科技公司的大模型应用开发面试经验。面试内容以RAG、微调原理和Agent应用为主,难度适中。文章详细列举了LLM基础、Prompt工程、RAG、工作流、Agent等常见面试题,并提供了面试技巧如项目效果评估、表达清晰等。作者建议掌握微调原理和动手实践能力,并强调面试前充分准备的重要性,以提升面试通过率。

文章图片
#面试#职场和发展#人工智能
2025年LangChain与LangGraph终极对比:从高层框架到底层编排,一篇掌握全貌!

LangChain 1.0作为高层框架,专注于快速原型设计和LLM应用部署;LangGraph 1.0作为底层编排引擎,擅长持久化、有状态的智能体工作流。LangChain适合简单聊天机器人、RAG管道;LangGraph适合长运行任务、多智能体系统。两者可结合使用,LangChain提供高层易用性,LangGraph提供底层控制力。开发者可根据项目需求选择合适框架,LangGraph运行时已成为

文章图片
#人工智能#机器学习#github +1
GitHub上的3个超牛Nano_Banana项目,你绝对不能错过!

本文介绍了基于Nano Banana Pro模型的三个优秀开源项目:Awesome Nano Banana Pro精选资源库提供高质量提示词和案例;RedInk是专为小红书创作者设计的AI图文生成工具;SelfieAt可将用户照片自然融合到任意场景。这些项目采用前沿技术栈,为AI绘画爱好者、内容创作者和开发者提供了实用工具,展示了Nano Banana Pro模型的强大应用潜力。

文章图片
#github#人工智能#深度学习
多模态融合全攻略:从基础到进阶,一篇搞定大模型融合技术,建议收藏!

文章全面介绍多模态融合的核心知识、主流方法和典型应用。阐述了多模态学习的5大核心任务,详解早期、晚期和混合三大融合策略及适用场景。重点解析TFN、LMF、MFN等9种主流融合方法的原理、公式、优缺点和代码实现,并提供学习资源,为读者提供从理论到实践的完整学习路径。

文章图片
#人工智能
DeepSeek+dify 本地知识库:高级应用Agent+工作流,收藏这一篇就够了!!

dify的强大在于其灵活性,主要体现在智能体和工作流上。它可以让一个没有编程能力的人通过简单学习,快速搭建Agent和自动化流程。就像拼积木一样。我们可以通过智能体或工作流,自定义工具完成很多我们好玩的功能。本文前面主要是介绍一些组件,有编程能力的同学建议直接跳过。

文章图片
#人工智能#语言模型#DeepSeek
【AI大模型】用Qwen3+MCPs实现AI自动发布小红书笔记!支持图文和视频

小红书发布MCP结合大模型的能力,图片生成以及视频生成的MCPs,整个流程都可以完全由AI来完成,真正实现全自动化的内容生产和发布。比如标题、正文、排版可以让大模型LLM来帮你搞定。图片和视频也都可以用AI来生成,比如魔搭社区上的文生图MCP来生成图片,用Minimax MCP来生成视频。

文章图片
#人工智能#MCP
人工智能+物流的6大落地场景与高质量发展路径!

"人工智能+物流"已从概念走向大规模落地应用,形成仓储智能化、分拣自动化等产业新生态。文章详细解析了六大落地场景:智能仓储管理、智能分拣配送、智能调度与路由规划、区块链电子单证、智能物流枢纽和智慧供应链管理,并提出了深化技术融合、健全数据要素、拓展场景创新等发展建议。未来五年,物流行业将实现从"成本中心"向"价值创造中心"、从"被动响应"向"主动预测与优化"、从"流程驱动"向"数据智能驱动"的三大

文章图片
#人工智能#语言模型#自然语言处理 +2
西南AI学习路线图:7阶段从零基础到大模型应用,打造企业落地能力,实现职业转型与升级!

本文提供针对西南地区AI学习者的7阶段完整指南,帮助理工科转行者和应届生避开学习陷阱,掌握企业落地能力。内容涵盖AI工具基础、算法理论、实战攻坚、业务能力、编程进阶、大模型应用及就业冲刺,每个阶段均结合成都地铁、车企、华西医疗等真实产业需求,提供实战练习与避坑建议,最终帮助学习者具备西南AI企业所需的技能与竞争力,顺利入职。

文章图片
#人工智能#github#语言模型 +2
Java生态下企业级AI应用落地:Function Calling架构的责任与管控设计!

在AI技术向企业核心业务渗透的过程中,Java技术团队面临的核心挑战早已不是“如何让大模型调用一个接口”,而是如何构建一套安全、可控、可追溯的AI驱动体系。简单的HTTP调用或Prompt工程,只能停留在Demo阶段,无法满足企业级应用对权限、审计、流程的刚性需求。而JBoltAI作为专注Java生态的**企业级AI应用开发框架**,通过一套完整的Function Calling架构设计,实现了从

文章图片
#java#人工智能#架构 +2
    共 1118 条
  • 1
  • 2
  • 3
  • 112
  • 请选择