logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型本地部署指南:硬件配置到模型部署,保障政务、金融、医疗数据安全!

大模型本地部署是保障数据安全的重要方式,尤其适用于政务、金融、医疗等高安全要求领域。部署需要配置带显卡的算力机,安装相应驱动和推理引擎(如vllm),并使用Docker简化部署过程。文章详细介绍了从硬件准备到模型部署的完整流程,帮助开发者选择合适的平台,实现高效安全的大模型应用。

文章图片
#政务#金融#人工智能 +3
大模型本地部署指南:硬件配置到模型部署,保障政务、金融、医疗数据安全!

大模型本地部署是保障数据安全的重要方式,尤其适用于政务、金融、医疗等高安全要求领域。部署需要配置带显卡的算力机,安装相应驱动和推理引擎(如vllm),并使用Docker简化部署过程。文章详细介绍了从硬件准备到模型部署的完整流程,帮助开发者选择合适的平台,实现高效安全的大模型应用。

文章图片
#政务#金融#人工智能 +3
2026年最具前景的十大技术领域深度解析,AI大模型位居榜首!

本文系统分析了2026年中国最具前景的十大行业,包括人工智能与大模型、半导体、新能源、生物医药、6G通信、智能制造、绿色低碳、元宇宙、新材料和现代服务业。这些行业代表了中国经济转型方向,具有广阔发展前景。文章详细分析了各行业市场规模、技术趋势、应用场景和政策环境,为投资者和企业提供参考依据。

文章图片
#人工智能#github#知识图谱 +2
2026年AI产品经理职业展望:在失业浪潮中寻找新机遇,是否值得进入?

本文详解AI产品经理三类细分岗位(平台、Native、+),强调入行无需精通代码,关键在于动手做原型解决问题。成功的AI产品需"贴地飞行",贴近用户真实需求,在试错中成长。作者分享实战经验:保持团队"能量"、主动"游走"探索、享受解决问题过程。行业稀缺的不是理论家,而是愿意动手、贴近用户的实践者。对于想入行的小白,建议从小问题出发,用现有工具做出可运行的原型,不要怕粗糙和犯错。

文章图片
#人工智能#产品经理#数据库 +2
深度解析:如何挑选最合适的Embedding模型?

2025年最新Embedding模型选择指南:Qwen3-Embedding系列表现突出,在MTEB等权威榜单中超越OpenAI、Google等顶尖模型,性能提升40%。文章从语言支持(中文/英文/多语言)、模型大小与性能权衡、部署方式(本地/API)及成本等多维度分析,为不同场景推荐最优模型:中文RAG首选Qwen3-Embedding-8B,英文RAG推荐Qwen3或OpenAI API,多语

文章图片
#数据挖掘#人工智能#数据库 +2
大模型落地实战指南:从显卡选型到模型训练,深度解析大模型应用全流程!

在1950年代初期,人们开始尝试使用计算机处理自然语言文本。然而,由于当时的计算机处理能力非常有限,很难处理自然语言中的复杂语法和语义。随着技术的发展,自然语言处理领域在20世纪60年代和70年代取得了一些重要的进展。例如,1970年,美国宾夕法尼亚大学的Adele Goldberg和David Robson创建了一个名为Lunenfeld Project的系统,它可以进行自动翻译。同时,中国科学

文章图片
#人工智能#java#数据库 +2
AI模型部署:Triton+vLLM部署大模型Qwen-Chat实践,收藏这一篇就够了!!

Triton是NVIDIA推出的模型推理服务器,vLLM是伯克利大学推出的大模型推理引擎。一般而言,Triton主要负责调度策略来提高服务的吞度,比如动态批处理、多实例并发等,配合TensorRT、ONNX等后端来联合使用,后者负责推理内核来降低延迟;而在Triton+vLLM的组合中,Triton不会做任何的调度处理,而是将请求全部打给vLLM,让vLLM根据PagedAttention和异步A

文章图片
#人工智能#语言模型
收藏必看!大模型应用开发面经:从RAG到Agent,面试通关指南

本文分享了作者近半年在多家科技公司的大模型应用开发面试经验。面试内容以RAG、微调原理和Agent应用为主,难度适中。文章详细列举了LLM基础、Prompt工程、RAG、工作流、Agent等常见面试题,并提供了面试技巧如项目效果评估、表达清晰等。作者建议掌握微调原理和动手实践能力,并强调面试前充分准备的重要性,以提升面试通过率。

文章图片
#面试#职场和发展#人工智能
2025年LangChain与LangGraph终极对比:从高层框架到底层编排,一篇掌握全貌!

LangChain 1.0作为高层框架,专注于快速原型设计和LLM应用部署;LangGraph 1.0作为底层编排引擎,擅长持久化、有状态的智能体工作流。LangChain适合简单聊天机器人、RAG管道;LangGraph适合长运行任务、多智能体系统。两者可结合使用,LangChain提供高层易用性,LangGraph提供底层控制力。开发者可根据项目需求选择合适框架,LangGraph运行时已成为

文章图片
#人工智能#机器学习#github +1
GitHub上的3个超牛Nano_Banana项目,你绝对不能错过!

本文介绍了基于Nano Banana Pro模型的三个优秀开源项目:Awesome Nano Banana Pro精选资源库提供高质量提示词和案例;RedInk是专为小红书创作者设计的AI图文生成工具;SelfieAt可将用户照片自然融合到任意场景。这些项目采用前沿技术栈,为AI绘画爱好者、内容创作者和开发者提供了实用工具,展示了Nano Banana Pro模型的强大应用潜力。

文章图片
#github#人工智能#深度学习
    共 1124 条
  • 1
  • 2
  • 3
  • 113
  • 请选择