logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【大模型微调】通义千问3-0.6B 模型微调,全程干货,小白也能轻松学会!!!

在日常业务场景中,业界普遍使用 DeepSeek 全量版、阿里千问等大型语言模型。与此同时模型生态平台上,还存在大量轻量级模型,其参数规模仅为数 B 级别,甚至如 Qwen3 0.6B 这类更小规格的模型也有其生存空间,与 DeepSeek 671B 的全量版本形成非常大的差异。那么小型语言模型存在的价值和使用场景在哪里

文章图片
#人工智能
企业级模型推理部署工具vllm使用指南 - 部署最新deepseek-v3-0324模型

vLLM(Virtual Large Language Model)是由加州大学伯克利分校团队开发的高性能大模型推理框架,其核心特点围绕显存优化、高吞吐量、灵活性和易用性展开。对比 ollama 作为个人开发者部署模型工具而言,vLLM 专注于高并发请求和大规模生产环境,适用于企业级应用和需要高效推理的场景。vLLM 通过优化内存管理和并发处理,适合处理高负载的生产环境 ‌。

文章图片
#人工智能#DeepSeek
2026年大模型学习路线图揭秘:成为高阶AIGC开发者,从零到LLM应用架构师的终极指南!

摘要: 后端程序员转型AI大模型领域具备独特优势,包括工程能力迁移(微服务架构、高并发处理)、工具链适配(Python生态、数据库优化)及业务抽象能力复用(Prompt设计、Agent开发)。学习路径分为四阶段:基础筑基(API与Prompt工程)、核心突破(RAG与Agent开发)、高阶突围(微调与工程化部署)及持续进化(前沿技术追踪)。建议聚焦工程化落地,避免死磕算法理论,优先掌握Prompt

文章图片
#AIGC#人工智能#数据库 +3
生产级AI助手开发全攻略:LangGraph+FastAPI+Streamlit实现指南

文章介绍了一个基于LangGraph、FastAPI和Streamlit构建的生产级AI助手概念验证项目。该项目采用分层架构,实现了状态管理、多轮对话、意图识别等功能,遵循生产环境设计原则。文章详细讲解了项目结构、环境搭建、代码实现和运行方法,同时提供了性能优化、安全注意事项和扩展建议,帮助开发者构建可扩展、可靠的AI应用。

文章图片
#人工智能#AI
七大顶级大模型开发框架详解:从LangChain到vLLM的全面解析与比较!

本文详细介绍了7大主流大模型开发框架:LangChain(应用构建)、LLAMA Factory(模型微调)、Dify(应用开发平台)、FasterTransformer(推理加速)、TensorRT(NVIDIA推理框架)、oLLAMA(本地部署)和vLLM(推理优化)。每个框架的核心特性、应用场景和使用方法均有涵盖,并提供从零基础到进阶的完整学习路线,助力开发者快速掌握大模型应用开发技术。

文章图片
#自然语言处理#人工智能#语言模型
一文搞懂深度学习:神经网络基础

欢迎来到本深度学习系列文章,本系列文章旨在详细介绍深度学习的基础理论与关键技术,从基本神经网络到复杂的算法应用;我们将探索监督学习,逻辑回归,激活函数,反向传播等核心主题;无论您是初学者还是专业人士,这个系列都将帮助您系统地理解并应用深度学习技术。

文章图片
#深度学习#神经网络#人工智能 +2
企业级模型推理部署工具vllm使用指南 - 部署最新deepseek-v3-0324模型

vLLM(Virtual Large Language Model)是由加州大学伯克利分校团队开发的高性能大模型推理框架,其核心特点围绕显存优化、高吞吐量、灵活性和易用性展开。对比 ollama 作为个人开发者部署模型工具而言,vLLM 专注于高并发请求和大规模生产环境,适用于企业级应用和需要高效推理的场景。vLLM 通过优化内存管理和并发处理,适合处理高负载的生产环境 ‌。

文章图片
#人工智能#DeepSeek
Langchain-Chatchat大语言模型本地知识库的踩坑、部署、使用

Langchain-Chatchat是一个基于ChatGLM大语言模型与Langchain应用框架实现,开源、可离线部署的检索增强生成(RAG)大模型的本地知识库问答应用项目。

文章图片
#语言模型#人工智能
【AI大模型】介绍一种transformer稀疏神经网络的硬件加速器算法,看到就是赚到!!

基于transformer的网络在深度学习中是一股强大的力量。自transformer发明以来,在许多领域如神经机器翻译、语言理解和图像处理都产生了巨大影响。然而,transformer在感知识别处理的性能伴随着高昂的计算和内存成本,这成为基于transformer应用高效部署的重大障碍。

文章图片
#人工智能#transformer#神经网络 +1
大模型训练实战入门:深度解析学习大模型训练的必要性与前景!

文章系统介绍了大模型训练的必要性和价值,指出其在专业领域应用、学术研究和职业发展中的关键作用。详细解析了从数据处理、预训练、指令精调到对齐优化的完整训练流程,对比了大模型训练与RAG技术的区别,并提出了从基础到高级的系统化学习框架,帮助读者掌握从技术使用者到AI创造者的转变,提供了实战教程和算力支持资源。

文章图片
#人工智能#深度学习#架构 +4
    共 1510 条
  • 1
  • 2
  • 3
  • 151
  • 请选择