logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

一文拆解:主流大模型微调开源框架怎么选?一招精准决策

随着大型语言模型(LLMs)的快速发展,微调技术成为了让这些模型适应特定领域和任务的关键方法。本报告将分析主流的大模型微调开源框架,比较它们的特性、优劣势和适用场景,从数据并行、模型并行、SFT微调和强化微调等方面展开分析。

文章图片
#开源#大数据#人工智能 +3
AI智能体架构图绘制秘籍:从概念到实践,小白也能学会,必收藏!

AI智能体架构图绘制秘籍:从概念到实践,小白也能学会,必收藏!

文章图片
#人工智能#microsoft#数据库 +2
华为 《面向智能制造的工业大模型标准化研究报告》(免费下载PDF版本)

工业大模型是智能制造的核心使能技术,但其规模化应用亟需建立适配工业场景的标准体系。需通过技术攻关、跨行业协作和政策引导,解决数据、安全、集成等关键问题,推动新型工业化高质量发展。

文章图片
#人工智能#机器学习#深度学习
收藏必备:从零开始学Agent设计模式:构建高效智能系统的四大核心架构

Agent设计模式是构建智能系统的关键架构,包括四种核心模式:反思模式使智能体能自我评估和改进;工具使用模式扩展智能体能力边界;规划模式帮助智能体分解复杂任务;多智能体协作模式实现团队分工合作。这些模式为AI系统提供可扩展性、模块化和适应性,帮助开发者构建高效、智能的系统,解决复杂问题。

文章图片
#设计模式#架构#学习 +2
大厂AI 岗面试必看:107 道面经 + 102 道大模型真题,附 2025 学习路线图

想入门 AI 大模型却找不到清晰方向?备考大厂 AI 岗还在四处搜集零散资料?别再浪费时间啦!2025 年 AI 大模型全套学习资料已整理完毕,从学习路线到面试真题,从工具教程到行业报告,

文章图片
#人工智能#面试#学习 +2
【RAG实战】基于 LangChain+Transformers+Qwen3 的RAG 智能产品助手实现

就在2025年4月29日凌晨,阿里巴巴正式推出新一代大语言模型通义千问Qwen3,并宣布全面开源。这一消息瞬间引爆AI圈,被誉为“开源大模型王座再易主”的里程碑事件。作为国内首个支持“混合推理”的模型,Qwen3不仅在技术上实现颠覆性创新,更以开源生态加速行业变革。

文章图片
#人工智能#大数据#算法
DeepSeek扫盲进阶:大语言模型三大流派对决,谁是真王者?

当我们谈论DeepSeek时,首先要明确它的身份——一款参数量高达671B的大语言模型(LLM,Large Language Model)。这里的“B”代表十亿,也就是说它的核心参数达到了671亿之多。不少人会疑惑:这些“参数”究竟是什么?为什么需要如此庞大的规模?顺着这个问题延伸,大语言模型究竟能解决哪些实际问题?它从概念到落地又经历了怎样的技术演进?这篇文章就为你层层拆解这些核心疑问。

文章图片
#语言模型#人工智能#自然语言处理 +1
什么是大模型?一文带你彻底看懂“大模型”的技术原理与应用!

大模型是指具有数千万甚至数亿参数的深度学习模型。近年来,随着计算机技术和大数据的快速发展,深度学习在各个领域取得了显著的成果,如自然语言处理,图片生成,工业数字化等。为了提高模型的性能,研究者们不断尝试增加模型的参数数量,从而诞生了大模型这一概念。

文章图片
#python#人工智能#开发语言 +1
【收藏必备】AI模型部署之道:从容器化到Kubernetes全解析

1.为什么AI模型部署更适合容器化?容器化保证跨环境一致性、依赖隔离、快速部署回滚,并方便在云原生环境中托管。2.什么是K8s?K8s是一个开源的容器编排平台,用于自动化应用的部署、扩缩、负载均衡和运维管理。通过 K8s,开发者和运维人员能更高效地管理大规模分布式应用,提升系统的稳定性与可扩展性。3.如何兼顾性能与可维护性?使用推理优化引擎与批处理提高吞吐,配合日志监控、自动化部署和安全扫描保持长

文章图片
#人工智能#容器#学习 +1
推理模型是啥?普通LLM和推理模型有啥不一样?啥时候该用推理模型?

自从DeepSeek爆火后,一直听到一个词:“推理模型”。那如何定义“推理模型”?普通 LLM与推理模型有何不同?什么时候应该使用推理模型?今天,我们就来剖析下~

文章图片
#人工智能#机器学习#搜索引擎
    共 1021 条
  • 1
  • 2
  • 3
  • 103
  • 请选择