logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型开发:模型训练全流程详解(从参数设置到优化调整)

在深度学习中,学习率(Learning Rate)是一个非常重要的参数,它决定了每次模型参数更新的步伐大小。学习率可以理解为模型“学习”的速度。如果学习率设置得太大,模型可能会在训练过程中跳过最优解,无法正确收敛;而如果学习率太小,模型的学习过程会非常缓慢,甚至可能陷入局部最优解,难以得到最佳效果。在深度学习的训练过程中,我们通常使用大量的数据来让模型从中学习。为了高效地处理这些数据,PyTorc

文章图片
#人工智能#产品经理#搜索引擎 +1
AI Agent实战指南:从原理到落地,企业数字化转型最后一公里》

AI Agent是能够自主规划、主动执行的新一代AI系统,解决了传统AI被动响应、技术栈复杂、运维成本高的痛点。其核心技术包括目标驱动规划、上下文感知记忆和生态系统交互能力。文章通过车险理赔案例,解析了AI Agent的资源调度架构与协作模式,讨论了落地挑战与解决方案。AI Agent代表了AI从"工具"向"同事"的进化,将降低AI应用门槛,但其成功落地70%取决于企业数字化基础设施完备度。

文章图片
#人工智能
初学者怎么入门大语言模型开发?

Prompt Engineering 涉及为大型语言模型设计有效的输入(Prompts),以引导模型生成所需的输出。这个过程不仅需要精确表达问题或需求,而且要格式化输出以适应特定应用。

文章图片
#语言模型#人工智能#自然语言处理 +1
大语言模型从入门到精通,看这一篇就够了

②虚假信息:大语言模型可能会生产一些具有极强迷惑性的信息,甚至可能被用于传播虚假信息或进行舆论操纵:当前社交机器人更多停留在一级传播,如果大语言模型和社交机器人相结合,就可能会形成类人的交流能力,带来社交机器人的多级传播,从而强化社交机器人传播虚假信息的负面影响。①算法垄断:大语言模型的训练需要消耗巨大的算力资源,更高的门槛在很大程度上限制了学界对大模型的持续探索,未来可能只有少量大型企业和机构能

文章图片
#语言模型#人工智能#自然语言处理 +1
医疗健康大模型:潜力、挑战与未来趋势——中国信通院云大所白皮书深度解析

这份文件由中国信息通信研究院云计算与大数据研究所编制。白皮书梳理了国内外医疗健康大模型的最新态势及发展成果,尤其是技术体系、应用场景、风险挑战、评价和监管等方面的内容。旨在为我国生命科学与医疗健康大模型技术和产业发展提供参考和引导,共同推动技术研发创新,促进行业高质量发展。:AI大模型通过“预训练+微调”模式增强了人工智能的通用性、泛化性,能够低成本、高适应性地赋能多个医疗健康任务。:生态架构由基

文章图片
#人工智能#语言模型#职场和发展 +3
AI大模型如何在企业内落地应用?

AI+”已成为继“软件+”“互联网+”之后,最重要的新质生产力,是今后十年内技术创新和产业升级的核心驱动力。AI大模型技术将重塑千行百业,如何尽快、尽好地将应用大模型技术创造新的核心能力和新的运营服务优势,是所有企业共同面对的机遇和挑战。就是要及时跟进建设自身的AI能力,要在大模型、大数据和大算力这三大要素上,让企业具备不同层次的能力(基础能力、强化能力和创新能力)。就是通过AI大模型技术的运用,

文章图片
#人工智能#学习#数据分析 +1
小白也能学会的AI Agent架构设计:Open Deep Research三级分层结构实战解析

本文深入解析Open Deep Research项目的多Agent架构设计,采用三级分层嵌套结构:主图负责整体流程编排,监督者子图实现任务分解与委派,研究者子图执行具体研究。通过LangGraph的子图复用和异步并行机制,实现职责分离与高效协作,为构建复杂多Agent系统提供了优秀范例。

文章图片
#人工智能#AI#RAG
深入OpenClaw Agent核心:工作区、架构、调度与容错机制

本文深入剖析了OpenClaw(原Clawdbot)的核心动力模块——Agent任务引擎,揭示了其架构设计、工作区划分、调度并发控制及高可用容错机制。通过分析OpenClaw的实践,文章强调了理解这些工程智慧对于构建稳健生产级Agent系统的价值,并指出了如何将实践沉淀为规范,以更精准地指导AI。文章还讨论了如何在企业级落地中参考OpenClaw的架构实践,并指出了其代价和解决方案。

文章图片
#架构#java#开发语言 +2
GPT-5.4发布!小白程序员必备:收藏这份大模型学习指南,开启AI新时代!

GPT-5.4发布,成为OpenClaw的首选模型,具备强大的代码能力、世界知识和多模态理解能力。相比Claude Opus 4.6,GPT-5.4在真实工作任务和软件工程问题解决上表现出色,且价格更亲民。此外,GPT-5.4还拥有100万token的上下文窗口、原生计算机使用能力和工具搜索等新特性,为AI应用带来更多可能性。建议小白和程序员们收藏此指南,开启AI学习之旅。

文章图片
#人工智能#java#架构
AI应用架构演进:从信息顾问到智能执行者的实战指南

本文探讨AI应用从"信息顾问"到"智能执行者"的范式转变,详解LLM-native应用的设计架构与实现方法。对比AI Workflow与AI Agent两种设计模式,展示如何通过LangChain构建稳定高效的AI应用,并提出混合架构优势。介绍MCP协议解决AI与外部系统连接问题,为构建下一代智能应用提供实用指南。

文章图片
#人工智能#架构#transformer
    共 908 条
  • 1
  • 2
  • 3
  • 91
  • 请选择