logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

别再让C盘变红!Hugging Face下载大模型/数据集时,如何用cache_dir和local_dir精准控制存储位置

本文详细解析了Hugging Face下载大模型和数据集时如何通过`cache_dir`和`local_dir`参数精准控制存储位置,避免C盘爆满的问题。文章提供了从环境变量配置到代码层面的全方位解决方案,帮助开发者高效管理模型文件存储,特别适合处理大型AI模型如LLaMA-2-70B等。

基于Azure与GPT-4构建企业级多领域AI支持代理实战指南

在数字化转型浪潮中,智能对话系统已成为提升服务效率与用户体验的关键技术。其核心原理在于通过自然语言处理理解用户意图,并结合知识库与外部工具提供精准响应。这类系统的技术价值在于能够打破传统单领域机器人的局限,实现跨业务场景的无缝支持,从而大幅降低人力成本并提升服务连续性。典型的应用场景包括智能客服、企业内部知识助手以及跨平台技术支持。本文将深入探讨如何利用Azure云平台与GPT-4大语言模型,构建

别再只玩AutoGPT了!手把手教你用LangChain+ReAct框架搭建自己的第一个AI智能体(附完整代码)

本文详细介绍了如何使用LangChain和ReAct框架构建AI智能体,提供了从环境配置到实战应用的完整指南。通过对比AutoGPT等方案,突出LangChain+ReAct组合在开发效率、扩展性和可控性方面的优势,并附有完整代码示例,帮助开发者快速上手智能体开发。

#AI智能体
保姆级教程:用AgentScope和通义千问(qwen-max)30分钟搭建你的第一个多智能体游戏

本文提供了一份详细的教程,指导开发者如何使用AgentScope框架和通义千问(qwen-max)大模型在30分钟内搭建一个多智能体诗词游戏。通过环境配置、模型与智能体设置、核心游戏逻辑实现及进阶优化,帮助开发者快速掌握多智能体游戏开发技术,并应用于文化娱乐等领域。

#游戏开发
Kimi K2.5×ChatPPT:AI驱动的PPT工作流重构

PPT制作长期困于‘内容生成’与‘格式排版’割裂的低效范式,本质是知识表达与演示媒介之间的结构性失配。大模型文档理解能力(如多模态OCR、PDF结构化解析)与原生PPTX渲染引擎的结合,使AI不再仅输出文案,而是直接生成符合企业VI、可编辑、带动画与字体嵌入的终版文件。这种‘意图→结构→呈现’三层穿透式建模,显著提升技术文档到演示资产的转化效率,尤其适用于需高频输出专业汇报的工程师、研究员、医疗从

特殊token如何绕过大模型安全机制:隐性攻击面深度解析

特殊token是大语言模型中用于控制对话结构、分段和角色切换的预定义标记,如<|assistant|>、<|eot_id|>等。其本质并非普通文本,而是在分词、注意力计算与KV缓存调度中拥有状态干预权限的底层指令。由于训练数据天然混入大量代码模板与社区格式标记(如Jinja2的{{}}、GitHub的<!-- -->),模型未习得其安全语义,导致这些token可被恶意构造为‘状态重置开关’,绕过s

从AlphaGo到ChatGPT:聊聊MDP(马尔科夫决策过程)为啥是AI决策的‘通用语言’

本文探讨了马尔科夫决策过程(MDP)如何成为AI决策的通用语言,从AlphaGo到ChatGPT的应用实例出发,分析了MDP在游戏AI、对话系统、推荐系统和自动驾驶等领域的核心作用。文章详细解析了MDP的通用性、工业实践中的变体及其前沿突破,为开发者提供了实用的工具链选择和参数调优经验。

GPT-4作为神经元标注仪:LLM可解释性的工业级实践

大型语言模型的可解释性并非哲学思辨,而是面向产线的工程问题。当传统梯度类方法(如SHAP、Integrated Gradients)在GPT-4等超大规模模型上失效,且规则匹配与小模型蒸馏泛化能力不足时,利用GPT-4自身强大的语义理解能力构建结构化神经元行为标注流水线,成为当前最可行的技术路径。该方法将神经元激活模式转化为自然语言可判别任务,通过严格提示工程、三维输入快照与可审计输出设计,实现亚

LLM微调与RAG实战:从项目日志到硬核博文生成

大语言模型(LLM)微调与检索增强生成(RAG)是当前AI工程落地的核心技术路径。其原理在于通过参数高效适配或外部知识注入,解决通用模型在垂直场景中的幻觉、时效性与领域专业性瓶颈。这类技术具备显著的工程价值——降低部署成本、提升响应准确率、支持私有数据闭环。典型应用场景包括企业知识库问答、金融合规文档分析、医疗报告辅助生成等。本文基于真实LoRA微调实验日志、RAG延迟排查记录及本地Qwen2-7

#RAG#LoRA
别再只跑GEM5了!用McPAT给你的仿真结果加上“功耗与面积”的硬核分析

本文详细介绍了如何通过GEM5与McPAT的联合仿真,为芯片设计添加功耗与面积的硬核分析。McPAT工具将GEM5的架构参数转化为可量化的功耗与面积评估,填补了性能仿真中的关键盲区。文章提供了从数据转换到结果解读的完整流程,帮助研究者构建自动化分析工作流,实现更全面的芯片设计评估。

    共 63 条
  • 1
  • 2
  • 3
  • 7
  • 请选择