logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

从 Function Calling 到评估:一次 LLM 测试工程化的真实实践

调通 Function Calling 后,我逐渐意识到,大模型并不是简单地“调用函数”,而是基于 function schema 做决策。本文反复修改 schema,并结合响应中的 reasoning_content 进行观察,梳理了模型在什么条件下会触发函数调用、在什么情况下直接回答。实践表明,description、required、properties 等 schema 设计,对模型行为的

#人工智能#功能测试#自动化 +1
从 0 调用智谱大模型:Python Demo 跑通 + 测试视角全拆解

本文从零开始演示如何申请并调用智谱 AI 大模型 API,通过一个最小 Python Demo 跑通完整链路。在此基础上,站在测试工程师视角,系统梳理了 messages 结构、role 使用、模型版本差异、temperature 稳定性、异常场景、网络超时与鲁棒性等关键测试点。文章重点强调:大模型并非“黑盒魔法”,而是一个需要被验证、约束和工程化的系统,适合正在转向 AI 测试或 AI 工程实践

#python#开发语言#linux +3
到底了