logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

网络是怎么“学“的:损失函数与梯度下降

本文讲解了神经网络训练的核心机制。首先介绍了损失函数的作用——量化模型预测与真实值的差距,重点分析了MSE适合回归问题、交叉熵适合分类问题的原因。然后详细讲解了梯度下降的原理,包括学习率选择、批量大小的影响,以及从SGD到Adam等优化算法的发展。文章指出高维空间中的局部最优问题实际较少见,训练瓶颈更多源于实现细节。最后概括了神经网络的训练流程:前向传播计算损失,反向传播更新参数。全文以直观解释为

文章图片
#java#python#人工智能 +1
Prompt 一站式讲解:从入门到精通

这篇文章系统介绍了如何编写高效的Prompt来提升AI协作效率。主要内容包括: Prompt基础概念:解释Prompt作为人机交互界面的作用,以及其约束模型输出的原理。 Prompt结构要素:详细说明角色设定、任务描述、上下文信息、格式要求和约束条件这5个核心要素。 核心技巧: Zero-shot/Few-shot提示 思维链引导逐步推理 角色设定提升专业性 输出格式控制 任务分步分解 进阶策略:

文章图片
#python#人工智能
Cursor vs Codex vs Claude Code,三者介绍对比

AI编程工具对比:Cursor、Codex与Claude Code 摘要:本文对比了三款主流AI编程工具的核心差异。Cursor作为智能增强版IDE,主打行内补全和多文件联动编辑;OpenAI Codex是终端AI代理,支持自主执行代码任务;Claude Code则以深度理解和对话式编程见长。三者分别适合不同场景:Cursor适合熟悉项目结构的开发者,Codex适合自动化执行任务,Claude C

文章图片
#java
微服务Feign调用开启@Async异步调用,requestHeader数据拿不到

今天测试报了个bug,订单完成时间是零时区,我感觉这是一个很简单的问题,分给新同事,后来新同事找不到原因,只能自己看了,结果不看不知道,一看看了一下午。最后经过验证@Async就是真凶,因为我们都是拿请求头的时区获取时间放入数据库,@Async会使请求头的数据消失,导致获取取不到时区。看了一下午,感觉哪里都没有问题,越看越觉得没问题,啊哈哈哈,最后突然看到Fegin调用有一点不同。配置该类可以防止

文章图片
#微服务#架构#云原生 +2
到底了