高效匠人个人主页

@c123728529

高效匠人

2024-08-19 09:41:57 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

强化学习-深度学习和强化学习领域

摘要： SFT（监督式微调）和GRPO（梯度策略优化）是深度学习中两种不同的训练方法。SFT依赖标注数据，简单高效但泛化能力有限，适用于规则明确的任务（如内容过滤）。GRPO通过强化学习优化策略，能动态适应复杂目标（如反欺诈），但训练不稳定且成本高。两者核心差异在于数据需求、灵活性和计算成本。实际应用中，SFT适合快速部署静态任务，GRPO适用于动态风险场景，混合方案（如SFT+GRPO）能结合优

#深度学习 #人工智能

Prompt:开源库license的分类名称、说明、适应范围

开源许可证分为宽松许可证（如MIT、Apache 2.0、BSD）和Copyleft许可证（如GPL、AGPL、LGPL）。宽松许可证允许自由使用及闭源集成，适用于商业项目。Copyleft则要求衍生作品保持开源，其中强Copyleft（GPL）适用于核心软件，弱Copyleft（LGPL）多用于库文件。许可证选择影响代码传播、使用及合规性，需根据项目目标和兼容性谨慎选择。公共领域放弃版权限制，允

#开源

文章七《深度学习调优与超参数优化》

总结：调参是科学，更是艺术记住这三句口诀："学习率是心跳，太急太缓都不行""正则化是金箍，防过拟合有奇效""超参数是钥匙，Optuna帮你找宝藏"

#深度学习 #人工智能 #python

Python10天冲刺《aiohttp》异步任务来实现自动重连

为了实现在on_close回调中重新连接的功能，我们可以利用aiohttp的 WebSocket 功能，并结合异步任务来实现自动重连。以下是一个示例代码，展示了如何在on_close回调中重新连接。

#python #numpy #开发语言

能力评估：如何系统评估你的技能和经验

作为一名38岁的互联网研发老兵，你已经积累了丰富的经验，包括技术深度、项目管理、团队协作等。但能力评估不是一次性事件，而是持续过程，帮助你识别优势、短板，并为职业转型铺路。38岁是理想创业年龄——Kauffman基金会数据显示，成功创业者平均40岁，40岁创始人成功率是25岁者的2.1倍。最终，建立“超级公司”不是速成，而是杠杆你的老兵优势：深度见解、韧性。通过这些，你能得出一个全面画像，例如你的

#人工智能

人工智能--安全大模型训练计划：基于Fine-tuning + LLM Agent

安全大模型训练计划：基于Fine-tuning + LLM Agent

#人工智能 #安全

Prompt:开源库license的分类名称、说明、适应范围

#开源

FastAPI + Redis Pub/Sub + WebSocket 组合解决方案的详细介绍

#fastapi #redis #websocket

2025年AI技术突破关键方向分析报告

2025年AI技术突破关键方向分析本报告揭示2025年AI技术三大核心突破：模型效率革命：小模型通过知识蒸馏实现终端部署，MoE架构降低70%训练成本，多模态模型跨模态检索准确率达91.3% 硬件性能跃升：中国"天枢-5"芯片能效比达300TOPS/W，特斯拉L4自动驾驶决策延迟缩短至30ms 应用场景落地：工业质检缺陷检出率99.99%，医疗AI诊断准确率98.7%，具身

#人工智能

空间数据的详细分析：定义、探索、收集与企业应用

在现实数据不足的背景下，空间数据通过其丰富的地理时空信息、多源异构特性和可获取性，成为AI模型训练与推理的关键补充。通过数据增强、特征工程、迁移学习等技术，结合开源工具与云服务，企业可有效利用空间数据提升AI能力，解决现实场景中的复杂问题。关键在于选择高价值场景、构建数据融合管道，并持续优化模型与数据的协同。

共 17 条

请选择