
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
C++线程锁
基础锁std::mutex是核心,递归场景用,超时场景用;RAII封装lock_guard(C++17+);(灵活、支持条件变量/超时);特殊场景;call_once;核心原则:永远用RAII封装管理锁,避免手动lock()unlock(),防止死锁。
RAII机制
RAII 是的缩写,翻译为“资源获取即初始化”。它的核心逻辑可以用一句话概括:将资源的生命周期与对象的生命周期绑定——在对象构造时获取资源,在对象析构时自动释放资源(无论程序正常执行还是抛出异常,析构函数都会被调用)。内存(newdeletemallocfree文件句柄(fopenfcloseopenclose线程同步资源(互斥锁lockunlock、条件变量);网络/数据库连接(connectd
offline RL:IQL
CQL:明确的 pessimism(对 OOD 动作惩罚),理论保障强,适合数据覆盖差时保证安全,但对训练数据内的腐败/噪声敏感并且超参数敏感性高。IQL:把策略问题转为受 value 指导的监督学习,训练稳定、工程实现友好,通常在噪声数据或需要稳定复现实验时表现更好;但对 Q-target 的 heavy-tail(如 dynamics corruption)敏感,需要与鲁棒统计或不确定性方法(
到底了







