logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

✨ 复现经典!基于AlphaZero的智能五子棋AI项目详解(DRL+MCTS实战)

本项目基于AlphaZero算法实现了五子棋AI,通过纯自我对弈学习,无需人类棋谱。核心架构结合蒙特卡洛树搜索(MCTS)与深度神经网络,其中MCTS负责前瞻性探索,神经网络(含策略网络和价值网络)指导搜索方向。系统包含完整的训练框架和交互界面,支持人机对弈。关键技术包括:残差网络特征提取、温度采样平衡探索利用、时间衰减奖励分配等。实验表明,该AI能自主发现高级战术,验证了AlphaZero在相对

文章图片
#人工智能#深度学习#神经网络 +2
LoRA原理与PyTorch代码实现

无论是火热的大模型(LLM)还是文生图模型(Stable Diffusion)微调的时候,都需要大量的GPU显存,个人的显卡上很难实现, 因此各种参数高效(Parameter-Efficient)的方法层出不穷,最受大家欢迎的就是LoRA 《LoRA:Low-Rank Adaptation of Large Language Modules》LoRA有很多的优点,节约显存,训练快,效果损失小(相当

#人工智能#python
LoRA原理与PyTorch代码实现

无论是火热的大模型(LLM)还是文生图模型(Stable Diffusion)微调的时候,都需要大量的GPU显存,个人的显卡上很难实现, 因此各种参数高效(Parameter-Efficient)的方法层出不穷,最受大家欢迎的就是LoRA 《LoRA:Low-Rank Adaptation of Large Language Modules》LoRA有很多的优点,节约显存,训练快,效果损失小(相当

#人工智能#python
到底了