logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

利用强化学习 Q-learning 玩 Atari 黑白棋游戏

本文实现了一个基于PyTorch的强化学习黑白棋游戏系统,主要包含以下改进: 框架迁移:将原TensorFlow实现重构为PyTorch版本,使用3层CNN+2层FC的网络结构处理8x8棋盘状态,输出64个位置的Q值。 环境适配: 自定义ReversiEnv环境类实现核心游戏逻辑 包含合法动作检测、棋子翻转、胜负判断等功能 无需Gym环境注册,直接实例化使用 智能体功能: 支持随机策略和Q学习策略

文章图片
#游戏
豆包挨了三记闷棍,智谱用开源掀了桌子

10 天里,我见了大厂的围墙,也见了开源的破局;见了商业博弈,也见了技术潮水。24 年前微软骂 Linux 是癌,24 年后说爱 Linux。历史总相似,站对边,从来都不晚。智谱这次开源的 AutoGLM,不是一时冲动的 “掀桌”,而是给行业递上了一把 “钥匙”——32 个月打磨的核心模型、Phone Use 能力框架、覆盖 50 + 高频中文 App 的可跑通 Demo,甚至包括 Android

文章图片
#python
利用强化学习 Q-learning 玩 Atari 黑白棋游戏

本文实现了一个基于PyTorch的强化学习黑白棋游戏系统,主要包含以下改进: 框架迁移:将原TensorFlow实现重构为PyTorch版本,使用3层CNN+2层FC的网络结构处理8x8棋盘状态,输出64个位置的Q值。 环境适配: 自定义ReversiEnv环境类实现核心游戏逻辑 包含合法动作检测、棋子翻转、胜负判断等功能 无需Gym环境注册,直接实例化使用 智能体功能: 支持随机策略和Q学习策略

文章图片
#游戏
web开发

JavaScript: 负责网页的行为(动作)CSS : 负责网页的表现(样式)HTML: 负责网页的结构。

#css#html5#javascript
双非本科AI 专业毕业生的破局就业路

近年来,人工智能(AI)作为引领新一轮科技革命和产业变革的战略性技术,已广泛渗透至各个领域,推动行业的智能化转型升级。随着 AI 技术的迅猛发展,市场对 AI 专业人才的需求呈现出爆发式增长态势。据相关数据显示,自 2017 年国务院发布《新一代人工智能发展规划》以来,我国人工智能相关企业数量急剧增加,截至 2025 年,已突破 5000 家,这直接带动了人才需求的飙升。2024 年,中国受访企业

#人工智能
基于deepseek大模型应用开发

实战案例1:基于dify和deepseek构建AI聊天机器人 实战案例2:基于deepseek开发Al Agent实现自动写书信以及发送邮件

文章图片
#人工智能#python
基于deepseek大模型应用开发

实战案例1:基于dify和deepseek构建AI聊天机器人 实战案例2:基于deepseek开发Al Agent实现自动写书信以及发送邮件

文章图片
#人工智能#python
到底了