
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
你好,我是郭震结合AI大模型能力,构建个人知识库,做一个问答系统。很多人都有这种需求。因为此种模式,既能发挥大模型的AI问答能力,又能考虑到我们自己个性的文档知识库。常见的方案有这样几种:1. 调用闭源大模型(如ChatGPT, Claude)API,使用向量数据库管理个人知识库;2. 本地部署开源大模型(如Qwen,Llama),使用向量数据库管理个人知识库;第一种方式调用API需要付费,第二种
你好,我是郭震今天教程关于在自己电脑搭建大模型,支持开源的大模型,像主流的通义千问2.5,Llama3,教程还包括如何使用这些大模型做接口调用,实现自动化输出。如下图所示,这是我自己的电脑安装的两个AI大模型,一个是qwen 7b尺寸,另一个是llama3 8b尺寸:本地部署大模型有哪些好处呢?首先,因为这些大模型都是开源的,安装在自己的电脑上也是免费使用的,如下图所示启动qwen7b后,我可以直
你好,我是郭震(zhenguo)今天重新发布强化学习第10篇:强化学习Q-learning求解迷宫问题 代码实现我想对此篇做一些更加详细的解释。1 创建地图创建迷宫地图,包括墙网格,走到墙网格就是负奖励。注意:空白可行走网格奖励值设置为负数,比如-1, 是为减少路径中所经点数;如果设置为大于0的奖励值,路线中会出现冗余点。importnumpyasnp#创建迷宫地图exit_coor...
你好,我是郭震(zhenguo)今天强化学习第二十篇:强化学习SARSA算法1 历史SARSA(「State-Action-Reward-State-Action」)算法是一种经典的强化学习算法,用于解决马尔可夫决策过程(MDP)问题。该算法于1994年由美国计算机科学家Rummery和Niranjan提出。后由Richard S. Sutton和Andrew G. Barto在他们的著作《Rei
你好,我是郭震(zhenguo)今天介绍强化学习第九篇:Q-learning算法前面我们介绍强化学习基本概念,马尔科夫决策过程,策略迭代和值迭代,这些组成强化学习的基础。从今天开始逐步介绍常用强化学习算法,从最简单的Q-learning算法开始。简单并不代表不常用,有的简单会是经典,Q-learning算法就是这样的例子。1 迷宫游戏假设我们有一个迷宫地图,其中包含多个状态(格子),每个格子可以采
你好,我是郭震(zhenguo)前几天我们学习强化学习策略迭代,今天,强化学习第8篇:强化学习值迭代值迭代是强化学习另一种求解方法,用于找到马尔可夫决策过程(MDP)中的最优值函数。值迭代值迭代可以总结为如下几点:值迭代通过不断迭代更新值函数来逼近最优值函数,从而确定最优策略。值迭代的关键是在每次迭代中更新值函数。对于每个状态,通过考虑所有可能的动作和下一个状态,选择能够使值最大化的动作,并计算更
1 线型回归预测气温、预测销售额、预测商品价格等模型:权重,偏差模型训练:feed 数据学习模型参数值,使得误差尽可能小训练集、测试集、验证集、样本、标签、特征损失函数:回归常用平方误差...
请点击上面公众号,免费订阅。 《实例》阐述算法,通俗易懂,助您对算法的理解达到一个新高度。包含但不限于:经典算法,机器学习,深度学习,LeetCode 题解,Kaggle 实战。期待您的到来!01—回顾昨天,分析了手写字数据集分类的原理,利用神经网络模型,编写了SGD算法的代码,分多个epochs,每个 epoch 又对 mini_batch 样本做多次迭代计算,详细的过程,请参考:深度学习|神经
强化学习(Reinforcement Learning)是机器学习领域的三大分支之一,另外两种是我们熟知的监督学习,和非监督学习方法。强化学习也广泛的存在于我们的日常生活工作中。比如,我...
你好,我是郭震这篇文章分享阿里云提出的新一代网络架构HPN7.0,它有望替代谷歌成为AI网络新范式!AI高性能网络架构HPN7.05月14日消息,阿里云AI高性能网络架构HPN7.0成果论文被SIGCOMM2024收录,成为SIGCOMM历史上首篇关于AI智算集群网络架构的论文。SIGCOMMSIGCOMM是全球最权威的计算机通信网络顶会,此前谷歌Jupiter网络入选SIGCOMM后发展成为经.







