logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

强化学习环境升级 - 从gym到Gymnasium

作为强化学习最常用的工具,gym一直在不停地升级和折腾,比如gym[atari]变成需要要安装接受协议的包啦,atari环境不支持Windows环境啦之类的,另外比较大的变化就是2021年接口从gym库变成了gymnasium库。让大量的讲强化学习的书中介绍环境的部分变得需要跟进升级了。不过,不管如何变,gym[nasium]作为强化学习的代理库的总的设计思想没有变化,变的都是接口的细节。

文章图片
#python#人工智能
Tensorflow快餐教程(8) - 深度学习简史

深度学习简史从机器学习流派说起如果要给机器学习划分流派的话,初步划分可以分为『归纳学习』和『统计学习』两大类。所谓『归纳学习』,就跟我们平时学习所用的归纳法差不多,也叫『从样例中学习』。归纳学习又分为两大类,一类是像我们归纳知识点一样,把知识分解成一个一个的点,然后进行学习。因为最终都要表示成符号,所以也叫做『符号主义学习』;另一类则另辟蹊径,不关心知识是啥,而是模拟人脑学习的过程...

#深度学习
软件缺陷智能分析技术(3) - 提升SZZ的准确率

软件缺陷智能分析技术(3) - 提升SZZ的准确率上一节我们介绍了在即时缺陷分析领域里有开创意义的SZZ算法。尽管用直觉都能感受到SZZ算法有诸多需要改进之处,但是目前这仍然是即时缺陷分析的基础方法。这一节我们就讨论如何提升SZZ算法的准确率。细看SZZ首先我们复习一下SZZ算法的内容:第一步,从bug数据库中找到修复的问题第二步,从代码库中找到bug修复的代码改动第三步,针对每一行改动,找到之前

2023年的深度学习入门指南(24) - 处理音频的大模型 OpenAI Whisper

在这一讲之前,我们所用的大模型都是针对文本的。这一讲我们增加一个新的领域,即音频。我们将介绍OpenAI的Whisper模型,它是一个处理音频的大模型。

文章图片
#深度学习#音视频
2023年的深度学习入门指南(17) - 深度学习的硬件加速技术

除了使用CPU,GPU这样的通用器件之外,采用专用的硬件来进行加速是一个大家都能想到的选择。

文章图片
#深度学习#人工智能
2023年的深度学习入门指南(12) - PEFT与LoRA

大家都知道,大模型的训练需要海量的算力。其实,即使是只对大模型做微调训练,也是需要大量的计算资源的。有没有用更少的计算资源来进行微调的方法呢?研究者研发出了几种被Hugging Face统称为参数高效微调PEFT(Parameter-Efficient Fine-Tuning)的技术。这其中常用的几个大家应该已经耳熟能详了,比如广泛应用的LoRA技术(Low Rank Adapters,低秩适配)

文章图片
#深度学习#人工智能
2023年的深度学习入门指南(8) - 剪枝和量化

从这一节开始,我们要准备一些技术专项了。因为目前大模型技术还在快速更新迭代中,各种库和实现每天都在不停出现。因为变化快,所以难免会遇到一些问题。对于细节有一定的把握能力起码可以做到出问题不慌,大致知道从哪方面入手。我们首先从如何优化大模型的大小,使其能够在更少计算资源的情况下运行起来。我们这一节先说模型压缩方法:剪枝和量化。

文章图片
#深度学习#剪枝#人工智能
2023年的深度学习入门指南(23) - ChatGLM2

在《在你的电脑上运行大模型》这一节,我们曾经介绍过ChatGLM模型,它是当时最好的中文大模型之一。现在,它又更新到了第二代,即ChatGLM2。当时,我们的技术储备还不足,只能让它运行起来,还不敢讲解它的原理和代码。现在,经过LLaMA 2和百川的代码的狂轰滥炸,大家已经适应了看代码的节奏了。现在,是时候来看看ChatGLM2的原理和代码了。

文章图片
#深度学习#人工智能
2023年的深度学习入门指南(19) - LLaMA 2源码解析

上一节我们学习了LLaMA 2的补全和聊天两种API的使用方法。本节我们来看看LLaMA 2的源码。

文章图片
#深度学习#人工智能
    共 109 条
  • 1
  • 2
  • 3
  • 11
  • 请选择