简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
为什么要了解Io这样的语言?如果不是《七周七语言》这样的书来介绍它,估计很少有人关注到它吧。其实目的很简单,作为js代码和js虚拟机的开发人员,学习原型化的语言对于更深入地理解javascript是有难以估量的帮助的。毕竟javascript和Io同源,在原型化思想上都供鉴了Self语言的思想。
常见Linux发行版的包管理工具速成指南各种Linux发行包都为我们提供了包的管理工具。我们学会用Docker和虚拟机大法之后,不妨体会一下不同的版本工具带来的不同的体验。从工具上,影响最大的两个系列,就是debian的dpkg包和Red Hat的rpm包两大系列。dpkg系的前端工具是apt,用于Debian系统及其衍生系统如Ubuntu系统,以及Ubuntu的衍生系统如LinuxMint
程序员学深度学习快速入门五步法作为一个程序员,我们可以像学习编程一样学习深度学习模型开发。我们以Keras为例来说明。我们可以用5步 + 4种基本元素 + 9种基本层结构,这5-4-9模型来总结。5步法:1. 构造网络模型2. 编译模型3. 训练模型4. 评估模型5. 使用模型进行预测4种基本元素:1. 网络结构:由10种基本层结构和其他层结构组成2. ...
常见Linux发行版的包管理工具速成指南各种Linux发行包都为我们提供了包的管理工具。我们学会用Docker和虚拟机大法之后,不妨体会一下不同的版本工具带来的不同的体验。从工具上,影响最大的两个系列,就是debian的dpkg包和Red Hat的rpm包两大系列。dpkg系的前端工具是apt,用于Debian系统及其衍生系统如Ubuntu系统,以及Ubuntu的衍生系统如LinuxMint
这一节我们来学习下预训练模型的封装库,Hugging Face的Transformers库的使用。Hugging Face的库非常活跃,比如支持LLaDA大规型的类,是在本文开始写作的前一天发布的。库新到这种程度,而且相应配套的库也在不停修改中,这个时候进入这个领域一定要做好要花时间完善还不成熟的功能,尤其是花较多时间debug问题的思想准备。另外,还是再提醒大家,大模型算法不是普通编程。模型规模
最近发生的两件事情都比较有意思,一个是连续开源了7b和13b模型的百川,对其53b闭源了;另一个是闭源项目通义千问开源了自己的7b模型。下面我们就来研究下通义千问7b.
前面我们用了三节的篇幅介绍了目前最强大的开源模型LLaMA2。这一节我们说一说国产大模型的一个代表,百川大模型。
上一篇我们介绍了大模型的基础,自注意力机制以及其实现Transformer模块。因为Transformer被PyTorch和TensorFlow等框架所支持,所以我们只要能够配置好框架的GPU或者其他加速硬件的支持,就可以运行起来了。而想运行大模型,恐怕就没有这么容易了,很有可能你需要一台Linux电脑。因为目前流行的AI软件一般都依赖大量的开源工具,尤其是要进行优化的情况下,很可能需要从源码进行
上一节我们把LLaMA 2的生成过程以及封装的过程的代码简单介绍了下。还差LLaMA 2的模型部分没有介绍。这一节我们就来介绍下LLaMA 2的模型部分。这一部分需要一些深度神经网络的基础知识,不懂的话不用着急,后面的文章我们都会介绍到。
操作系统形式化验证实践教程(6) - 解析C源代码从这一讲我们跨出了Isabelle/HOL的领域,开始进入操作系统的领域。目前的操作系统主要是由C语言和汇编语言写成的,所以我们的第一步先从解析C语言代码开始。构造C解析器我们需要一个能够解析C源代码,并且能在HOL操作C源代码的工具。seL4为我们提供了c-parser.我们首先进入l4v/tools/c-parser目录,接着构造c-parse