logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【深度学习技术系列】大模型基础组件 - Tokenizer

文章目录1. 前言2. 示例3. 对比4. 子词切分4.1 字节对编码(Byte-Pair Encoding, BPE)4.1.1 训练阶段4.1.2 推理阶段4.1.3 BBPE4.2 WordPiece4.2.1 训练阶段4.2.2 推理阶段4.3 Unigram4.3.1 训练阶段4.3.2 推理阶段4.4 SentencePiece4.4.1 byte回退5. 语法5.1 英文文本向量化5

文章图片
#深度学习#机器学习#nlp
【深度学习技术系列】大模型基础组件 - Tokenizer

文章目录1. 前言2. 示例3. 对比4. 子词切分4.1 字节对编码(Byte-Pair Encoding, BPE)4.1.1 训练阶段4.1.2 推理阶段4.1.3 BBPE4.2 WordPiece4.2.1 训练阶段4.2.2 推理阶段4.3 Unigram4.3.1 训练阶段4.3.2 推理阶段4.4 SentencePiece4.4.1 byte回退5. 语法5.1 英文文本向量化5

文章图片
#深度学习#机器学习#nlp
【深度学习技术系列】大模型基础组件 - Tokenizer

文章目录1. 前言2. 示例3. 对比4. 子词切分4.1 字节对编码(Byte-Pair Encoding, BPE)4.1.1 训练阶段4.1.2 推理阶段4.1.3 BBPE4.2 WordPiece4.2.1 训练阶段4.2.2 推理阶段4.3 Unigram4.3.1 训练阶段4.3.2 推理阶段4.4 SentencePiece4.4.1 byte回退5. 语法5.1 英文文本向量化5

文章图片
#深度学习#机器学习#nlp
【设计模式】把风放哨,防老板 --- 观察者模式

一,概述        观察者模式(有时又被称为发布-订阅模式、模型-视图模式、源-收听者模式或从属者模式)是软件设计模式的一种。在此种模式中,一个目标物件管理所有相依于它的观察者物件,并且在它本身的状态改变时主动发出通知。这通常透过呼叫各观察者所提供的方法来实现。此种模式通常被用来实作事件处理系统。 二,示例        题目描述:公司里有的员工偷懒,看股票,看NBA。老板回来

【技术】vmware 安装 mac OS 10.6 雪豹

问题解释:一,没有出现安装磁盘解答:使用工具->磁盘工具。然后对你的虚拟硬盘执行“抹掉”操作二,安装失败解答:其实已经安装成功了,只是需要引导盘启动。这时候你把安装时候用的引导盘挂载到光驱中,重新启动。tab选中mac 进入系统就可以了。三,mac os 只支持 ssci 磁盘四,创建之初的修改解答:创建好之后,需要你在刚建立的虚拟机目录下找到一个扩展名为.vmx的文件

#虚拟机
【Linux】解决ubuntu代理上网问题

背景:由于公司需要使用代理上网,则需要设置代理。一,上网工具Fifox代理设置依次点击 edit->preferences-> Advanced->network->settings 在里面填写代理服务器的IP,Port就可以了。如果是虚拟机里,则选择use system proxy settings 。如果不想用代理可以选择Auto-detect proxy……二,Synapit

#ubuntu#虚拟机#服务器
【Linux】Ubuntu 代理配置

apt-get 设置代理 proxy 方法方法一 :这是一种临时的手段,如果你仅仅是暂时需要通过http代理使用apt-get,你可以使用这种方法。在使用 apt-get  之前,在终端中输入以下命令:export  http  proxy=http://yourproxyaddress:proxyport据说取消代理使用:export  http_proxy="" 不行的话试

#ubuntu#linux#网络 +1
【Linux】Linux 下多进程编程详解

一.多进程程序的特点   进程是一个具有独立功能的程序关于某个数据集合的一次可以并发执行的运行活动,是处于活动状态的计算机程序。   进程作为构成系统的基本细胞,不仅是系统内部独立运行的实体,而且是独立竞争资源的基本实体。   进程是资源管理的最小单位,线程是程序执行的最小单位。进程管理着资源(比如 cpu、内存、文件等等),而将线程分配到某个 cpu 上执

#linux#数据结构#unix
【RFB】Linux uinput 分析,虚拟鼠标,键盘

Linux 有自己的 input 子系统,可以统一管理鼠标和键盘事件。基于输入子系统 实现的 uinput 可以方便的在用户空间模拟鼠标和键盘事件。当然,也可以自己造轮子, 做一个字符设备接收用户输入,根据输入,投递 input 事件。还有一种方式就是直接 往 evnent 里写入数据, 都可以达到控制鼠标键盘的功能。本篇文章就是演示直接写入 event 的方法。 linu

#linux#list
【Linux】FrameBuffer操作入门

所有的这些操作,都是在控制台界面下,root登录。一,先变一个魔法         $ cat /dev/fb0 > sreensnap      /*获取一屏的数据*/           $ clear                                         /*清楚屏幕的输出*/         $ cat sreensnap > /dev/f

    共 25 条
  • 1
  • 2
  • 3
  • 请选择