logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

05.大模型&大数据量

部分截图来自原课程视频《2023李宏毅最新生成式AI教程》,B站自行搜索开幕就是"A colossal language model,showcasing unimaginable power."并以此为语料从Midjourney生成一个AI插画,看了一下个玩意被羊毛党薅到已经收费了。AI表示巨大力量之类的图片总是会加上渺小的人类做比较。图中怪兽的左手手指那里貌似有点没生成好,另外牙的细节也不够逼

文章图片
#深度学习#人工智能
番外01.LLaMA

本课程来自深度之眼《大模型——前沿论文带读训练营》公开课,部分截图来自课程视频。向量空间中词表示的有效估计作者:Hugo Touvron等单位:Meta AI发表时间:2023 arxivChatGPT相关工具,不过貌似好多都很麻烦,要部署,直接能用的没看见。。。什么是LLaMA:1.参数量有四档:7/13/33/65亿,最低那档据说24g显存的显卡可以跑,7亿的LLaMA用了1万亿token进行

文章图片
#人工智能#机器学习
C2W4.LAB.Word_Embedding.Part2

图中描述的是一个简单的神经网络模型,通常用于处理词嵌入(Word Embedding)任务,如连续词袋模型(Continuous Bag of Words, CBOW)。如果再次运行这个单元,就会得到下一个值,依此类推,直到迭代器返回的值用完为止。,这个矩阵的第一列(3个元素)对应第一个单词的表征,第二列对应第二个单词,以此类推。你可以对它进行迭代(例如使用。是因为只进行一次迭代训练,如果在多个迭

文章图片
TCP.05.重叠IO模型:事件通知

文章目录重叠IO模型介绍重叠IO模型代码逻辑重叠IO模型代码实现https://docs.microsoft.com/en-us/windows/win32/api/winsock2/nf-winsock2-socket基于TCP/IP的网络编程有5种模型:SELECT模型事件选择模型异步选择模型重叠IO模型完成端口模型这次先讲第四种。重叠IO模型介绍重叠IO是Windows提供的一种异步读写文件

李宏毅DLHLP.20.Non-Autoregressive Generation

文章目录介绍介绍本门课程是2020年李宏毅老师新课:Deep Learning for Human Language Processing(深度学习与人类语言处理)课程网站B站视频公式输入请参考:在线Latex公式这节课是莊永松主讲,关于Non-Autoregressive这个在BERT and its family.2/2中有提到过这个名词,与之对应的是Autoregressive。所谓的Aut

李宏毅机器学习笔记.Flow-based Generative Model(补)

文章目录引子生成问题回顾:GeneratorMath BackgroundJacobian MatrixDeterminant 行列式Change of Variable Theorem简单实例一维实例二维实例网络G的限制基于Flow的网络构架G的训练Coupling LayerCoupling Layer反函数计算Coupling Layer Jacobian矩阵计算Coupling Layer

文章图片
#机器学习#人工智能
第七章支持向量机.7.2间隔分离最大化的存在唯一性

文章目录存在性唯一性本课程来自深度之眼,部分截图来自课程视频以及李航老师的《统计学习方法》第二版。公式输入请参考:在线Latex公式定理7.1(最大间隔分离超平面的存在唯一性)若训练数据集T线性可分,则可将训练数据集中的样本点完全正确分开的最大间隔分离超平面存在且唯一。存在性min⁡w,b12∣∣w∣∣2s.t.yi(w⋅xi+b)−1≥0i=1,2,⋯ ,N\underset{w,b}{\min

09【NLP项目一人工智能辅助信息抽取】第四周part II-基于深度学习的信息抽取系统

文章目录项目简介任务简介:BiLSTM-CRF模型发射分数Emission score转移分数Transition score路径分数Path score预测BiLSTM-CRF代码(略)项目简介知识图谱、信息抽取以及规则系统基于机器学习的信息抽取系统基于深度学习的信息抽取系统(本节内容)信息抽取最新研究与展望信息抽取实战经验与面试准备任务简介:学习使用bilstm-crf解决ne...

08【NLP项目一人工智能辅助信息抽取】第四周part I-深度学习命名实体识别实战

文章目录项目简介任务简介:深度学习解决NLP任务传统方法解决NER问题深度学习解决NLP任务文本表示词向量语言模型N元语言模型N-gram Language model神经语言模型NNLM文本特征抽取器卷积神经网络膨胀Dilate加深循环神经网络LSTM Long Short Term MemoryBiLSTMTransformer注意力机制Encoder-Decoder框架Attention b

番外.李宏毅学习笔记.12.GNN

文章目录前言IntroductionNN(略)Graph常见GNN应用ClassificationGeneration结合社交网络的分类现有问题RoadmapTasks, Dataset, and BenchmarkGraph Classification: SuperPixel MNIST and CIFAR10Regression: ZINC molecule graphs datasetNo

    共 21 条
  • 1
  • 2
  • 3
  • 请选择