logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

spark使用本地local模式时pom.xml的配置

1、本地local模式启动SparkSession我写了个脚本做使用本地local模式启动SparkSession,想做个简单的代码测试,如下://in scalapackage com.Toby.Gaoimport org.apache.spark.sql.SparkSessionobject Test {def main(args:Array[String]){val spark = Spar

【转】【NLP】【ACL2020】DeeBERT:衡量性能与效率的 BERT 推理方法

原文链接:【ACL2020】DeeBERT:衡量性能与效率的 BERT 推理方法DeeBERT作者信息Elesdspline目前从事NLP与知识图谱相关工作。导语近年来预训练在 NLP 领域的各个任务上都表现出来很好的效果,但是在推理速度方面却不如人意,所以有很多的研究针对如何加快推理而提出了各种各样的尝试。本文针对加快 BERT 预训练模型的推理速度提出的相关方法,提出了一种简单而有效的方法 D

Qwen2.5-VL视觉-语言模型做图片理解调研

Qwen2.5-VL视觉-语言模型做图片处理调研

文章图片
#语言模型#人工智能
转载-从ReLU到GELU,一文概览神经网络的激活函数

选自mlfromscratch作者:Casper Hansen机器之心编译在计算每一层的激活值时,我们要用到激活函数,之后才能确定这些激活值究竟是多少。根据每一层前面的激活、权重和偏置,我们要为下一层的每个激活计算一个值。但在将该值发送给下一层之前,我们要使用一个激活函数对这个输出进行缩放。本文将介绍不同的激活函数。在阅读本文之前,你可以阅读我前一篇介绍神经网络中前向传播和反向传播的文章,其中已经

#机器学习#深度学习
PySpark 和Pandas在机器学习和分析中的联合使用

写在前面:如何将Pyspark 和 Pandas结合起来做机器学习和常规的建模分析呢?Spark处理大数据,Pandas处理小数据。pyspark中的DataFrame是分布式的,可以用来处理大规模数据的ETL,处理后的数据collect到单机器节点上,然后交给Pandas dataframe来处理。虽然Panas是单机处理的,但胜在功能工具比较齐全和完善,处理下小数据的分析和操作还是足够的。一、

tensorflow深度学习模型读取parquet数据进行训练实现

tensorflow深度学习模型读取parquet数据进行训练实现

#深度学习#tensorflow#pandas
《吴恩达机器学习》笔记

吴恩达机器学习笔记整理

#机器学习
Qwen2.5-VL视觉-语言模型做图片理解调研

Qwen2.5-VL视觉-语言模型做图片处理调研

文章图片
#语言模型#人工智能
【转】知识图谱(KG)存储、可视化、公开数据集、图计算、图编程工具分享

知识图谱(Knowledge Graph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。知识图谱是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、

#知识图谱
深度学习基础概念-Batch、Iteration、Epoch理解

1、概念理解Batch、Iteration、Epoch是在模型训练阶段的概念。在模型训练时,我们选择优化算法,如梯度下降法(全批量梯度下降法BGD、小批量梯度下降法mini-Batch、随机梯度下降法SGD),对模型参数进行调整训练。那么,这里梯度下降法使用的数据量即为batch_size,整个样本N需要的batchs数为:N/batch_size。而使用梯度下降法完成一次参数更新,称为一次迭代,

    共 32 条
  • 1
  • 2
  • 3
  • 4
  • 请选择