logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

MiniCPM:揭示端侧大语言模型的无限潜力

随着开发具有高达数万亿参数的大型语言模型(LLMs)的兴趣激增,关于资源效率和实际成本的担忧也随之而来,特别是考虑到实验的巨大成本。这一情形突显了探索小型语言模型(SLMs)作为资源高效替代方案的潜力。在此背景下,我们介绍了MiniCPM,特别是其1.2B和2.4B非嵌入参数变体,这些变体不仅在各自的类别中表现出色,而且在能力上与7B-13B的LLMs不相上下。尽管我们专注于SLMs,但我们的方法

文章图片
#语言模型#人工智能#自然语言处理
python matplotlib.plot画图显示中文乱码的问题

原因:matplotlib默认字体并不是中文字体。解决方法:将某中文字体设为默认首选字体,本文拟将默认字体设为微软雅黑。环境:win7 x64, python2.7过程:在python的安装目录中找到配置文件:%Python_Home%\Lib\site-packages\matplotlib\mpl-data\matplotlibrc (如,我的是在D:\Python3...

#python
YoloV5训练V3Det数据集实战

V3Det:一个庞大的词汇视觉检测数据集,在大量真实世界图像上具有精确注释的边界框,其包含13029个类别中的245k个图像(比LVIS大10倍),数据集已经开源!图片的数量比COCO多一些,类别种类比较多!数据集大小由33G,数据集标注格式和COCO一致!论文链接:https://arxiv.org/abs/2304.03752这个数据集最大的特点就是类别多,还有些千奇百怪不可描述的图片!这个数

文章图片
软件工程国考总结——选择题

3)组织过程是指那些与软件生产组织有关的过程(8个)管理过程、基础设施过程、改进过程、人力资源过程、资产。(1)基本过程是指那些与软件生产直接相关的过程(5个)获取过程、供应过程、开发过程、运行过程、维护过程获。文档过程、配置管理过程、质量保证过程、验证过程、确认过程、联合评审过程、审计过程、问题解决过程、易用性过程等。【解析】瀑布模型是软件工程中应用最广泛的过程模型,其他常用的软件过程模型还有增

#软件工程#java#数据库
win11 搜索不到蓝牙鼠标怎么办?

系统重新安装之后,在搜索蓝牙设备的时候,一直无法找到蓝牙鼠标。然后就会弹出蓝牙配对的信息。那么我们应该怎么办呢?

文章图片
#运维
【图像分类】 一文读懂AlexNet

AlexNet4.2.1 模型介绍​AlexNet是由$Alex$$Krizhevsky$提出的首个应用于图像分类的深层卷积神经网络,该网络在2012年ILSVRC(ImageNet Large Scale Visual Recognition Competition)图像分类竞赛中以15.3%的top-5测试错误率赢得第一名$^{[2]}$。AlexNet使用GPU代替CPU进行运算,使得在可接

文章图片
#深度学习#pytorch#神经网络 +1
通用目标检测开源框架YOLOv6在美团的量化部署实战

综上所述,本文基于 YOLOv6 V1.0 版本,以 YOLOv6s 为例探讨了基于重参数化结构设计的 2D 检测模型的量化难点和具体方案,在模型精度基本保持的前提下,通过量化加速,提升了约 40% 的 QPS。部署时的预处理优化则额外提升了 214%,极大地提升了工业部署吞吐能力。下表列出了本文尝试的方法及叠加效果。表10 本文使用的量化方案及效果对比本文使用的速度测试环境见表 11, 测试输入

#目标检测#开源#深度学习
第三届阿里云磐久智维算法大赛——GRU BaseLine

赛题比赛链接:第三届阿里云磐久智维算法大赛-天池大赛-阿里云天池 (aliyun.com)大赛概况庸医只知头痛医头脚痛医脚,凡良医者,必会抽丝剥茧,察其根本,方得药到病除。第一届和第二届磐久智维算法大赛,我们针对异常预测开展了积极的探索和卓有成效的实践。本届大赛我们延续对异常/故障这一领域的深入挖掘,以根因诊断为赛题,和各界同仁一起探讨根因诊断的新思路,共同追逐这一人工智能应用的明珠。在大规

#人工智能#python#深度学习 +1
NLP进阶,使用TextRNN和TextRNN_ATT实现文本分类

TextRNNTextRNN仅仅是将Word Embedding后,输入到双向LSTM中,然后对最后一位的输出输入到全连接层中,在对其进行softmax分类即可,模型如下图:代码:class RNN(nn.Module):def __init__(self, vocab_size, embedding_dim, hidden_dim, output_dim,n_layers=2, bidirect

#自然语言处理#分类#深度学习
    共 542 条
  • 1
  • 2
  • 3
  • 55
  • 请选择