logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

全连接神经网络实现猫狗识别(基于Pytorch)

完全的全连接囿于模型问题,准确率只能到70。但还是因为内向,被要求每周PPT汇报一次。昨天项目答辩,一天讲了俩PPT。性格内向真要变得外向起来才行吗。正常情况都是用卷积,下次再写。

文章图片
#pytorch#神经网络#深度学习
于大模型迁移中学习 Docker

现在在modelarts上用八卡昇腾910跑llama,不同于之前自己配环境,昇腾生态创新中心都是用的镜像,虽说打包起来不用自己配的那么麻烦,但一键启动之后各种找不到包、调用函数出错的问题搞得我头大,真的每跑一次大模型都要找一个相匹配的镜像才可以吗?最近在做大模型的昇腾迁移,国产化框架踩坑不少,基本一天的工作量相当于之前做纯视觉算法时一周踩过的坑数了。

文章图片
#学习#docker#容器
昇腾Ascend C算子开发

构体获取Tiling信息,根据Tiling信息控制数据搬入搬出Local Memory的流程;由于Tiling实现中完成的均为标量计算,AI Core并不擅长,所以我们。Kernel实现即算子核函数实现,在Kernel函数内部通过解析Host侧传入的Tiling结。切分数据的算法称为Tiling算法或者Tiling策略。环多少次)的计算程序,称之为Tiling实现,也叫Tiling函数(Tilin

文章图片
#c语言#pytorch#深度学习
MindIE 长文本推理

长序列定义为序列长度超过32K甚至可到达1M级别的文本。长序列特性的主要要求是在输入文本超长的场景下,模型回答的效果及性能也可以同时得到保障。在长序列场景下,由Attention和部分造成的显存消耗会快速的成倍增长。因此对这部分显存的优化便是长序列特性的关键技术点。其中涉及到诸如KV Cache量化,kv多头压缩,训短推长等关键算法技术。:在训练时通过较长的文本对模型的权重进行训练,从而使得模型在

文章图片
#人工智能
昇腾 paged_attention 算子

【代码】昇腾 paged_attention 算子。

文章图片
#java#人工智能#算法
LangChain与昇腾

正是因为LangChain连接了开发者和复杂的LLM应用,因此,开发变得更为简单、高效。越来越多的开发者,不论是LLM领域的还是非LLM领域的,都选择使用LangChain。现代软件工程宗旨:将庞大复杂的系统划分为更小、更易于管理和使用的部分LangChain以**“组件”**和**“链”**作为2个关键概念,为LLM应用开发者提供了便利。

文章图片
#大数据
基于昇腾910B搭建多节点K8s集群

自从 2013 年 Docker 诞生以来,容器一跃成为 IT 界最热门的话题。而 Kubernetes 趁着容器的东风,击败众多竞争对手,成为了“容器编排”领域的King。可以说,现在 Kubernetes 已经没有了实际意义上的竞争对手,它的地位就如同 Linux 一样,成为了事实上的云原生操作系统,是构建现代应用的基石。

文章图片
#kubernetes#容器#云原生
昇腾搭建PyTorch环境(训练)

如果服务器上有 N路NPU,回显N行含“d801”字段,表示NPU正常在位。

文章图片
#pytorch#人工智能#python
简单的回归分析

最近在看慕课上北大开的数据结构和算法Python版,老师讲的深入浅出,我会不断输出课上的心得体会,与大家共同讨论,共同进步。Python算法之回归分析回归分析是一种用于数据分类的回归模型。这个模型非常简单,事实上,它是一个线性分类器。无论如何,当你想要去探索你的数据的时候,这是一个很好的出发点。很容易编程,完全可以速成。且模型是解释性的模型,也就是说模型将告诉你每个特性对因变量的影响。绿色和蓝色-

#算法#数据结构#python +2
    共 35 条
  • 1
  • 2
  • 3
  • 4
  • 请选择