爱学习的小道长个人主页

@weixin_40378209

爱学习的小道长

2022-06-28 14:59:07 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

python txt 和 xml 格式互转

图片检测 label 文件 txt 和 xml 互转

#python #xml #开发语言

AI大模型模型参数的初始化方案

大模型参数初始化方法综述本文系统梳理了大模型参数初始化的核心方法和应用策略。关键点包括：1）Xavier/Glorot初始化适用于Tanh/Sigmoid激活函数；2）He/Kaiming初始化是ReLU系列激活的最佳选择；3）正交初始化在残差网络中表现优异；4）Transformer架构不同组件需采用差异化方案，如QKV矩阵常用小标准差初始化，FFN层采用He初始化。现代大模型通常组合多种方法

#人工智能

AI大模型模型参数的初始化方案

#人工智能

黑芝麻A1000 docker环境中使用 bsnntool 转换模型（六）

查看《BST-AI工具链快速上手指南-v0.4.pdf》，下载并解压镜像文件，进入 /xxx/bsnn_tools-v3.7.0/bsnn_tools ,修改 load.sh 脚本，主要修改这三处：：PORT=8370# 本地PC端目录MODEL_ZOO_DIR=/xxx/heizhima/nn/model_zoo_dirOPTION_NOTEBOOK=" nohup jupyter notebo

#docker #bash #linux

c++ 调用python错误总结

参考：C++ 调用Python脚本C/C++调用python（新手必看）c调用python遇到的那些坑解决PyRun_SimpleFile/PyRun_SimpleString报错“探坑”——在C++中执行python脚本的艰辛尝试背景介绍：做 deepsort 跟踪部署 c++ 调用 python 时出现好多错误，记录下来，方便后续排查。用 IDE 的是clion，总所周知它生成的可执行文件在

#c++#python

黑芝麻A1000 jupyter 中 bsnntool 转换yolov5模型并部署到bst A1000平台（八）

正文：进入docker 的 jupyter 环境黑芝麻A1000 docker环境中使用 bsnntool 转换模型（六）中有具体过程解压 Modelzoo-Public-3.8.1.tar.gz 到宿主机与 docker 环境共享的目录下tar zxvf Modelzoo-Public-3.8.1.tar.gz -C /xxx/model_zoo_dir目录下出现 internal 、pu

#jupyter #python

AI 模型训练过程中参数用BF16转向FP16的原因

大模型训练从FP16转向BF16的关键在于BF16在动态范围和精度间取得了更好平衡。FP16虽节省内存和加快计算，但其狭窄的动态范围（5.96e-8 ~ 65504）易导致梯度下溢，影响训练稳定性。BF16采用8位指数位（与FP32相同）和7位尾数位，动态范围（1.18e-38 ~ 3.39e38）与FP32相当，彻底解决了下溢问题，同时保持与FP16相同的内存占用和计算速度。虽然BF16精度较低

#人工智能

AI 模型训练过程中参数用BF16转向FP16的原因

#人工智能

企业微信配置LangBot通信机器人

LangBot 是一个开源 AI 对话机器人系统，可通过 Docker 快速部署。安装步骤包括：1) 确保 Docker 和 Docker Compose 已安装；2) 克隆 GitHub 仓库并运行 docker-compose up -d；3) 容器启动后默认监听 5300 端口，可通过 Web 界面管理。日志显示系统自动完成数据库迁移和插件加载，并提示当前版本为 v4.2.1。系统包含插件管

python 通过代理服务器连接 huggingface下载模型，并运行 pipeline

#python #开发语言

共 32 条

请选择