logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

AI大模型模型参数的初始化方案

大模型参数初始化方法综述 本文系统梳理了大模型参数初始化的核心方法和应用策略。关键点包括:1)Xavier/Glorot初始化适用于Tanh/Sigmoid激活函数;2)He/Kaiming初始化是ReLU系列激活的最佳选择;3)正交初始化在残差网络中表现优异;4)Transformer架构不同组件需采用差异化方案,如QKV矩阵常用小标准差初始化,FFN层采用He初始化。现代大模型通常组合多种方法

文章图片
#人工智能
使用mediapipe捕捉脸部姿态并同步到Live2D数字人

本文介绍了一个基于MediaPipe的面部表情捕捉系统,能够实时检测和分析人脸关键点。系统可以跟踪眼睛状态(开/闭)、绘制面部轮廓(绿色)、嘴唇(粉色)和虹膜(蓝色)特征,并在额头显示标识。通过EyeStateTracker类实现眼睛状态平滑处理,避免检测抖动,同时提供背景虚化功能。该系统可作为2D卡通角色生成的基础模块,从文本描述创建生动的面部动画。

文章图片
解决本地连接服务器ollama的错误

解决客户连接不上服务器的ollama的问题

文章图片
#服务器#chrome#运维
进程、线程、协程三者的区别和联系

本文对比了进程、线程和协程的核心概念,分析了它们的隔离性、开销、数据共享和并发性等特点。进程拥有独立地址空间但开销大,线程共享进程资源但需同步机制,协程则是最轻量级的用户态线程。Python中可通过multiprocessing、threading和asyncio库分别实现这三种并发方式。代码示例展示了多进程处理CPU密集型任务和协程处理高并发I/O操作的应用场景,揭示了它们各自的优势与适用条件。

#python#ubuntu
ERROR: Could not find a version that satisfies the requirement langchain_chroma

解决 ERROR: Could not find a version that satisfies the requirement langchain_chroma

ERROR: Could not find a version that satisfies the requirement langchain_chroma

解决 ERROR: Could not find a version that satisfies the requirement langchain_chroma

Python 使用 langchain 过程中的错误总结

Python 使用 langchain 过程中的错误总结

文章图片
#python#开发语言
AI大模型模型参数的初始化方案

大模型参数初始化方法综述 本文系统梳理了大模型参数初始化的核心方法和应用策略。关键点包括:1)Xavier/Glorot初始化适用于Tanh/Sigmoid激活函数;2)He/Kaiming初始化是ReLU系列激活的最佳选择;3)正交初始化在残差网络中表现优异;4)Transformer架构不同组件需采用差异化方案,如QKV矩阵常用小标准差初始化,FFN层采用He初始化。现代大模型通常组合多种方法

文章图片
#人工智能
python 通过代理服务器 连接 huggingface下载模型,并运行 pipeline

python 通过代理服务器 连接 huggingface下载模型,并运行 pipeline

文章图片
#python#开发语言
    共 24 条
  • 1
  • 2
  • 3
  • 请选择