logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

chatglm3-6b部署和微调

本文详细介绍了在AutoDL服务器上部署ChatGLM3-6B大模型的全过程,包括环境配置、模型下载和启动测试,以及两种微调方法。首先租用4090显卡服务器,配置Python 3.8和CUDA 11.8环境,通过HuggingFace或镜像站下载模型文件。提供了终端交互和网页交互两种启动方式,并说明本地访问方法。重点演示了基于ToolAlpaca数据集的多轮对话微调和基于AdvertiseGen数

文章图片
#语言模型
腾讯云部署bisheng毕昇

本文介绍了开源大模型开发平台毕昇(Bisheng)的部署流程。首先在腾讯云服务器上安装基础依赖,包括Docker、Docker Compose和Git。然后克隆毕昇项目并启动服务,配置安全组规则后即可通过公网IP访问Web界面。接着安装Milvus向量数据库和ElasticSearch搜索引擎,为平台提供数据存储和检索支持。整个部署过程详细展示了从环境准备到服务启动的关键步骤,最终实现了一个可登录

文章图片
#腾讯云#云计算#语言模型
论文阅读笔记-POSTER: A Pyramid Cross-Fusion Transformer Network for Facial Expression Recognition

本文介绍了CVPR顶会论文《POSTER: A Pyramid Cross-Fusion Transformer Network for Facial Expression Recognition》的核心内容。该研究针对面部表情识别(FER)中的三大挑战——类间相似性、类内差异性和尺度敏感性,提出了一种金字塔交叉融合Transformer网络(POSTER)。通过双流架构(图像流和地标流)提取特征

文章图片
#论文阅读#transformer#计算机视觉
到底了