javastarboy 个人主页

@u012723183

javastarboy

2023-02-08 11:12:36 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

大模型「训练」与「微调」概念详解【6000字长文】

1、大模型预训练与微调的基本流程2、预训练、训练、后期预训练、微调的区别3、大模型训练与微调的一些概念，如：Post-pretrain、SFT、RLHF、模型对齐、Lora、Q-Lora、大模型量化、微调指标、微调参数、大模型评测指标在大模型的预训练与微调过程中，我们通常面临如何告诉模型想要什么答案和不想要什么答案的问题（后者往往被大家忽略）。本节将详细阐述大模型预训练与微调的流程，包括预训练、微

#深度学习 #人工智能 #机器学习

大模型「训练」与「微调」概念详解【6000字长文】

#深度学习 #人工智能 #机器学习

docker容器 + rancher 访问项目报503 service temporarily unavailable错误

容器访问项目报503 service temporarily unavailable错误最近搞容器，通过jenkins+docker+Gitlag+rancher + SpringBoot进行自动部署，但是访问项目经常会出现503错误，根据近期的整理，目前总结出三个可能导致这个错误的原因，希望帮助大家少走弯路主要原因就是负载均衡自动部署的有问题1.检查工作负载的镜像编号与jenkins里面的...

#docker #rancher #jenkins +1

Transformers 库与 Transformer 有什么区别?

用途: "Transformers"库是一个提供多种预训练模型和工具的软件库，用于简化和加速NLP任务的开发。而"Transformer"模型是一种特定的深度学习架构，用于处理序列数据，尤其是在NLP领域。范围: "Transformers"库包含多种基于"Transformer"架构的模型以及其他类型的模型，而"Transformer"通常指的是最初提出的那个具有自注意力机制的模型。实现: "T

#transformer #深度学习 #人工智能

大模型训练及推理【硬件选型指南】及 GPU 通识

图形处理单元(GPU)是一种功能强大的电子芯片，用于在沉浸式视频游戏、电影和其他视觉媒体中呈现丰富的 2D/3D 图形和动画因其超越 CPU 的并行矩阵运算性能，所以也被广泛应用于人工智能相关的各种系统，包括机器视觉、NLP、语音识别、自动驾驶等。

#人工智能 #GPU #AI

win10开机占用内存大，资源管理器也看不到运行进程

更新win10以后，用着很爽，但用久之后有时开机内存能占用70%以上，作为资深程序员，开启多个软件后就飙到百分之八九十，当然不能容忍，在网上找的解决方案有：结束任务、关服务、重置系统，开虚拟内存等，但都未能解决我的问题，后来==禁用了“win10的启用快速启动”==功能就好了。下面我把这几种常用网上介绍的方案整理一下，希望其中一个是你需要的：方法一：禁用win10的启用快速启动功能，找不...

超详细步骤，教你一次就成功注册Gmail邮箱（同时可以用于申请谷歌广告账户）

logback简单使用及 MaxHistory 属性日志文件保留天数不生效问题

前面我写了一篇 Linux cron 定时任务方式实现日志文件的自动备份与清除，其实对于 SpringBoot 通过 logback 可以直接集成。今天在做这种方式实现这个功能时遇到一个棘手问题就是 MaxHistory 属性日志文件保留天数不生效，这里做一下记录，顺便简单介绍一下 logback.xml。1、 logback 基本使用-结构logback 的三部分结构：appender、roo

微信公众号支持语音消息向 ChatGPT提问啦！

公众号已经支持语音识别，大家可以通过我的公众号（javastarboy）发送语音向 ChatGPT 提问了，如果还没体验过的，一定要来体验一下，真的很棒~

#微信 #人工智能

OpenAI ChatGPT3.5 completion API 入门指南

GPT-3.5-turbo 模型是以一系列消息作为输入，并将模型生成的消息作为输出。消息是一个对象数组，其中每个对象都有一个角色，一共有三种角色。系统-system：消息有助于设置助手的行为。在上面的例子中，助手被指示 “你是一个得力的助手”;用户-user：消息有助于指导助手。就是用户说的话，向助手提的问题;助手-assistant：消息有助于存储先前的回复。这是为了持续对话，提供会话的上下文。

#gpt-3 #python #ChatGPT

共 11 条

请选择