logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型SFT监督微调完全解析:原理、数据集、训练流程、实战调优、避坑指南

SFT(Supervised Fine-Tuning)监督微调:基于预训练底座大模型,使用高质量人工标注指令数据集,以有监督学习的方式,让模型学习「用户指令 → 标准回答」的映射关系。1. SFT 是大模型从“能用”到“好用”的第一道门槛;2. 预训练学知识,SFT学任务,RLHF学审美;3. SFT效果核心不在于参数,而在于高质量、高纯净数据集;4. 所有私有化行业模型、企业专属模型,必须经过S

文章图片
hive异常 show tables 无法使用 : Unable to instantiate rg.apache.hadoop.hive.metastore.HiveMetaStoreClient

异常:hive> show tables;FAILED: Error in metadata: java.lang.RuntimeException: Unable to instantiate rg.apache.hadoop.hive.metastore.HiveMetaStoreClient FAILED: Execution Error, return code 1 from

JVM 中各区的作用 --《深入理解JVM》读书笔记

主要分区:程序计数器、虚拟机栈、本地方法栈、堆、方法区1、虚拟机栈(jvm stacks)线程私有,生命周期与线程相同。主要存放:局部变量表、操作数栈、动态链接、方法出口2、堆(heap)所有线程共享的区域、在虚拟机启动时创建。存放:对象实例。堆是GC重点照顾对象,所以也被称GC堆。3、方法区(Method Area)主要存放:被虚拟机加

一张属于程序员的图片

前几天在微博上,看到一张图片,看看大家能找出几个四个卡通动物,我知道三个:左边起第一个:拿三叉戟的BSD,linux的一个分支第二个 : linux企鹅,这个大家肯定都知道第三个: 鲨鱼 groovy ,一种基于JVM(Java虚拟机)的敏捷开发语言第四个不知道喝的咖啡是 java  笔筒中的羽毛 : apache 魔方 : GTK ,是一套

Servlet入门 代码

1. 第一个Servlet程序package com.allanlxf.serv.basic;import javax.servlet.*;import java.io.*;public class TimeServlet implements Servlet{private ServletConfig config;public TimeServlet(

Hadoop 中 获取 输入文件名

旧API获取输入路径String path=((FileSplit)reporter.getInputSplit()).getPath().toString();新API获取文件名InputSplit inputSplit = context.getInputSplit();String fileName = ((FileSplit) inputSplit)

到底了