logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

字节内部热捧“7种大模型微调的方法笔记”,太完整了

当然还有很多没有开源的,比如 OpenAI 的 ChatGPT/GPT-4,百度的文心一言,谷歌的 PLAM-540B,华为的盘古大模型,阿里的通义千问,等等。与传统的微调范式不同,前缀调整提出了一种新的策略,即在预训练的语言模型(LM)输入序列前添加可训练、任务特定的前缀,从而实现针对不同任务的微调。这些大公司或者研究机构,都是有足够资源的来开发大模型,但是对于一般的小公司或者个人来说,要想开发

文章图片
#自然语言处理#人工智能#语言模型 +1
小白也能微调大模型:LLaMA-Factory使用心得

1. 准备好硬件(GPU)、数据;通过各方面的资讯选中你想要微调的基座模型2. 准备好代码:输入数据 + 模型 -> 在GPU上反复训练3. 训练结束以后,得到训练过程中的checkpoint + 一些log信息4. 根据log信息选一些比较有希望的checkpoint在自己的测试集上推理,获得相应的结果5. 分析结果,获得下一轮实验(数据、训练方案的迭代)思路而LLaMA-Factory就是一个

文章图片
#人工智能#数据库#大数据
实战干货|Python数据分析消费者用户画像

今天给大家介绍一个聚类和降维结合的项目,分为两块内容:直接使用原数据,经过数据预处理和编码后,基于原生的K-Means和PCA/T-SNE实现用户的聚类使用基于Transformer的预训练模型转换后的高维数据,再使用K-Means和PCA/T-SNE实现用户的聚类本文先介绍第一种方案的完整过程。

文章图片
#python#数据分析#开发语言 +3
快乐学Python,数据分析之使用爬虫获取网页内容

在上一篇文章中,我们了解了爬虫的原理以及要实现爬虫的三个主要步骤:下载网页-分析网页-保存数据。下面,我们就来看一下:如何使用Python下载网页。

文章图片
#python#爬虫#开发语言 +2
Python数据可视化入门指南!小白必看!

Matplotlib和Plotly是两个在Python中广泛使用的数据可视化库,它们具有丰富的API和功能,用于创建各种类型的图表和图形。在本篇博客中,我们将介绍它们的主要特点和基本用法。

文章图片
#信息可视化#python#开发语言 +3
【Python爬虫】项目案例讲解,一步步教你爬取淘宝商品数据!

随着互联网时代的到来,人们更加倾向于互联网购物,某宝又是电商行业的巨头,在某宝平台中有很多商家数据,今天带大家使用python+selenium工具获取这些公开的商家数据这次的受害者:淘宝购物平台

文章图片
#python#爬虫#开发语言 +2
Python机器学习案例|梵高的《星空》图片压缩

Python机器学习案例:梵高的《星空》图片压缩本案例将奇异值分解用于处理图像压缩任务。

文章图片
#python#机器学习#人工智能
本地部署大模型!一篇教会你,奶奶看了都会的教程!

综上所述,通过huggingface或者modelscope快速了解最新的大模型,并通过公式计算硬件要求,最后可通过ollama快速部署大模型。

#php#开发语言#数据库 +1
Python自动化办公之PDF拆分工具

今天我们继续分享真实的自动化办公案例,希望各位 Python 爱好者能够从中得到些许启发,在自己的工作生活中更多的应用 Python,使得工作事半功倍!需求需要从 PDF 中取出几页并将其保存为新的 PDF,为了后期使用方便,这个工具需要做成傻瓜式的带有 GUI 页面的形式选择源 pdf 文件,再指定下生成的新的 pdf 文件名称及保存位置,和需要拆分的 page 信息,就可以得到新的 pdf 文

文章图片
#python
    共 187 条
  • 1
  • 2
  • 3
  • 19
  • 请选择