logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Qwen3-8B大模型微调实战

Unsloth 是一个专门为 Llama 3.3、Mistral、Phi-4、Qwen 2.5 和 Gemma 等模型设计的微调加速框架。该项目由 Daniel Han 和 Michael Han 领导的团队开发,旨在为开发者提供一个高效、低内存的微调解决方案。

Qwen3-8B大模型微调实战

Unsloth 是一个专门为 Llama 3.3、Mistral、Phi-4、Qwen 2.5 和 Gemma 等模型设计的微调加速框架。该项目由 Daniel Han 和 Michael Han 领导的团队开发,旨在为开发者提供一个高效、低内存的微调解决方案。

Selenium使用过程中出现Exception in thread “main“ org.openqa.selenium.SessionNotCreatedException: Could not

在启动Selenium过程中出现了一大串报错,检查了chrome的版本也对的上,和Selenium的版本也对的上,我的代码如下得到报错。

#selenium#测试工具#java +2
Standford CS336(一)课程介绍

斯坦福CS336课程(2025春季)聚焦"从零构建语言模型",针对当前AI研究领域出现的"技术脱节"现象,强调通过实践深入理解模型机制。课程揭示了语言模型工业化面临的挑战:GPT-4等前沿模型需1.8万亿参数和1亿美元训练成本,且核心细节不公开。课程提出"多即不同"原则,指出小型与大型模型存在本质差异,重点培养三种能力:模型机制理解、硬件

#开发语言#python
Python中a, b = b, a + b的含义

Python中a, b = b, a + b的含义

#python
我参加第七届NVIDIA Sky Hackathon——训练CV模型

如何从0开始训练resnet18模型,并利用TAO CONVERTER进行导出

#人工智能#计算机视觉#python
如何阅读芯片手册

新手怎么阅读芯片手册

#pcb工艺
【文献阅读】Collective Decision for Open Set Recognition

在开集识别(OSR)中,几乎所有现有的方法都是专门为识别单个实例而设计的,即使这些实例是集体地成批出现的。识别者在决策中要么拒绝它们,要么使用经验设定的阈值将它们归类到某个已知的类。因此,决策阈值起着关键作用。然而,其选择往往依赖于已知类的知识,不可避免地会因缺乏未知类的可用信息而带来风险。另一方面,一个更现实的OSR系统不应该仅仅依赖于拒绝决策,而应该更进一步,特别是在发现拒绝实例中隐藏的未知类

#支持向量机#机器学习#人工智能 +1
基于RetinaFace+Jetson Nano的智能门锁系统——第一篇(烧录系统)

然后进入系统,在右边任务栏中找到DVD图标,打开后找到VMware Tools压缩文件,并将其复制到桌面。将Micro-USB - USB-A电源线,一端接Jetson nano一端接PC端,选择连接到虚拟机。在STEP2无需勾选SDK Components,然后点Continue就开始烧录了,烧录完成后,将。安装的时候需要注意,看见选项就填yes,没有选项就直接回车。拔下来,然后接电源启动,看到

#嵌入式硬件#人工智能#机器学习 +2
    共 23 条
  • 1
  • 2
  • 3
  • 请选择