logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型推理的「加速神器」,使用 vLLM 对 Qwen2.5 推理实操教程

选择「NVIDIA GeForce RTX 4090」以及「vLLM」镜像,OpenBayes 平台上线了新的计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。如果我们对模型进行微调,那么系统就不那么重要了,因为无论我们使用哪个系统提示,模型都会从目标中学习该做什么。该教程为使用 vLLM 加载 Qwen2.5-3B-Instruct-AWQ 模型进行少样本学习,包括

文章图片
#python#开发语言#人工智能 +3
DeepSeek 开源多模态大模型 Janus-Pro-7B,一键完成图像理解 & 文生图

Janus-Pro 是一种新颖的自回归框架,它统一了多模态理解和生成,由中国 AI 企业 DeepSeek 于 2025 年开发的开源多模态大模型,它通过将视觉编码解耦到单独的路径来解决以前方法的局限性,同时仍然使用单一的、统一的转换器体系结构进行处理。选择「NVIDIA GeForce RTX 4090」以及「PyTorch」镜像,OpenBayes 平台上线了新的计费方式,大家可以按照需求选择

文章图片
#人工智能#机器学习#深度学习 +2
助力解析化学图像生成文本分析,化学大语言模型 ChemVLM 来啦!

该模型旨在解决化学图像理解与文本分析之间的不兼容问题,通过结合视觉 Transformer (ViT)、多层感知机 (MLP) 和大型语言模型 (LLM) 的优势,实现了对化学图像和文本的全面推理。可以看到模型针对图像准确描述了图像的内容是黄色的液氮罐,接着我们可以继续问它一个问题,比如我们输入「液氮的化学分子式是什么」。平台会自动选择合适的算力资源和镜像版本,这里使用的是英伟达 A100的算力和

文章图片
#语言模型#人工智能#自然语言处理 +2
强势超越 Llama3? Gemma2 中文版谷歌开源大模型 Gemma2-9B-Chinese-Chat 教程来了

进入 OpenBayes 平台后,打开「公共教程」,找到「一键部署 Gemma-2-9B-Chinese-Chat」的教程。比如我们输入「我的蓝牙耳机坏了,我该去看牙科还是耳鼻喉科」,它给我们的回答非常合理,中文理解能力非常优秀。Temperature 可以改变模型输出的随机性,Temperature 的值越大,模型的输出越随机;等待系统分配资源完成后,将鼠标悬停在「API 地址」处,点击上方链接

文章图片
#人工智能#语言模型#机器学习 +3
更高效!更准确!YOLOE 实现实时目标检测

在「Visual Type」一栏中选择视觉类型,在「Intra/Cross Image」一栏中选择模式,在「Model」一栏中选择好模型并设置好参数后,点击「Detect & Segment Objects」开始检测。masks:例如上传一个包含很多人的图像,想检测人的图像,使用 masks 将一个人涂抹,推理时模型就会根据 masks 的内容识别图像中所有的人。待系统分配好资源,当状态变为「运行

文章图片
#目标检测#目标跟踪#人工智能 +2
语音转文字神器!Whisper 可实现实时转录,打工人必备!

平台会自动为容器选配合适的算力资源和镜像版本,这里使用的是英伟达 RTX 4090 的算力资源和 PyTorch 的镜像,别忘了使用文章开头的邀请链接,get 免费时长!选择好后,点击「下一步:审核」即可。系统分配资源完成后,待状态显示为「运行中」后,将鼠标悬停在 API 地址处,点击链接进入模型。登录到 OpenBayes 平台后,打开「公共教程」,找到「Whisper Web 在线语音识别工具

文章图片
#深度学习#人工智能#语言模型 +3
更高效的多模态推理能力,Kimi-VL 一键部署教程!

Kimi-VL 项目是 Kimi Team 于 2025 年 4 月发布的大语言模型,这是一种高效的开源专家混合 (MoE) 视觉语言模型 (VLM),可提供高级多模态推理、长上下文理解和强大的代理功能。

文章图片
#人工智能#深度学习#机器学习
【用嘴 P 图神器!】一键部署 In-Context Edit,高效完成图像编辑

与以前的方法相比,ICEdit 只有 1% 的可训练参数(200 M)和 0.1% 的训练数据(50 k),表现出强大的泛化能力,能够处理各种编辑任务。上传一张 Labubu 首领 Zimomo 的图片,输入 prompt 「put a pair of sunglasses on Labubu」后点击「Run」,可以看到它快速生成了一张带着墨镜的 Labubu。点击「继续执行」,等待分配资源。首先

文章图片
#人工智能#机器学习#深度学习
助力解析化学图像生成文本分析,化学大语言模型 ChemVLM 来啦!

该模型旨在解决化学图像理解与文本分析之间的不兼容问题,通过结合视觉 Transformer (ViT)、多层感知机 (MLP) 和大型语言模型 (LLM) 的优势,实现了对化学图像和文本的全面推理。可以看到模型针对图像准确描述了图像的内容是黄色的液氮罐,接着我们可以继续问它一个问题,比如我们输入「液氮的化学分子式是什么」。平台会自动选择合适的算力资源和镜像版本,这里使用的是英伟达 A100的算力和

文章图片
#语言模型#人工智能#自然语言处理 +2
单卡 4090 即可启动,一键部署 QwQ-32B-AWQ 教程

选择「NVIDIA GeForce RTX 4090」以及「vLLM」镜像,OpenBayes 平台上线了新的计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。稍等片刻,待系统分配好资源,当状态变为「运行中」后,点击「API 地址」边上的跳转箭头,即可跳转至 Demo 页面。并且相比传统指令调优模型,QwQ 具备思考和推理能力。,在「公共教程」页面,选择键部署 「一键

文章图片
#人工智能#机器学习#深度学习 +1
    共 42 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择