logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

尝试在SCNet DCU异构环境启动文心大模型:vllm serve “unsloth/ERNIE-4.5-21B-A3B-Thinking-GGUF“ (未成功)

GGUF格式模型无法在vLLM中运行,主要原因是vLLM不支持该格式且缺少必要的配置文件。尝试下载ERNIE-4.5-21B模型并手动添加config.json仍失败,出现tokenizer加载错误。最终调试失败,问题可能源于模型格式不兼容或文件缺失。

#人工智能
(数据集)LLaMA Factory进行微调训练的时候,有哪些已经注册的数据集呢?

LLaMA‑Factory 是一个开源的 LLM 交互式微调与数据标注平台,内置支持多种数据集,涵盖指令微调、RLHF、对话生成等任务。官方提供的数据集包括 alpaca_gpt4、sharegpt、code_alpaca_gpt4 等,支持多语言、代码生成、医疗等专业领域。使用方式包括单数据集训练、多数据集混合训练以及自定义本地数据训练。推荐根据任务目标组合数据集,如通用对话选用 sharegp

#人工智能
这个可用于深度思考和复杂流程的国产AI工具:FlowDeer TreeAI tools for complex workflows and deep thoughts

官方提供了直接可用的软件包,直接就有Windows版的软件,同时还有Mac的版本。个人认为既然已经用Electron了,那么linux版应该也是比较容易编译出来的吧。相对来说,FlowDeer要比其它的AI助手复杂和难以使用。因为其它很多AI助手非常简单,就把自己的问题键入,然后等着AI大模型返回信息就行了。FlowDeer有任务树的概念,刚开始使用起来很头疼。但是用习惯了,应该会感叹其功能的强大

文章图片
#人工智能
完全从0开始,超低成本即可训练出仅为25.8M的超小语言模型MiniMind。

注意,启动的时候会问使用自动测试还是手动输入,也就是0或者1,测试下来Kaggele不支持notebook里交互输入,所以无法测试。在colab中,可以使用mkdir dataset创建目录,然后用%cd dataset进入目录,下载完成后,再用%cd ..退出到上级目录。Colab有一点不好,就是离开大约30分钟,这个环境就停了,所以其实并没有用Colab环境跑通这个预训练。总体这个项目非常棒,

文章图片
#语言模型#人工智能#自然语言处理
mayfly-go:web 版 linux、数据库等管理平台

mayfly-go是一款集Linux终端管理、数据库操作、Redis/Mongo管理及工单审批于一体的统一运维平台。支持Ubuntu手工部署(需下载安装包并执行启动脚本)和Docker部署两种方式。配置文件默认使用SQLite,也可配置MySQL。服务启动后默认监听18888端口(同时支持IPv4/IPv6),初始账号admin/admin123。文档中提到的常见问题包括:MySQL连接失败需检查

文章图片
#linux#数据库#运维
可视化机器学习实验全生命周期管理工具链wandb.ai

W&B Integration是Weights & Biases提供的ML实验管理工具链,主要功能包括:1)实验跟踪,实时记录训练指标并可视化对比;2)超参数优化,支持自动调参和参数分析;3)协作管理,提供模型注册和交互式报告。技术实现上兼容主流框架,通过wandb.log()注入指标,支持数据集版本追踪和结构化数据可视化。典型应用于LLM开发(跟踪提示工程效果)和工业模型迭代(自

文章图片
#人工智能
LLM API Gateway:使用Comate Spec Mode创建大模型调用中转服务器

摘要:本文档描述了一个本地大模型API网关(LLMAPIGateway)的开发方案,该网关基于Node.js+Express实现,旨在统一管理多个大模型供应商的API调用。系统包含配置管理、请求转发、响应处理等核心功能,支持OpenAI兼容格式,并提供健康检查、日志记录等辅助功能。文档详细列出了8个开发任务,涵盖从项目初始化到最终测试的全流程,并记录了开发过程中遇到的配置管理、API密钥处理等技术

#gateway#服务器#人工智能
MegaTTS3 目前效果最好的文本转语音模型 在openi启智社区平台部署实践

MegaTTS3是目前效果领先的文本转语音模型。本文详细介绍了在启智社区平台部署该模型的完整流程:从创建云脑任务、下载模型代码(支持GitHub和GitCode源)、通过HuggingFace或镜像站获取模型文件,到实际推理操作(包含参数调整技巧)。特别说明了如何使用自己的语音文件(需上传WAV至指定链接获取对应NPY文件),并解决了常见的ffprobe报错问题。实测显示模型能精准模拟不同口音,生

文章图片
#人工智能
一个超小型llm 大模型smollm:135m

这是 Hugging Face 提供的一系列高效、轻量级的 AI 模型。其目标是创建功能强大而紧凑的文本和视觉模型,这些模型可以在端设备上有效运行,同时保持强大的性能。只有135m大小,用来做实验太合适了!想着以后用它作为测试分布式的模型。

#人工智能
在AIStudio飞桨星河社区一键部署DeepSeek-r1:70b模型

从创建页面可以看到,星河社区部署使用了Ollama部署DeepSeek,操作非常简单,就是点两次鼠标。尽管现在很容易就能用到各家的免费DeepSeek web或API服务,但是自己部署,完全自己可控的DeepSeek api服务,还是非常不错的。

文章图片
#人工智能
    共 590 条
  • 1
  • 2
  • 3
  • 59
  • 请选择