
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
Code Llama 是一组预训练和微调的生成文本模型,其规模从 7 亿到 34 亿个参数不等,他支持很多种编程语言,包括 Python, C++, Java, PHP, Typescript (Javascript), C#, Bash 等等。具备代码续写、

DeepSeek Coder V2系列基于Deepseek-V2改进而来,有16B和236B两个版本。

多模态模型GLM-4-Voice具备情感理解能力,能够模拟不同的情绪和语调,如高兴、悲伤、生气、害怕等,实现情感表达和共鸣,能识别中国各地方言,如粤语、重庆话、北京话等直接输出语音。

GLM-4V-9B 具备 1120 * 1120 高分辨率下的中英双语多轮对话能力,在中英文综合能力、感知推理、文字识别、图表理解等多方面多模态评测中,GLM-4V-9B 表现出超越 GPT-4-turbo-2024-04-09、Gemini 1.0 Pro、Qwen-VL-Max 和 Claude 3 Opus 的卓越性能。

本文主要介绍如何解决NVIDIA nvlink gpu卡使用nvidia-smi nvlink -s命令查看NVlink链路状态都是显示未激活状态

使用IB驱动自带的工具对mellanox&nvidia IB网络进行基准测试

核心矛盾:SSH服务需要Root权限绑定22端口,而生产环境要求使用非Root用户运行服务
在英伟达市值猛涨、各家科技巨头囤芯片的热潮中,我们往往会忽视GPU芯片是如何转变为数据中心算力的。最近,一篇SemiAnalysis的技术文章就深入解读了10万卡H100集群的构建过程。

在英伟达市值猛涨、各家科技巨头囤芯片的热潮中,我们往往会忽视GPU芯片是如何转变为数据中心算力的。最近,一篇SemiAnalysis的技术文章就深入解读了10万卡H100集群的构建过程。

参数精简,性能不减,以1/21小参数媲美DeepSeek R1 6710亿参数的性能,成本仅1/10。








