
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
在当今快速发展的技术浪潮中,AI 辅助开发已经成为开发者不可或缺的助手。而随着 Kimi K2 的发布,开发者们迎来了一个全新的、强大的开源智能体模型,它不仅拥有万亿参数的 MoE 结构,还在多个基准测试中达到了开源模型的 SOTA(State-of-the-Art)水平。今天,就让我们一起探索如何在 VSCode 中快速接入 Kimi K2,体验智能编程的极致丝滑。

基于UOS操作系统,利用DeepSeek构建个人本地知识库

注:海光vllm安装文件依赖numa库与python3.11版本不兼容,因此python选择3.10版本。uos-server-2500-vllm0.8.5-dtk25.04.1.tar(容器镜像包)曙光 X7850H0(256 核+ 8张A100+1.5T内存)注:上述文件除Python源码包外,其他包都需要自行到。
openEuler社区人才评定考试

在本地部署 DeepSeek R1 模型时,部分用户可能希望关闭模型的思考过程显示,以获得更简洁的输出结果。
注:海光vllm安装文件依赖numa库与python3.11版本不兼容,因此python选择3.10版本。uos-server-2500-vllm0.8.5-dtk25.04.1.tar(容器镜像包)曙光 X7850H0(256 核+ 8张A100+1.5T内存)注:上述文件除Python源码包外,其他包都需要自行到。
GGUF 格式的全名为(GPT-Generated Unified Format),提到 GGUF 就不得不提到它的前身 GGML(GPT-Generated Model Language)。GGML 是专门为了机器学习设计的张量库,最早可以追溯到 2022/10。其目的是为了有一个单文件共享的格式,并且易于在不同架构的 GPU 和 CPU 上进行推理。但在后续的开发中,遇到了灵活性不足、相容性及
Ollama设置拉取模型本地保存路径和监听端口。

本方案旨在通过整合nvitop、Prometheus和Grafana三大组件,构建一套完整的监控体系,实现对GPU状态和VLLM服务性能的实时监控与可视化展示。方案的核心优势在于全链路监控、高可扩展性和强大的可视化能力。通过nvitop实时监控GPU指标,Prometheus进行数据采集与存储,Grafana提供数据可视化与告警功能,能够有效提升系统运维效率,确保资源合理分配和系统稳定性。此外,方

在数字化时代,TTS(文本转语音)技术广泛应用于智能客服、有声阅读、教育培训和远程工作等领域。本文介绍了几款备受关注的TTS语音模型,包括实时直播数字人助手DH_live、快速本地化AI语音聊天软件voicechat2、加速语音转录的WhisperMedusa、端到端语音交互模型GLM-4-VOICE,以及其他如Spark-TTS、Kokoro、FishSpeechv1.5、xtts-v2、Sty








