logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

腾讯Hunyuan-7B-AWQ-Int4开源:大模型部署进入“轻量高效“新纪元

2025年11月27日,腾讯正式向全球开发者开源Hunyuan-7B-Instruct-AWQ-Int4大语言模型,通过前沿的AWQ INT4量化技术、256K超长上下文窗口与创新的混合推理模式,构建起从边缘终端到云端服务器的全场景AI部署体系。该模型在保持79.82 MMLU知识测试分数和88.25 GSM8K数学推理准确率的同时,将算力需求降低75%,为企业级AI应用提供了兼顾性能、成本与隐

开源盘古 Ultra-MoE-718B 开源协议:模型使用许可条款

在人工智能技术快速发展的今天,开源大语言模型正在推动整个行业的创新与进步。openPangu-Ultra-MoE-718B 作为华为昇腾原生训练的超大规模混合专家语言模型,其开源协议的设计既体现了技术开放的决心,也包含了必要的使用规范。本文将深入解析 OPENPANGU MODEL LICENSE AGREEMENT VERSION 1.0 的核心条款,帮助开发者、研究者和企业用户全面理解这一重要

openPangu-Embedded-1B:模型权重安全

在人工智能模型部署的整个生命周期中,模型权重安全(Model Weight Security)是确保模型完整性、防止恶意篡改和保护知识产权的重要环节。openPangu-Embedded-1B作为昇腾原生的开源大语言模型,在权重安全方面提供了全面的解决方案。本文将深入探讨该模型在权重完整性校验、安全分发、部署验证等方面的最佳实践。## 模型权重完整性校验### SHA-256哈希校验机制...

突破内存瓶颈:Linux内核zram压缩算法配置与性能优化全指南

你是否曾遇到服务器内存不足导致应用崩溃?还在为频繁的磁盘交换影响系统响应速度而烦恼?本文将带你深入了解Linux内核中**zram(压缩内存块设备)** 这一革命性技术,通过合理配置`CONFIG_ZRAM_COMPRESSOR`选项,无需硬件升级即可显著提升系统内存利用率。读完本文,你将掌握zram的编译配置、压缩算法选择、性能调优全流程,让你的Linux系统在有限内存下焕发新生。## zr..

PostgreSQL pgvector扩展完整安装与实战指南:从零开始构建AI向量数据库

在人工智能和机器学习应用蓬勃发展的今天,向量相似性搜索已成为现代数据库系统的核心需求。pgvector作为PostgreSQL的开源扩展,将高性能向量搜索能力无缝集成到您熟悉的关系数据库中。本文专为PostgreSQL开发者和AI应用工程师设计,提供从基础安装到高级应用的完整解决方案。## 🔍 常见安装陷阱与避坑指南### Windows环境典型错误解析许多开发者在Windows平台

【亲测免费】 ComfyUI-Custom-Scripts 项目常见问题解决方案

ComfyUI-Custom-Scripts 是一个针对 ComfyUI 的扩展项目,主要提供了多种增强和实验性的功能,这些功能主要集中在用户界面(UI)的改进上。该项目可以帮助用户更高效地使用 ComfyUI,通过添加自动完成、图形自动排列、总是吸附到网格等特性来提升用户体验。项目的主要编程语言为 Python,同时可能涉及到 JavaScript 用于前端部分的开发。## 2. 新手常见问..

【免费下载】 Chroma向量数据库查询与获取数据完全指南

Chroma作为一款开源的向量数据库,提供了灵活高效的数据查询和获取功能。本文将深入解析Chroma集合(Collection)的查询(query)和获取(get)操作,帮助开发者充分利用其强大的检索能力。## 核心查询方法### 基于向量查询最基本的查询方式是通过`.query`方法传入查询向量:```pythoncollection.query(query_embe...

RAGFlow开发文档:架构设计、模块划分、接口定义

RAGFlow是一个基于深度文档理解的开源RAG(检索增强生成)引擎,其核心架构围绕检索增强生成技术构建,融合了深度文档理解、智能文本切片、多源数据融合等关键技术。系统采用模块化设计,确保各组件间低耦合高内聚,支持从个人应用到企业级部署的全场景需求。### 1.1 整体架构图![RAGFlow系统架构](https://github.com/infiniflow/ragflow/asset

ComfyUI Manager自定义节点列表获取失败问题分析与解决方案

在使用ComfyUI Manager管理自定义节点时,部分用户遇到了无法获取节点列表的问题。系统会抛出KeyError: 'favorites'错误,导致无法正常显示和更新自定义节点。这个问题主要出现在Linux系统环境中,特别是使用较新Python版本(如3.12)的情况下。## 错误分析从错误堆栈可以看出,问题发生在Manager尝试处理节点收藏列表时。核心错误表明系统无法从返回的JS...

verl训练引擎对比:FSDP vs Megatron性能分析

verl(Volcano Engine Reinforcement Learning)作为字节跳动Seed团队开源的强化学习训练库,为大语言模型(LLM)提供了灵活高效的训练框架。在verl中,FSDP(Fully Sharded Data Parallel)和Megatron-LM是两种核心的训练后端引擎,各自具有不同的性能特点和适用场景。本文将深入分析FSDP和Megatron在verl中..

    共 65 条
  • 1
  • 2
  • 3
  • 7
  • 请选择