logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

腾讯混元4B大模型重磅开源:重新定义轻量化AI的性能边界

近日,腾讯正式宣布开源混元大语言模型Hunyuan-4B预训练版本,这一突破性进展不仅填补了国内轻量化大模型在高性能部署领域的技术空白,更通过创新的架构设计与推理机制,为AI开发者提供了兼具强大算力与灵活适配性的基础模型。作为腾讯混元大模型体系的重要成员,Hunyuan-4B以其独特的技术优势,正在重塑从边缘计算到云端服务的全场景AI应用生态。在模型性能维度,Hunyuan-4B展现出令人瞩目

openPangu-Embedded-1B:1536隐藏维度的技术优势

openPangu-Embedded-1B:1536隐藏维度的技术优势【免费下载链接】openPangu-Embedded-1B-model昇腾原生的开源盘古 Embedded-1B 语言模型项目地址: https://ai...

腾讯混元1.8B-FP8轻量化模型发布:边缘智能进入"大模型普及时代"

腾讯正式开源混元大模型系列新成员Hunyuan-1.8B-Instruct-FP8,通过FP8量化技术实现50%显存占用降低与30%推理加速,同时将性能损失控制在2%以内,标志着大模型在边缘设备的规模化应用迎来关键突破。## 行业现状:边缘智能的"算力困境"与破局需求2025年全球边缘人工智能市场规模预计达358.1亿美元,2032年将突破2698亿美元,年复合增长率高达33.3%。然而...

Transitions-Everywhere自定义插值器:打造独特的动画时间曲线

想要为你的Android应用添加更自然、更流畅的动画效果吗?Transitions-Everywhere项目提供了强大的自定义插值器功能,让你能够轻松控制动画的时间曲线,创造出令人惊艳的用户体验。🎯## 什么是插值器?插值器(Interpolator)是Android动画系统中控制动画执行时间曲线的关键组件。它决定了动画在时间轴上的变化速率——是匀速、加速、减速,还是其他复杂的运动模式。

Godot对话管理器(nathanhoad/godot_dialogue_manager)使用指南

在游戏开发中,对话系统是RPG、视觉小说等类型游戏的核心组件之一。Godot对话管理器是一个功能强大的对话系统解决方案,它提供了灵活的对话资源管理、文本渲染和交互控制功能。本文将深入介绍如何使用该工具在Godot中实现专业的对话系统。## 基础使用### 快速启动对话最简单的对话显示方式是调用`DialogueManager.show_dialogue_balloon`方法:```...

突破边缘算力瓶颈:Candle框架的移动端与嵌入式部署实战指南

你是否还在为移动端AI模型部署时的性能瓶颈而困扰?当服务器级模型遇上资源受限的边缘设备,如何在保持精度的同时实现毫秒级响应?本文将带你探索Candle框架如何通过轻量化设计、量化技术和WebAssembly(WASM)支持,让AI模型在手机、嵌入式设备上高效运行,读完你将掌握:- 移动端部署的三大核心挑战及Candle的应对方案- 量化模型从训练到部署的完整流程(附代码示例)- 基于WAS...

终极指南:如何快速免费导出飞书文档到本地电脑

还在为迁移飞书文档而烦恼吗?feishu-doc-export 开源工具帮你解决所有痛点,只需简单配置就能将飞书知识库文档一键导出为Markdown、DOCX或PDF格式,完美保留原目录结构。## 🎯 为什么你需要这个工具?| 传统方法的问题 | feishu-doc-export 解决方案 ||---------------|-------------------------||

革命性AI交互平台ag-ui:多语言SDK集成指南

你还在为不同AI框架间的交互兼容性发愁?还在为多平台Agent应用开发重复构建?ag-ui作为开源的Agent-User交互协议,通过统一的事件驱动架构,让AI Agent与用户界面的通信变得前所未有的简单。本文将带你快速掌握ag-ui多语言SDK的集成方法,无论你使用TypeScript、Python、Java还是Go,都能轻松构建跨平台的智能应用。## 为什么选择ag-ui?ag-ui...

突破边缘算力瓶颈:Candle框架的移动端与嵌入式部署实战指南

你是否还在为移动端AI模型部署时的性能瓶颈而困扰?当服务器级模型遇上资源受限的边缘设备,如何在保持精度的同时实现毫秒级响应?本文将带你探索Candle框架如何通过轻量化设计、量化技术和WebAssembly(WASM)支持,让AI模型在手机、嵌入式设备上高效运行,读完你将掌握:- 移动端部署的三大核心挑战及Candle的应对方案- 量化模型从训练到部署的完整流程(附代码示例)- 基于WAS...

双模式推理革命:Qwen3-32B-GGUF如何重塑企业AI部署范式

阿里巴巴通义千问团队推出的Qwen3-32B-GGUF模型,以328亿参数规模实现"思考/非思考双模式"动态切换,将企业AI部署成本压缩60%,重新定义了大模型行业的效率标准。## 行业现状:从算力困局到效率竞赛2025年企业级大模型应用正面临严峻的"性能-成本"两难。沙利文《中国GenAI市场洞察》显示,尽管中国企业级大模型日均调用量已突破10万亿tokens,但60%企业因算力成本问题被

    共 69 条
  • 1
  • 2
  • 3
  • 7
  • 请选择