logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

边缘计算中的LLM推理:单板计算机性能优化与实践

大型语言模型(LLM)在边缘计算领域的应用正逐渐成为技术热点,特别是在资源受限的单板计算机(SBC)上实现高效推理。通过量化技术如q4_k_m方案,模型内存占用可大幅降低,使7B参数模型能在6GB内存设备上运行。实测显示,树莓派5和香橙派5 Pro等设备结合优化后的运行时如Llamafile,能实现15 tokens/s的生成速度。这些技术不仅解决了边缘设备计算能力有限的问题,还在智慧农业、医疗数

#边缘计算
MATLAB深度学习在Apple Silicon Mac上的性能跃升:从兼容到原生优化

深度学习训练依赖于高效的硬件加速,传统上CUDA与GPU的协同为模型训练提供了强大算力。其原理在于通过并行计算架构优化矩阵运算,显著提升训练速度。在移动与边缘计算场景中,能效与统一内存架构成为关键考量。Apple Silicon芯片通过Metal Performance Shaders(MPS)框架,为深度学习提供了原生加速支持。MATLAB通过深度集成MPS后端,实现了在Apple Silico

Ubuntu系统CUDA环境部署全攻略:从驱动安装到深度学习框架验证

CUDA作为NVIDIA推出的并行计算平台和编程模型,其核心原理在于利用GPU的大规模并行处理能力加速计算密集型任务。该技术通过CUDA Toolkit提供编译器、库和运行时环境,使开发者能够编写在GPU上执行的程序,从而在科学计算、深度学习等领域实现数十倍甚至上百倍的性能提升。在Ubuntu系统上部署CUDA环境时,需要重点关注NVIDIA驱动、CUDA Toolkit和系统环境三者的兼容性关系

Ubuntu系统安装深度指南:UEFI、LVM与安全基线实战

Linux操作系统安装不仅是基础操作,更是理解硬件抽象、存储架构与启动流程的关键入口。从UEFI固件信任链、GPT分区表到Secure Boot策略,再到LVM逻辑卷管理与zram交换机制,每一步都直接影响系统的稳定性、可维护性与安全性。掌握这些底层原理,有助于构建符合CIS合规要求的生产环境,支撑容器化开发、AI训练及云原生部署等现代应用场景。本文聚焦Ubuntu LTS版本(20.04–24.

Ubuntu 18.04深度学习驱动安装避坑指南:NVIDIA驱动与CUDA兼容性实战

GPU驱动是深度学习环境的基础支撑,其本质是内核模块、X Server图形栈与CUDA运行时三者协同工作的系统工程。理解驱动版本背后的兼容性锁链(内核ABI、Xorg ABI、CUDA Toolkit认证),远比盲目追求最新版更重要。尤其在Ubuntu 18.04等长期支持系统中,nvidia-driver-418这类‘稳定认证版’能同时满足内核5.4适配、GNOME 3.28图形加载及CUDA

Claude Cowork:macOS桌面AI代理实现文件自动化执行

AI代理(Agent)是当前人机协作的关键演进方向,其核心在于从‘对话推理’迈向‘感知-规划-执行’闭环。区别于传统聊天式AI或编程向代码助手,桌面AI代理依托本地文件系统直连、受控命令调用与多工具链协同能力,真正实现跨应用、多步骤、带容错的自动化操作。技术价值体现在打破上传限制、绕过上下文墙、降低非程序员使用门槛,并保障操作可审计、可中断、可回溯。典型应用场景包括下载目录智能归档、批量文档格式转

Claude Code终端工作流完全指南:从安装到CI/CD实战

CLI(命令行界面)是现代AI编程工具的核心载体,其本质是将大模型能力与操作系统运行时环境深度耦合的技术范式。理解终端作为上下文感知层、工具链调度协议和安全沙箱的三重角色,是掌握Claude Code等AI编码助手的前提。基于API调用、终端复用、npm安装陷阱及原生二进制分发等关键技术点,本指南系统解析环境适配、身份认证、多模型路由(如DeepSeek API接入)、故障诊断(如conpty异常

大语言模型如何革新游戏推荐系统:CPGRec+框架的平衡之道

推荐系统是现代数字平台的核心技术,其核心原理是通过分析用户历史行为和物品特征,预测用户偏好并进行个性化推荐。传统方法如协同过滤和矩阵分解,依赖“物以类聚、人以群分”的假设,但在处理游戏这类内容复杂、维度多元的物品时,往往难以捕捉用户深层、动态且看似矛盾的意图。大语言模型凭借其强大的语义理解与生成能力,为推荐系统带来了新的可能性。它能深度解析非结构化文本,将游戏描述、玩家评论转化为丰富的语义表示,从

鸿蒙开发选Java还是JS?从手机到手表,一文讲清不同设备支持的语言和SDK配置

本文深入探讨鸿蒙开发中Java与JS的选择策略,针对不同设备类型(手机、手表、车载等)提供语言和SDK配置建议。通过对比JavaScript和Java在内存占用、UI开发方式及硬件访问能力等维度的差异,帮助开发者根据项目需求做出最优决策。结合DevEco Studio开发环境,详解混合编程方案与性能优化技巧。

#DevEco Studio
ReactBench:评测多模态大模型拓扑推理能力的基准与实践

多模态大模型(MLLMs)的核心能力正从图像识别与描述,向更深层的结构化理解与逻辑推理演进。其原理在于模型需超越像素级感知,解析数据中隐含的实体关系与拓扑结构,进而应用领域规则进行推演。这一技术价值在于,它能将AI从“描述世界”的工具,升级为可辅助解决科学、工程领域复杂问题的“推理伙伴”。应用场景广泛覆盖化学、生物、电子等依赖图表(如分子结构图、电路图)进行知识表达与问题求解的垂直领域。本文聚焦的

    共 39 条
  • 1
  • 2
  • 3
  • 4
  • 请选择