logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

国产模型DeepSeek-V3.1-Terminus实测:蓝耘API+CherryStudio组合下的‘推理风暴

DeepSeek-V3.1-Terminus在蓝耘API与CherryStudio的协同催化下,展现出颠覆性的推理效能。实测数据显示,其在保持顶尖精度的同时,将吞吐量推升至新高度,为工业级AI应用提供了可扩展的推理解决方案。随着国产算力生态的成熟,"推理风暴"将席卷更多应用场景,推动智能计算进入新纪元。技术启示:软硬件协同设计将成为大模型落地的核心范式,终端推理效能优化比单纯追求参数量更具实际价值

‌远程调试:Chrome DevTools Protocol 实现

Chrome DevTools Protocol (CDP) 是 Chrome 提供的基于 WebSocket 的调试协议,支持远程控制浏览器行为。

#chrome devtools#前端#chrome
‌FPGA 设计调试利器:Vivado ILA 的高级触发模式配置

Vivado ILA 是一种硬件逻辑分析器,嵌入在 FPGA 设计中,通过 JTAG 或 Ethernet 接口与主机通信。它支持实时信号捕获,帮助诊断时序问题、逻辑错误等。基本触发模式(如简单比较)适用于简单场景,但当设计复杂时,高级触发模式(如序列触发或事件触发)必不可少。它们能减少误触发,提高调试精度。

#fpga开发
‌LoRA微调OpenAI Whisper:PEFT技术在中文语音识别中的实践

LoRA是一种参数高效的微调方法,它通过添加低秩矩阵来适应预训练模型的权重,而不改变原始参数。这减少了计算开销和内存需求。核心公式如下: $$ W' = W + \Delta W $$ 其中 $\Delta W = BA^T$,$B$ 和 $A$ 是低秩矩阵(秩 $r \ll \text{min}(d, k)$),$W$ 是原始权重矩阵,$W'$ 是适应后权重。

#语音识别#xcode
Spring AI 1.0 GA 核心架构:Java生态的智能引擎如何重构

Spring AI 1.0 GA 的核心架构通过模块化设计和标准化接口,为 Java 生态构建了可扩展的智能引擎。

#java#spring#人工智能
‌Stable Diffusion部署:AWS、Azure、GCP的GPU资源利用率对比‌

Stable Diffusion是一种基于扩散模型的文本到图像生成AI模型,部署时需要高性能GPU来处理计算密集型任务。GPU资源利用率是衡量计算效率的关键指标,它直接影响推理速度、成本和扩展性。利用率通常定义为GPU实际用于计算的时间比例,计算公式为:$ \text{利用率} = \frac{T_{\text{compute}}}{T_{\text{total}}} \times 100% $,

到底了