面壁的熊猫个人主页

@weixin_44128977

面壁的熊猫

2023-05-04 11:18:03 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

嵌入式单元测试框架之Ceedling

CeedlingCeedling 是一个用 Ruby 语言编写的自动化测试框架，一个 C 项目构建系统，是对 Ruby Rake 的一个延申。Ceedling 主要目标是以测试为驱动的 C 语言开发，集成CMock、Unity、CException三个开源项目。1.环境搭建1.1 Ruby环境Windows下，我们使用官方的RubyInstaller安装Ruby环境。RubyInstaller A

#单元测试 #ruby

DeepSeek-V3.2-Exp浅析

DeepSeek-V3.2-Exp在V3.2-terminus基础上引入基于MQA的稀疏注意力(DSA)机制，显著降低训练和推理成本。该模型通过Lightning Indexer计算索引得分，使用ReLU减少吞吐量，并采用Top-k Selector选取关键token计算注意力。训练采用两阶段策略：预训练阶段包含密集预热和稀疏训练，后训练阶段结合专家蒸馏和混合强化学习，将推理、智能体和人类对齐训练

#DeepSeek #深度学习

cursor+cline+MCP（论文agent）

本文介绍了多款工具软件的安装配置方法。首先说明使用pip安装uv工具，并给出清华镜像源地址。然后介绍cursor、vscode和cline三款编辑器的安装方式。重点讲解了arXiv和Google Scholar两种MCP服务器的安装步骤，包括GitHub项目地址。最后详细展示了为cursor/cline配置MCP服务器的YAML文件示例，包含命令路径、运行参数和自动审批规则等关键配置项。全文提供了

#vscode

FreeRTOS

FreeRTOSFreeRTOS (Real Time Operating System)，一个迷你的、轻量级的实时操作系统内核。作为一个轻量级的实时操作系统，功能包括：任务管理时间管理信号量消息队列内存管理记录功能软件定时器协程（Corotuine）,又称微线程，纤程。协程不是进程或线程。其执行过程类似于子例程，亦或说是不带返回值的函数调用。一个程序可以包含多个线程、协程。类比线程，线程之间是相

强化学习概述

强化学习是一种通过agent与环境交互来最大化长期奖励的机器学习方法。其核心要素包括agent、环境、状态、动作和奖励机制。根据学习方式可分为on-policy和off-policy，根据模型可分为model-free和model-based。关键区别在于奖励函数反映即时收益，而价值函数（包括状态值函数和动作-状态值函数）衡量长期收益。贝尔曼方程为解决此问题提供了递归框架，其核心思想是将问题分解为

#学习

到底了