logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

从 Louvain 到 Leiden:保证社区连通性的社区检测算法研究解读

本文分析了社区检测中的Louvain算法及其改进版Leiden算法。首先介绍了两种常用的社区质量评估函数:模块度(Modularity)和恒定波茨模型(CPM),解释了它们的数学定义和物理意义。重点指出了模块度存在分辨率限制问题,而CPM通过独立于网络规模的参考基准避免了这一问题。然后详细阐述了Louvain算法的两阶段迭代流程,并揭示其存在社区连通性差的核心缺陷。最后介绍了Leiden算法的改进

#算法
基于DeepAgents轻松构建AI Coding Agent

本文介绍了基于DeepAgents框架开发的AI编码助手deep-code-agent,该项目通过模块化子智能体系统提供代码审查、测试生成、文档生成、调试和重构等一站式开发服务。文章详细解析了项目的五大核心功能、技术架构和扩展设计,并提供了快速安装配置指南。该项目利用LangChain和LangGraph实现智能工作流,支持OpenAI和自定义模型,可直接操作本地代码库。作者强调使用前需备份代码并

#人工智能#AI
火山引擎火山方舟平台微调SFT——赋予通用大模型深度思考能力

本文介绍如何使用火山引擎上的火山方舟平台对大模型进行微调,使大模型能够服务于特定的场景。这里主要演示了使用长 CoT 的推理数据对 doubao-lite-32k 进行监督微调(SFT),以使 doubao-lite 大模型具备类似 DeepSeek-R1 的深度思考和推理能力。

#火山引擎#人工智能#DeepSeek
大模型监督微调SFT训练代码

一个简单的大模型监督微调SFT训练代码,可用于快速验证设备环境、大致效果、体验大模型SFT等。

#人工智能
AI计算引擎:Ray

Ray是一个开源的AI计算引擎和统一框架,由UC Berkeley RISELab开发,用于构建和扩展机器学习与Python应用。其核心组件包括Ray Core(提供任务、参与者和对象存储等分布式原语)、Ray Data(数据处理)、Ray Train(分布式训练)、Ray Tune(超参数调优)、Ray Serve(模型服务)和Ray RLlib(强化学习)。Ray Core通过@ray.rem

#人工智能
聊聊在大模型RLHF中的PPO算法的奖励

本文探讨了在RLHF训练大模型时,PPO算法中奖励信号的关键作用及其传递机制。核心要点包括:1)PPO使用截断替代目标函数,通过概率比率和优势估计优化策略;2)采用广义优势估计(GAE)将序列级奖励(如0/1)转化为token级奖励,具体方法是将全部奖励放在最后一个有效token上;3)GAE通过反向递推将最终奖励信号传播到整个序列,利用价值函数差异和信用分配机制,使中间token即使即时奖励为0

#算法#人工智能
本地运行LangChain Agent用于开发调试

本文介绍了如何基于LangChain 1.0和DeepAgents构建功能强大的Coding Agent,并详细说明了本地测试和调试的方法。主要内容包括:1) 项目环境准备和配置;2) 创建调试Agent;3) 配置LangGraph文件;4) 启动API服务器;5) 通过Chat UI进行交互。文章还提供了一个使用deep-code-agent完成编码任务的示例,展示了从环境搭建到实际应用的全流

Agent调试的痛点

Agent 调试的痛点:核心矛盾在于Agent的智能本质是非确定性的,开发者需在“智能”与可控性间权衡——优先确保可追溯、可中断的工程底线,而非追求全自动。短期内,调试仍是开发者最大挑战。

#人工智能
基于DeepAgents轻松构建AI Coding Agent

本文介绍了基于DeepAgents框架开发的AI编码助手deep-code-agent,该项目通过模块化子智能体系统提供代码审查、测试生成、文档生成、调试和重构等一站式开发服务。文章详细解析了项目的五大核心功能、技术架构和扩展设计,并提供了快速安装配置指南。该项目利用LangChain和LangGraph实现智能工作流,支持OpenAI和自定义模型,可直接操作本地代码库。作者强调使用前需备份代码并

#人工智能#AI
深度学习开发环境搭建

使用anaconda+jupyter搭建深度学习开发环境,可以很方便地创建不同的python虚拟环境,也可以随时切换,提高开发的效率和便利性

文章图片
#深度学习#python#jupyter
    共 29 条
  • 1
  • 2
  • 3
  • 请选择