
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
AutoMorph 是一款基于深度学习的视网膜血管自动化分析工具,包含图像预处理、图像质量分级、解剖结构分割、血管形态特征测量四大模块,通过模型集成与置信度分析提升可靠性,在多组独立公开数据集上外部验证表现优异(如图像质量分级 F₁分数 0.86、视盘分割 F₁分数 0.94),且测量特征与专家标注一致性良好,可助力眼科及系统性疾病研究,推动眼组学领域发展。

OpenAI 官方最新发布技术报告《构建智能体 Agent 实用指南》,明确Agent 的核心特征在于独立执行工作流。报告定义了什么是 智能体,从模型选择、工具设计、指令编写,到复杂的编排模式和安全护栏,给出了具体建议。

本文介绍了零代码创建Coze智能体的完整流程:1)登录平台并创建智能体;2)编写提示词定义角色功能;3)配置模型参数和扩展技能;4)实时调试优化;5)发布到多平台使用。后续还将介绍插件工具等进阶功能,实现更复杂的任务自动化。

【动手学UNet】系列教程提供完整的UNet图像分割实现指南,包含7个核心模块:项目创建、数据加载、模型实现、训练、保存/加载、评估和主程序。主程序(main.py)作为统一入口,支持训练、评估和单图推理三种模式,可通过命令行参数灵活配置。训练支持断点续训和烟雾测试;评估可计算Dice/IoU指标并保存结果;单图推理支持原图/真值/预测的三连图展示。

本文详细解读 DeepSeek-V3.2 技术报告和 API 使用指南。DeepSeek-V3.2 新一代开源大型语言模型在推理能力和工具调用方面实现重大突破,模型已开源并更新至官方应用,为AI社区提供高性能开源选择。

介绍了 20 个红外与可见光数据集,包括 FLIR、SCUT、LLVIP、M3FD、KAIST、TNO、INO、MSRS、BUTIV、OTCBVS 等,涉及行人检测、人脸识别、车辆检测等多个应用场景,给出了下载链接和相关论文。

DINO-YOLO 提出了一种结合YOLOv12与DINOv3的创新混合架构。该模型通过双点特征注入策略(输入端P0和骨干网络P3层),有效解决了土木工程领域标注数据稀缺问题。

FLAIR,一个专用于视网膜眼底图像分析的视觉-语言基础模型。通过整合284,660张眼底图像和96种病理类别,FLAIR创新性地将专家知识以文本提示形式嵌入模型训练,包括病理细粒度特征描述和层级关系。实验表明,该模型在领域迁移和未知类别场景下展现出卓越的泛化能力,经轻量级微调后性能显著优于CLIP等通用模型及专用模型,为医学影像AI提供了专业化的基础模型解决方案。

本文介绍了【动手学UNet】系列教程中的模型训练部分,详细讲解了UNet图像分割模型的完整训练流程。内容包括训练脚本模块core/train_unet.py的功能实现,如数据加载、模型构建、损失计算和参数更新等关键环节。文章展示了如何通过测试程序验证训练链路的正确性,并介绍了训练过程中集成验证集评估、模型保存及TensorBoard日志记录等优化措施。

Kaiming He 发布论文【回归基础:让去噪生成模型来去噪】。本文提出,预测干净数据与预测含噪量存在本质区别。倡导直接预测干净数据的模型设计:这类模型能让看似容量不足的神经网络在极高维空间中高效工作。提出极简自包含模型 “JiT”,简化扩散模型的设计范式:完全基于标准视觉 Transformer(ViT),无分词器、无预训练、无额外损失。








