logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Coggle数据科学 | 小白学大模型:Tongyi DeepResearch 系列Agent

本文介绍了多款智能体大语言模型的研发成果及技术突破,包括TongyiDeepResearch、WebWalker、WebDancer、WebSailor等。这些模型通过创新框架设计(如多智能体协作、动态规划等)和训练方法(如强化学习、数据合成管线),显著提升了网络信息检索、多模态推理和长程探索能力。其中WebWatcher引入视觉语言推理,WebResearcher提出迭代研究范式,WebWeav

文章图片
#人工智能#计算机视觉#transformer +1
Coggle数据科学 | 小白学大模型:Tongyi DeepResearch 系列Agent

本文介绍了多款智能体大语言模型的研发成果及技术突破,包括TongyiDeepResearch、WebWalker、WebDancer、WebSailor等。这些模型通过创新框架设计(如多智能体协作、动态规划等)和训练方法(如强化学习、数据合成管线),显著提升了网络信息检索、多模态推理和长程探索能力。其中WebWatcher引入视觉语言推理,WebResearcher提出迭代研究范式,WebWeav

文章图片
#人工智能#计算机视觉#transformer +1
AI生成未来 | 一步直接封神!单步扩散媲美250步教师模型!中科大&字节发布图像生成“分层蒸馏术”

本文提出分层蒸馏(HD)框架以解决单步扩散模型保真度问题。通过理论分析揭示了轨迹蒸馏(TD)在保留全局结构时会损失细节,因此设计了包含两阶段的方案:先利用TD注入结构先验,再通过分布匹配优化细节。创新性地提出自适应加权判别器(AWD),动态聚焦局部伪影指导优化。实验表明该方法在ImageNet256×256上取得FID 2.26,媲美250步教师模型,推理速度提升70倍。该工作为高效高保真单步生成

文章图片
#人工智能#计算机视觉#深度学习
刘聪NLP | 等了大半年的Qwen3-VL终于也开源了!附模型细节&实测!

本文来源公众号,仅用于学术分享,侵权删,干货满满。大家好,我是刘聪NLP。抓着云栖大会,猛开源是吧,两天时间,开源了Qwen3-Omni系列模型、Qwen-Image-Edit-2509模型、Qwen3-VL模型、Qwen3Guard-Gen系列模型,共计12个。还有一些没开源的API,比如Qwen-TTS、Qwen3-Coder-Plus、Qwen3-Max、Qwen3-LiveTranslat

#自然语言处理
python | stanza,一个超强的 Python 库!

Stanza是斯坦福大学开发的Python自然语言处理工具包,支持60多种语言文本分析。其核心优势在于高精度神经网络模型和统一API接口,提供分词、词性标注、命名实体识别、依存句法分析和情感分析等功能。安装简便,支持pip和conda安装,并可通过下载语言模型进行验证。该工具包采用模块化设计,提供预训练模型,同时支持自定义模型训练,适用于各类NLP研究与应用场景。

#python#开发语言#计算机视觉 +3
python | rich,一个无敌的 Python 库!

Rich库是一个功能强大且易于使用的工具,能够帮助开发者在命令行中创建美观和功能丰富的输出。通过支持丰富的文本样式、彩色输出、进度条、表格、日志和 Markdown 渲染,Rich提供了强大的功能和灵活的扩展能力。本文详细介绍了Rich库的安装方法、主要特性、基本和高级功能,以及实际应用场景。希望本文能帮助大家全面掌握Rich库的使用,并在实际项目中发挥其优势。无论是在构建命令行工具、实时监控任务

文章图片
#python#开发语言#人工智能 +3
我爱计算机视觉 | 2025 TPAMI综述 | 全新视角红外与可见光图像融合完整理解与入门!附GitHub最全开源对比方法结果!

红外与可见光图像融合,正站在从理论研究走向实际应用的关键十字路口。本综述不仅系统梳理了当前主流方法与数据集,也首次从“数据-融合-任务”的完整链路出发,搭建起了一个统一的研究框架。我们希望这份工作,能为研究者提供参考,为工程实践者带来启发,也为未来的发展方向提供一些思路。欢迎关注本文的 GitHub 项目,共同完善红外与可见光融合技术的知识地图!

文章图片
#计算机视觉#人工智能#transformer +3
码科智能 | 边缘设备也能跑SOTA实时物体检测模型?DINOv2预训练+DETR端到端的黄金组合,第一个超60AP的模型!

今天Roboflow就开源了SOTA 实时物体检测模型RF-DETR,其在现实世界数据集上的表现优于所有现有的物体检测模型,并且是第一个在 COCO 数据集上进行基准测试时达到 60+ 平均精度的实时模型。

#人工智能#目标检测#计算机视觉 +3
江大白 | 2025顶流目标检测模型评选,RF-DETR 碾压 YOLO,零样本检测模型到底选什么?

2025年目标检测技术取得显著突破,RF-DETR、YOLOv12等新型模型展现出卓越性能。RF-DETR采用DINOv2骨干网络,在COCO数据集上实现54.7%mAP且仅4.52ms延迟,同时在领域适应性测试中表现优异。YOLOv12引入注意力机制和优化结构,在精度与速度间取得平衡。零样本模型YOLO-World和GroundingDINO展现出灵活检测能力。文章通过五大标准评估模型性能,并对

文章图片
#目标检测#人工智能#计算机视觉
python | akshare,一个超强的 开源Python 金融数据接口库!

Python AkShare 是一个功能强大且灵活的金融数据获取工具,适合量化交易、金融研究和经济数据分析。它提供了丰富的 API,涵盖了股票、期货、基金、外汇和宏观经济数据等多个领域,帮助开发者快速获取所需的数据进行分析和决策。无论是实时数据获取还是历史数据回测,AkShare 都为金融数据分析提供了强有力的支持。

文章图片
#python#开发语言#金融 +4
    共 736 条
  • 1
  • 2
  • 3
  • 74
  • 请选择