
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
Qwen-Image-2.0:图像生成模型正在从“会出图”走向“能交付复杂视觉任务”

ERNIE-Image:开源文生图正在从“会画图”走向“能交付视觉内容”

Rocky Ding基于五年AI行业经验,深度分析2025-2026年AIGC领域的关键变革。

《Seedream 4.0:多模态图像生成系统的工业级实践》 本文介绍了Seedream 4.0这一工业级AIGC图像生成系统的技术突破。该系统通过高效DiT架构和高压缩VAE降低高分辨率生成成本,结合细粒度数据治理提升知识型内容生成能力。采用多阶段后训练(CT/SFT/RLHF)和VLM驱动的Prompt Engineering,使系统具备文生图、图像编辑、多图参考等复合功能。通过对抗蒸馏、量化

Wider face数据集地址Widerface数据集是一个人脸检测的主流数据集。里面有32203张人脸图像,393703个标注人脸,且各类场景十分复杂。为了深入分析各类误检,作者还对每个人脸bbox还标注了多属性:遮挡、姿态、事件等,可以全方位多角度的评估算法的性能。wider face可以划分为60类事件,每类事件中的图像按照:训练 / 验证 / 测试:40% / 10% / 50%的比例划分
HDF5数据格式介绍HDF 是用于存储和分发科学数据的一种自我描述、多对象文件格式,是一种存储相同类型数值的大数组的机制。HDF 是由美国国家超级计算应用中心(NCSA)创建的,以满足不同群体的科学家在不同工程项目领域之需要。HDF 可以表示出科学数据存储和分布的许多必要条件。HDF 被设计为:自述性:对于一个HDF 文件里的每一个数据对象,有关于该数据的综合信息(元数据)。在没有任何外部信息的情
一般在深层神经网络中,我们需要预防梯度爆炸和梯度消失的情况。梯度消失(gradient vanishing problem)和梯度爆炸(gradient exploding problem)一般随着网络层数的增加会变得越来越明显。例如下面所示的含有三个隐藏层的神经网络,梯度消失问题发生时,接近输出层的hiden layer3的权重更新比较正常,但是前面的hidden layer1的权重更新会变得很
nohup和&组合使用nohup python file.py > filelog.txt 2>&1 &上述代码的组合使用就能够避免终端关闭、服务器断开等情况导致的模型训练终止。参数解释:filelog.txt:> 表示把标准输出(STDOUT)重定向到这个文件,这里重定向到了当前目录下的filelog.txt里,若没有此文件会自动生成。若没有特别指定,默
一.Cascade CNN的框架结构级联结构中有6个CNN,3个CNN用于人脸非人脸二分类,另外3个CNN用于人脸区域的边框校正。给定一幅图像,12-net密集扫描整幅图片,拒绝90%以上的窗口。剩余的窗口输入到12-calibration-net中调整大小和位置,以接近真实目标。接着输入到NMS中,消除高度重叠窗口。二.Cascade CNN人脸校验模块原理该网络用于窗口校正,使用三个偏...
匹配数据的图像转换Pix2Pix在图像到图像的转换这个领域中有很好的应用,它能够面向所有匹配图像数据集的训练和生成。匹配数据集是指在训练集中两个互相转换的领域之间有很明确的一一对应数据。比如下面的三个例子:在工程实践中研究者需要自己收集这些匹配数据,但有时同时采集两个不同领域的匹配数据是非常麻烦的,通常采用的方案是从更完整的数据中还原简单数据。有了匹配数据集的存在,深度学习领域的研究...







