logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【AIGC行业前沿】2026年3月AIGC行业模型发布以及主要前沿资讯

近期AI领域迎来密集开源与模型更新潮。Cognition发布SWE-1.6预览版,性能提升11%;千问团队开源Qwen3.5系列四款小型模型;阶跃星辰开源Step 3.5 Flash及训练框架;小红书推出FireRed-OCR模型,文档处理准确率达92.94%。此外,通义实验室发布两款语音模型,IQuestLab开源代码模型系列,Jan团队推出轻量级编程助手Jan-Code-4B。OpenClaw

#AIGC
【YOLO】基于yolov5的Android版本目标检测app开发(部署安卓手机)

基于yolov5的Android版本目标检测app开发(部署安卓手机)1、开发环境搭建2、数据集准备3、模型训练4、模型转换5、Androidapp开发6、运行检测7、项目开发中遇到的问题总结

文章图片
#python#人工智能#pytorch +1
【多模态模型学习】从零手撕一个Vision Transformer(ViT)模型原理篇

ViT论文摘要: 本文提出Vision Transformer(ViT),首次将纯Transformer架构成功应用于大规模图像识别任务。传统CNN依赖局部卷积操作,难以建模图像全局依赖关系且计算效率受限。ViT创新性地将图像分割为16×16的块(Patch),线性映射为序列化Token后输入标准Transformer编码器。通过引入可学习的[CLS] Token和位置编码,ViT在ImageNe

文章图片
#transformer#深度学习#人工智能
【AIGC面试面经第七期】旋转位置编码RoPE:从 2D 到 nD 的完美扩展之旅

文章摘要: 该AIGC面试项目深入探讨了RoPE(旋转位置编码)的技术细节,对比了其与传统正余弦位置编码的优势。RoPE通过旋转变换显式编码相对位置,具备保模长、语义解耦和天然外推能力,成为大模型首选。文章解析了RoPE的base参数作用、高维扩展原理,并证实GPT-J与GPT-NeoX两种实现数学等价。同时指出传统位置编码在长度外推时存在严重的OOD问题,而RoPE通过几何旋转一致性有效规避分布

文章图片
#面试#AIGC#人工智能
到底了