logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

多类别异常检测新SOTA-MVMCAD

这篇论文提出了一种用于多视角多类别异常检测 (MVMCAD) 的模型,旨在解决现有模型在多视角场景下建模不同视角之间关系和互补信息不足的问题。该模型通过整合来自多个视角的信息来准确识别异常。

文章图片
#计算机视觉#人工智能#目标检测 +1
好用的标注工具和标注数据处理代码

一. 标注工具1.Labelme(官网链接)windows环境:首先安装Anaconda,Python3+版本。安装成功后,打开Anaconda Prompt,然后依次输入以下命令。# python3conda create --name=labelme python=3.6 #创建虚拟环境conda activate labelme #激活虚拟环境pip install pyqt5# pyqt5

文章图片
#人工智能#目标检测#python +1
阿里发布一系列新模型,Qwen3-Omni强势对标Gemini

阿里巴巴发布多模态大模型Qwen3-Omni,对标谷歌Gemini,支持文本、图像、音频和视频的统一处理。同时推出升级版图像编辑模型Qwen-Image-Edit-2509,增强多图编辑和一致性;以及高效文本转语音模型Qwen3-TTS-Flash,支持多语言、多方言和丰富音色,在多项测试中达到SOTA性能。这些新模型彰显了阿里在AI领域加速技术迭代、争夺全球领导地位的决心。

文章图片
#人工智能#科技#算法 +1
清华最新发布114页大型推理模型的强化学习综述

本文综述了强化学习在提升大型语言模型(LLMs)为大型推理模型(LRMs)能力中的最新进展与挑战,回顾了以 OpenAI o1 和 DeepSeek‑R1 为代表的里程碑,强调通过 train‑time RL 与 test‑time compute 可放大长链推理能力

文章图片
#人工智能#算法#语言模型 +1
超越OpenAI CodeX的软件工程智能体:Jules

谷歌I/O大会发布的产品Jules:软件工程智能体,OpenAI CodeX的竞品。能按需求写代码、改bug,关联Github仓库,在云端自动执行任务,不需要人工介入,只需要查看日志就能知道做了哪些任务。

文章图片
#人工智能#语言模型#python +1
深入openai的发展历程,发现惊人细节

ChatGPT 是历史上增长最快的消费软件应用程序。从它的卑微起步到成为科技领域的革命性力量,我们将追溯它的历程和里程碑。

文章图片
#人工智能#团队开发
利用多模态大型语言模型实现零样本异常检测与推理

摘要: Anomaly-OV创新性地将视觉推理能力引入零样本异常检测领域,通过构建多模态知识库和推理框架,实现对未知异常的精准识别。该方法突破了传统模型依赖已知异常数据的局限,增强了检测系统的泛化能力,为工业质检等场景提供了更智能的解决方案。文章详细解析了其技术原理、创新点及应用价值。

文章图片
#人工智能#论文阅读#算法
如何利用python向excel表格里插入图片xlsxwriter实现

如何利用python向excel表格里插入图片xlsxwriter实现

#python#信息可视化
近期国内外AI大事

腾讯混元发布了最新生图模型‘混元图像2.1(HunyuanImage2.1)’,支持原生[2K分辨率]图像生成,具备强大的复杂语义理解和跨领域泛化能力,同时支持中英文输入和高质量文本生成。该模型已在Hugging Face和GitHub上开源,为视觉创作者提供了更高效的创作工具,并为未来[多模态图像生成]模型的研发奠定了基础。支持原生2K分辨率,提升图像生成质量与效率。具备强大的复杂语义理解能力,

文章图片
#人工智能#算法#论文阅读
复现论文有妙招,找代码有神器

这些工具帮助你更好的理解论文,复现论文代码

文章图片
#人工智能#深度学习#目标检测 +1
    共 57 条
  • 1
  • 2
  • 3
  • 6
  • 请选择