logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型算法(七):计算机视觉

本文系统梳理了计算机视觉领域的核心算法与技术发展,分为基础理论、视觉任务和前沿方向三大部分。在基础理论方面,重点介绍了图像处理基础(采样、滤波、增强)、特征提取方法(SIFT及其变种)和3D视觉技术(点云处理、NeRF等)。视觉任务部分详细分析了图像识别(VGG、ResNet等经典网络)、目标检测(从R-CNN到YOLO系列)、图像分割(语义/实例/全景分割)和目标跟踪(单目标与多目标)等核心问题

文章图片
#计算机视觉#目标检测
运维云计算SRE-第2周

Shell 脚本和Linux 文件处理相关知识点总结

文章图片
#运维#云计算#linux
大模型开发(四):技术原理与行业实战

Agent介绍和 AI Agent平台、提示工程、Function Call

文章图片
大模型算法(八):多模态大模型

本文系统梳理了MLLM的发展历程,从单模态大模型(如LLM、LVM)到跨模态模型(如TTS、ASR),再到图文多模态大模型(如GPT-4V、Gemini)。重点分析了关键技术里程碑,包括视觉表征Token化(ViT)、图文联合建模(VisualBERT)、大规模对齐(CLIP)以及生成式突破(Stable Diffusion)。文章还详细介绍了多模态模型在数字人生成、语音合成、视觉问答等场景的应用

文章图片
大模型开发(八):分布式计算框架

本文系统介绍了大数据处理框架Hadoop、Spark和Flink的核心技术与应用。首先详细讲解了Hadoop的分布式架构、核心组件(HDFS/YARN/MapReduce)及其生态体系,包括集群搭建、元数据管理机制和安全模式等关键特性。随后重点阐述了Spark的RDD编程模型和批流一体处理能力,深入分析了其分布式计算原理。最后全面介绍了Flink的批流统一API、多种数据源连接器(如Kafka/J

文章图片
大模型算法(七):计算机视觉

本文系统梳理了计算机视觉领域的核心算法与技术发展,分为基础理论、视觉任务和前沿方向三大部分。在基础理论方面,重点介绍了图像处理基础(采样、滤波、增强)、特征提取方法(SIFT及其变种)和3D视觉技术(点云处理、NeRF等)。视觉任务部分详细分析了图像识别(VGG、ResNet等经典网络)、目标检测(从R-CNN到YOLO系列)、图像分割(语义/实例/全景分割)和目标跟踪(单目标与多目标)等核心问题

文章图片
#计算机视觉#目标检测
大模型算法(六):强化学习

1、强化学习基础2、策略优化算法3、RLHF4、综合实践。

大模型算法(四):自然语言处理

1、深度学习处理文本。3、自然语言处理问题。

文章图片
#自然语言处理#语言模型
大模型算法(七):计算机视觉

首次将 CNN 引入目标检测,打破传统手工特征(HOG/SIFT)的局限。先通过 ** 选择性搜索(Selective Search)** 生成约 2000 个候选区域,再将每个候选区域缩放至固定尺寸,输入 AlexNet 提取特征,最后用 SVM 做分类、线性回归做边框修正。相比传统方法,检测精度提升超 50%,奠定了两阶段检测 “

文章图片
#计算机视觉#目标检测
    共 24 条
  • 1
  • 2
  • 3
  • 请选择