OpenCV实战：5分钟搞定图像二值化，手把手教你用C++实现大津法（OTSU）

Sahadhammika

237人浏览 · 2026-06-29 13:18:40

Sahadhammika · 2026-06-29 13:18:40 发布

OpenCV实战：5分钟搞定图像二值化，手把手教你用C++实现大津法（OTSU）

当你第一次接触图像处理时，二值化可能是最直观也最实用的技术之一。想象一下，你有一张模糊的文档照片，想要提取清晰的文字；或者一张产品照片，需要分离出产品主体。这时候，二值化就是你的得力助手。而大津法（OTSU）作为自动确定最佳阈值的经典算法，能帮你省去手动调参的麻烦。

本文将带你用C++和OpenCV，在5分钟内实现两种二值化方案：直接调用OpenCV API和自己动手实现大津法。无论你是刚入门计算机视觉的学生，还是需要在项目中快速应用图像处理的开发者，这篇实战指南都能让你立即看到效果。

1. 环境准备与基础设置

在开始编码前，我们需要确保开发环境就绪。如果你还没有安装OpenCV，可以通过以下命令快速安装（以Ubuntu为例）：

sudo apt update
sudo apt install libopencv-dev

对于Windows用户，建议下载预编译的OpenCV库，并通过CMake配置项目。创建一个基本的C++项目后，在CMakeLists.txt中添加：

find_package(OpenCV REQUIRED)
target_link_libraries(your_project_name ${OpenCV_LIBS})

准备一张测试图像（建议使用灰度图或先转换为灰度），我们将用它来演示二值化效果。如果你没有合适的图片，可以用OpenCV直接生成一个简单的测试图：

cv::Mat testImage(200, 200, CV_8UC1);
for(int i = 0; i < testImage.rows; i++) {
    for(int j = 0; j < testImage.cols; j++) {
        testImage.at<uchar>(i,j) = j % 256; // 渐变灰度
    }
}

2. OpenCV API快速实现

OpenCV已经内置了大津法的实现，我们可以直接调用。这是最快捷的方式，适合大多数应用场景。

#include <opencv2/opencv.hpp>

int main() {
    // 读取图像（自动转换为灰度）
    cv::Mat image = cv::imread("test.jpg", cv::IMREAD_GRAYSCALE);
    if(image.empty()) {
        std::cerr << "无法加载图像" << std::endl;
        return -1;
    }
    
    cv::Mat binary;
    double thresh = cv::threshold(image, binary, 0, 255, cv::THRESH_BINARY | cv::THRESH_OTSU);
    
    std::cout << "OTSU计算的最佳阈值: " << thresh << std::endl;
    
    cv::imshow("Original", image);
    cv::imshow("Binary (OTSU)", binary);
    cv::waitKey(0);
    
    return 0;
}

这段代码的关键点在于 cv::threshold 函数的参数：

第三个参数0是初始阈值（OTSU会自动忽略）
255是二值化的最大值
THRESH_BINARY | THRESH_OTSU 组合表示使用OTSU方法进行二值化

提示：在实际项目中，如果处理速度是关键考量，可以预先测试API的执行时间。对于640x480的典型图像，现代CPU上OpenCV的OTSU实现通常能在1-3毫秒内完成。

3. 手动实现大津法

虽然API调用方便，但了解算法原理和手动实现能让你更灵活地应对特殊需求。大津法的核心思想是找到一个阈值，使得前景和背景两类像素的类间方差最大。

3.1 算法原理拆解

大津法的数学原理可以分解为几个步骤：

计算灰度直方图 ：统计图像中每个灰度级出现的概率
计算全局均值 ：所有像素的灰度平均值
遍历所有可能的阈值k ：
- 计算前景和背景的概率（w0, w1）
- 计算前景和背景的均值（u0, u1）
- 计算类间方差：σ² = w0 * w1 * (u0 - u1)²
选择使σ²最大的k作为最佳阈值

3.2 C++完整实现

下面是完整的实现代码，包含了详细的注释：

#include <opencv2/opencv.hpp>
#include <vector>
#include <cmath>

int otsuThreshold(const cv::Mat& src) {
    const int histSize = 256;
    float range[] = {0, 256};
    const float* histRange = {range};
    
    // 计算直方图
    cv::Mat hist;
    cv::calcHist(&src, 1, 0, cv::Mat(), hist, 1, &histSize, &histRange);
    
    // 归一化直方图（得到概率）
    hist /= src.total();
    
    // 计算全局均值
    float globalMean = 0;
    for(int i = 0; i < histSize; ++i) {
        globalMean += i * hist.at<float>(i);
    }
    
    float maxVariance = 0;
    int bestThreshold = 0;
    float w0 = 0, u0 = 0;
    
    for(int k = 0; k < histSize; ++k) {
        w0 += hist.at<float>(k); // 前景概率累加
        u0 += k * hist.at<float>(k); // 前景均值累加
        
        if(w0 == 0 || w0 == 1) continue;
        
        float u1 = (globalMean - u0) / (1 - w0); // 背景均值
        float variance = w0 * (1 - w0) * (u0/w0 - u1) * (u0/w0 - u1);
        
        if(variance > maxVariance) {
            maxVariance = variance;
            bestThreshold = k;
        }
    }
    
    return bestThreshold;
}

void applyThreshold(const cv::Mat& src, cv::Mat& dst, int threshold) {
    dst = src > threshold;
    dst.convertTo(dst, CV_8U, 255);
}

int main() {
    cv::Mat image = cv::imread("test.jpg", cv::IMREAD_GRAYSCALE);
    if(image.empty()) {
        std::cerr << "无法加载图像" << std::endl;
        return -1;
    }
    
    // 计算OTSU阈值
    int thresh = otsuThreshold(image);
    std::cout << "手动计算的最佳阈值: " << thresh << std::endl;
    
    // 应用阈值
    cv::Mat binary;
    applyThreshold(image, binary, thresh);
    
    cv::imshow("Original", image);
    cv::imshow("Manual OTSU", binary);
    cv::waitKey(0);
    
    return 0;
}

3.3 性能优化技巧

在实际应用中，我们可以对算法进行一些优化：

直方图计算优化 ：使用查表法替代逐像素统计
提前终止 ：当w0超过0.5后，方差通常会开始减小，可以提前终止循环
并行计算 ：对于大图像，可以将直方图统计部分并行化

// 优化的直方图计算（查表法）
std::vector<int> hist(256, 0);
for(int i = 0; i < src.rows; ++i) {
    const uchar* p = src.ptr<uchar>(i);
    for(int j = 0; j < src.cols; ++j) {
        hist[p[j]]++;
    }
}

4. 两种方法对比与实战建议

4.1 结果对比

我们通过一个对比表格来看看两种实现的差异：

对比项	OpenCV API	手动实现
代码复杂度	低（1行调用）	中（约50行）
执行时间	较快	可能更快（经优化）
灵活性	固定实现	可自定义修改
适用场景	快速原型开发	特殊需求、教学

注意：在大多数现代CPU上，对于640x480的图像，两种方法的实际速度差异可能只有几毫秒，除非在极端性能敏感的场景，否则差异不大。

4.2 何时选择哪种实现

根据项目需求，可以参考以下决策流程：

需要快速验证想法 → 直接使用OpenCV API
需要处理特殊图像（如非标准直方图） → 手动实现并调整算法
教学或学习目的 → 手动实现以理解原理
嵌入式设备或极端性能需求 → 手动优化实现

4.3 常见问题排查

在实际使用中可能会遇到的一些问题及解决方案：

图像全黑或全白 ：
- 检查是否正确地转换为灰度图像
- 验证直方图是否合理（是否有明显的双峰）
阈值不理想 ：
- 尝试对图像进行预处理（高斯模糊去噪）
- 考虑使用自适应阈值方法替代全局阈值
性能问题 ：
- 对于视频流处理，可以每N帧计算一次阈值
- 降低图像分辨率后再计算阈值

// 预处理示例：高斯模糊
cv::Mat blurred;
cv::GaussianBlur(image, blurred, cv::Size(5,5), 0);
int thresh = otsuThreshold(blurred);

5. 进阶应用与扩展思路

掌握了基础的大津法后，我们可以探索更多应用场景和变种算法。

5.1 多阈值OTSU扩展

传统OTSU适用于双峰直方图，但对于更复杂的图像，我们可以扩展为多阈值版本：

// 双阈值OTSU的简化实现思路
std::vector<int> findMultiThresholds(const cv::Mat& src, int numThresholds) {
    // 实现类似于K-means的迭代算法
    // 1. 随机初始化阈值
    // 2. 根据当前阈值分类像素
    // 3. 重新计算各类的均值作为新阈值
    // 4. 重复2-3直到收敛
    // 返回找到的阈值集合
}

5.2 与其它技术结合

大津法可以与其他图像处理技术结合使用：

边缘检测+OTSU ：先提取边缘，再对边缘图像二值化
色彩空间转换 ：在HSV等空间的V通道应用OTSU
局部自适应 ：将图像分块后分别应用OTSU

// 边缘检测+OTSU示例
cv::Mat edges;
cv::Canny(image, edges, 50, 150);
cv::Mat edgeBinary;
cv::threshold(edges, edgeBinary, 0, 255, cv::THRESH_BINARY | cv::THRESH_OTSU);

5.3 实时视频处理

将OTSU应用到视频流中，需要注意性能优化：

cv::VideoCapture cap(0); // 打开摄像头
cv::Mat frame, gray, binary;

while(true) {
    cap >> frame;
    cv::cvtColor(frame, gray, cv::COLOR_BGR2GRAY);
    
    // 每10帧计算一次阈值以提高性能
    static int counter = 0;
    static int currentThresh = 128;
    if(counter++ % 10 == 0) {
        currentThresh = otsuThreshold(gray);
    }
    
    applyThreshold(gray, binary, currentThresh);
    
    cv::imshow("Live OTSU", binary);
    if(cv::waitKey(1) == 27) break; // ESC退出
}

在实际项目中，我发现对于光照变化缓慢的场景，降低阈值计算频率能显著提升性能而不影响效果。而对于文档扫描类应用，配合适当的形态学操作（如开运算）能进一步改善二值化质量。

亚马逊云科技技术品牌专区

更多推荐

2026年量化工具选择，要跟着能力基础走

读者应理解，选择工具前要先判断自己的能力基础和当前任务。工具应该帮助自己补上当前最关键的缺口，而不是替代学习顺序本身。

亚马逊云科技技术品牌专区

近期零基础学量化，先按基础差异拆学习顺序

读者应明白，拆解学习顺序时要先看自己的基础缺口，再决定哪一段需要放慢。不同流程阶段都有不同检查任务，学习路线要能反映这些差异。

亚马逊云科技技术品牌专区

加州理工 CS367 C 语言系统编程笔记（一）

C语言是一种强大且广泛使用的编程语言，尤其在系统编程领域。本节课我们将学习C语言的基础语法，包括如何编写“Hello, World!”程序、声明变量以及使用基本数据类型。我们将通过实际的代码示例来加深理解。本节课中我们一起学习了C语言的基础语法，包括如何编写和运行一个简单的C程序、声明变量以及使用基本数据类型。我们还介绍了如何使用Shell环境来编译和运行程序。通过对比Java，你可以看到C语言在