实用hog python实现：正确处理图像边缘和背景

wy1280 2025年11月08日 10:13 128 0

在计算机视觉领域中，常常需要对图像进行特征提取和识别，其中特征提取是一项非常重要的工作。HOG（方向梯度直方图）是一种常用的特征提取算法，其在人体检测、行人检测等领域得到广泛应用。本文介绍如何使用Python实现HOG算法，并解决HOG算法中的两个问题：图像边缘和背景。

1. HOG算法简介

HOG算法是一种基于梯度的特征提取方法，常用于目标检测任务中。HOG算法的基本思想是，将图像分成若干个小的区域，对每个区域内的像素点进行梯度计算，计算结果构成了直方图。将所有区域的直方图拼接在一起，就得到了图像的HOG特征表示。

2. 图像边缘

HOG算法的一个问题是，如果在图像边缘处进行特征提取，由于像素值不连续，梯度计算会出现错误。因此，我们需要对图像边缘的像素进行特殊处理。

一种解决办法是使用窗口滑动的方式，即在特征提取时，不考虑图像边缘附近的像素点。具体做法是，在图像的四周添加一定大小的边缘，用相邻的像素填充边缘区域，然后在新的图像上进行特征提取。

另一种解决办法是选择不同的滤波算子进行梯度计算。常见的滤波算子有Sobel算子和Prewitt算子，它们对图像梯度的计算与像素点的位置无关，因此适用于图像边缘的特征提取。

3. 背景处理

在HOG算法中，如果背景像素太多，会对目标检测产生干扰。因此，我们需要对背景像素进行处理。

一种解决办法是使用背景剪裁的方式，即在特征提取时，只考虑感兴趣区域内的像素点。如果目标占据整个图像，可以使用背景区域和目标区域的比例进行背景剪裁。

另一种解决办法是使用曲线平滑的方式，即对图像的背景区域进行平滑处理，使其像素值变化较小，从而降低其在特征提取中的权重。

4. Python实现

我们使用Python中的OpenCV库实现HOG算法。具体步骤如下：

1. 读入图像并转换为灰度图像

2. 在图像的四周添加边缘

3. 使用Sobel算子计算图像的梯度

4. 将图像分成若干个小区域

5. 对每个区域的像素点进行梯度计算，并统计直方图

6. 将所有区域的直方图拼接在一起，得到图像的HOG特征

代码实现如下：

```

import cv2

import numpy as np

# 读入图像

image = cv2.imread(test.jpg)

# 转换为灰度图

gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

# 添加边缘

border_size = 20

gray = cv2.copyMakeBorder(gray, border_size, border_size, border_size, border_size,

cv2.BORDER_REPLICATE)

# 计算梯度

gx = cv2.Sobel(gray, cv2.CV_32F, 1, 0)

gy = cv2.Sobel(gray, cv2.CV_32F, 0, 1)

magnitude, angle = cv2.cartToPolar(gx, gy, angleInDegrees=True)

# 划分区域

cell_size = 8

block_size = 2

height, width = gray.shape

n_cells_per_block = block_size ** 2

cell_count_x = int(width // cell_size)

cell_count_y = int(height // cell_size)

window_size = block_size * cell_size

blocks_per_window_x = int(np.floor((width - window_size) / cell_size) + 1)

blocks_per_window_y = int(np.floor((height - window_size) / cell_size) + 1)

n_blocks_per_window = blocks_per_window_x * blocks_per_window_y

hogs = np.zeros((n_blocks_per_window, block_size, block_size, 9))

# 统计直方图

for i in range(cell_count_y - block_size + 1):

for j in range(cell_count_x - block_size + 1):

cell_hog = np.zeros((block_size, block_size, 9))

for k in range(block_size):

for l in range(block_size):

cell_magnitude = magnitude[i * cell_size:(i + 1) * cell_size,

j * cell_size:(j + 1) * cell_size]

cell_angle = angle[i * cell_size:(i + 1) * cell_size,

j * cell_size:(j + 1) * cell_size]

vmin = l * 9

vmax = vmin + 9

count, _ = np.histogram(cell_angle,

bins=9,

range=(vmin, vmax),

weights=cell_magnitude)

cell_hog[k, l, :] = count

hogs[i * blocks_per_window_x + j] = cell_hog

# 拼接直方图

normalized_hogs = np.empty((n_blocks_per_window, n_cells_per_block * 9))

for i in range(blocks_per_window_y):

for j in range(blocks_per_window_x):

block_hog = hogs[i * blocks_per_window_x + j]

block_hog /= np.linalg.norm(block_hog) + 1e-6

normalized_hogs[i * blocks_per_window_x + j] = block_hog.reshape(-1)

# 输出HOG特征

print(normalized_hogs)

```

5. 总结

HOG算法是目标检测任务中的重要特征提取算法，但在实际应用中，需要考虑图像边缘和背景对特征提取的影响。本文通过Python代码实现，介绍了解决这两个问题的常见方法。希望对读者有所帮助。

本文地址：https://www.oaikm.com/jishu/106708.html