RGB 三通道在内存中的存储方式

1. RGB 三通道在内存中的存储方式

计算机中存储 RGB 图像主要有两种主流的内存布局（Layout）：

Note

重要！

A. Interleaved（交错存储 / Packed）

这是最常见的存储方式，也是 OpenCV (cv2) 和大部分图像解码库（如 PIL, libjpeg）默认读取图片后的内存形态。

逻辑形状： [Height, Width, Channel]，即 (H, W, 3)
物理排列： 像素点是连续的，每个像素内部的 RGB 值也是连续的。
内存视角： RGB RGB RGB RGB ... (或者是 BGR BGR ...)
特点：
优点： 访问某个特定像素（如 img[100, 200]）非常快，因为该像素的三个通道数据在内存中是挨在一起的（Cache Locality 好）。适合做像素级的操作（如调整某个点的亮度）。
缺点： 如果要单独对“红色通道”做全图卷积，数据是不连续的。

B. Planar（平面存储）

这是深度学习框架（如 PyTorch, Caffe）在输入模型前要求的格式。

逻辑形状： [Channel, Height, Width]，即 (3, H, W)
物理排列： 先存完所有的 R，再存所有的 G，最后存所有的 B。
内存视角： RRR...RRR GGG...GGG BBB...BBB
特点：
优点： 在做卷积神经网络（CNN）计算时，卷积核通常是在“通道”层面上滑动的。Planar 格式让同一个通道的数据在内存中连续，极大地提高了 GPU/CPU 在进行矩阵运算（SIMD 指令）时的效率。
缺点： 想要看“第 5 行第 5 列”是什么颜色时，需要跨越很大的内存地址去分别取 R、G、B，缓存命中率低。

2. 为什么会有 BGR 这种反人类的顺序？

BGR（Blue-Green-Red）主要是 OpenCV 的遗留产物。为什么是 BGR？这主要归结为 “历史原因” 和 “硬件惯性”，而不是数学上的计算优势。

核心原因：历史上的 Windows 和硬件标准

在 OpenCV 刚开始开发的 1999/2000 年代，计算机视觉主要依附于当时的硬件和操作系统标准：

Windows GDI 与 BMP 格式： 早期 Windows 的绘图 API（GDI）和 BMP 文件格式，在底层将像素存储为 Little-Endian（小端序） 的 32位整数。

一个颜色整数如果是 0x00RRGGBB（我们逻辑上认为的 RGB），在小端序内存中存储的顺序其实是 BB GG RR 00。
为了适配这种底层的内存读写习惯，很多早期软件和显卡驱动选择直接按 BGR 顺序读写，这样可以直接用 memcpy 把数据丢进显存，而不需要逐个像素去 Swap（交换）通道。

相机厂商的习惯： 当时很多工业相机和摄像头硬件输出的原始流（Raw Stream）也是 BGR 顺序。
Intel 的选择： OpenCV 最早是 Intel 发起的项目（用于展示 CPU 性能）。当时的 Intel 工程师为了让库能以最快速度兼容当时的 Windows 软件生态和主流摄像头，直接采用了 BGR 作为默认格式。

有计算上的好处吗？

在现代深度学习中：没有。

卷积网络并不关心输入是 RGB 还是 BGR，只要你训练时和推理时保持一致即可（即：如果是 BGR 训练的，推理时也要喂 BGR）。
数学上，Convolution(RGB) 和 Convolution(BGR) 计算量完全一样。

在特定工程场景中：有微小的“省流”优势。

如果你的输入源（比如老式摄像头驱动、Windows 截图 API、某些视频解码硬件）吐出来的就是 BGR 数据，那么直接使用 BGR 格式可以省去一次 cv2.cvtColor(img, cv2.COLOR_BGR2RGB) 的操作。对于追求极致低延迟（如 1ms 级别）的实时系统，不做内存拷贝（Zero-copy）是有意义的。

总结建议

传统图像处理（OpenCV）： 入乡随俗，牢记读取出来是 BGR。
深度学习（PyTorch/TensorFlow）： 务必在数据预处理阶段（DataLoader）将 BGR 转为 RGB，并使用 permute 或 transpose 将数据从 HWC（Interleaved）转为 CHW（Planar），这是目前模型训练的标准范式。

... [RGB image vs BGR Image | Computer Vision](https://www.youtube.com/watch?v=RExazRWPUx4) ...

这个视频非常直观地演示了 OpenCV 读取图片时的 BGR 顺序，以及如果不转换直接显示会发生什么（比如人脸变蓝），能很好地辅助你理解这个概念。

mark：

> [!NOTE]
> Useful information that users should know, even when skimming content.

> [!TIP]
> Helpful advice for doing things better or more easily.

> [!IMPORTANT]
> Key information users need to know to achieve their goal.

> [!WARNING]
> Urgent info that needs immediate user attention to avoid problems.

> [!CAUTION]
> Advises about risks or negative outcomes of certain actions.