Skip to content

A 关键公式

title: A 关键公式

description: 汇总医学影像中最常见、最重要、跨模态通用的公式。使读者在阅读主教程时能快速查阅与理解数学推导。适合零基础读者快速建立公式框架。

A 关键公式

1.引言

医学影像是跨越物理学、数学、工程学与医学的典型交叉领域。无论是 CT 的投影重建、MRI 的傅里叶编码,还是 PET 的统计建模,这些成像技术的核心都建立在一系列清晰、可解释、可验证的数学公式之上。理解这些公式不仅能帮助读者更好地掌握影像生成的原理,也能为深入学习图像重建、图像处理、深度学习建模等后续内容奠定坚实基础。

本章旨在汇总医学影像中最常用、最关键、跨模态通用的数学公式,并按照“从基础概念 → 各模态成像模型 → 图像处理 → 深度学习”的路径进行组织。读者可以将本章视作一个随查随用的快速参考(Quick Reference),在学习主教程时随时回溯;也可以作为进一步研究影像物理与重建算法时的入门索引。

为了保证连贯性,本章采用简明的符号体系与统一的表述方式,并在必要时提供物理意义的解释。即便没有深厚的数学基础,读者也能通过本章建立对医学影像数学框架的理解,并将其应用于实践中的图像分析与算法开发。

2.医学影像通用数学基础

本节介绍医学影像中跨模态通用的数学原理,包括坐标系、采样、卷积及噪声建模。这些概念在 CT、MRI、X-ray、PET、超声的建模与重建中均扮演关键角色。

2.1 坐标系与图像几何

医学影像中的几何关系主要涉及 像素/体素坐标 → 物理世界坐标 的映射,以及常见的仿射变换(旋转、缩放、平移等)。

(1)像素/体素坐标 → 物理空间坐标

影像文件(如 DICOM、NIfTI)通常提供一个 4×4 的空间变换矩阵,用于将体素坐标 (i,j,k) 转换为物理坐标 (x,y,z)

[xyz1]=MDICOM [ijk1]
  • MDICOM 包含:

    • 体素间距(spacing)
    • 图像方向(orientation)
    • 图像原点(origin)

(2)DICOM 空间变换矩阵(典型形式)

MDICOM=[Rdiag(Δx,Δy,Δz)T01]

其中:

  • R:方向余弦矩阵(3×3,指定图像轴在世界坐标系的方向)
  • Δx,Δy,Δz:体素大小(单位 mm)
  • T:原点坐标(患者坐标系下的 mm)

(3)常见几何变换矩阵

● 缩放(Scaling)

S=[sx000sy000sz]

● 旋转(Rotation,以 z 轴为例)

Rz(θ)=[cosθsinθ0sinθcosθ0001]

● 仿射变换(Affine Transform)

x=Ax+b

在齐次坐标中表达为:

[x1]=[Ab01][x1]

仿射变换广泛用于图像配准、重采样和多模态对齐。

2.2 图像采样与卷积


(1)卷积定义(连续/离散)

● 连续卷积

(fg)(t)=+f(τ)g(tτ)dτ

● 离散卷积(信号)

(fg)[n]=k=+f[k]g[nk]

● 2D 图像卷积(常用于滤波)

I(x,y)=mnI(xm,yn)K(m,n)

卷积在 CT 滤波反投影(FBP)、MRI 去噪、图像平滑、锐化中都被频繁使用。


(2)下采样与上采样

● 下采样(Downsampling)

xdown[n]=x[kN]

N = 2 时表示宽高减半。

● 上采样(Upsampling)

插 0 然后滤波:

xup[n]={x[n/N],nmodN=00,otherwise

(3)常见插值公式

● 双线性插值(2D)

f(x,y)=m=01n=01f(i+m,j+n)(1|xim|)(1|yjn|)

● 三线性插值(3D)

用于体数据(CT/MRI)重采样,为双线性插值的三维扩展。


(4)空域 ↔ 频域关系(傅里叶变换基础)

● 傅里叶变换(连续)

F(ω)=f(t)ejωtdt

● 离散傅里叶变换(DFT)

X[k]=n=0N1x[n]ej2πkn/N

● 卷积定理(医学影像极为重要)

F{fg}=F{f}F{g}

说明:
卷积在频域等价于乘法,是 CT 滤波反投影(FBP)和 MRI 重建的核心。

2.3 噪声模型

医学影像中常见的噪声主要来自探测器、电子噪声、光子统计噪声等。


(1)加性高斯噪声(MRI / CT 常见)

y=x+N(0,σ2)

适用场景:

  • CT 重建后图像
  • MRI 实部/虚部信号

(2)泊松噪声(PET / X-ray)

PET、X-ray 属于 ​光子计数过程,天然满足泊松模型:

yPoisson(x)

应用:

  • PET 投影数据(sinogram)
  • X-ray 强度采集
  • CT 投影数据的噪声建模

泊松噪声在低剂量 CT、低计数 PET 中尤为显著。

3. CT(Computed Tomography)的关键公式

本节总结 CT 成像与重建中最核心的数学公式,包括 X 射线衰减模型、Radon 变换、滤波反投影(FBP)以及 CT 图像的 HU 转换和窗口化处理。这些公式构成了现代 CT 成像技术的数学基础。


3.1 X-ray 衰减模型

X 射线穿过组织时会被吸收与散射,其衰减过程由 Lambert–Beer 定律 描述,是 CT 物理模型的起点。


(1)Lambert–Beer 定律

当 X 射线束穿过介质时,探测器接收到的强度 I 与入射强度 I0 的关系为:

I=I0exp(Lμ(s)ds)

其中:

  • μ(s):线性衰减系数 (linear attenuation coefficient)
  • L:光线路径
  • I0:入射光子强度
  • I:探测器接收到的强度

(2)投影数据(log-transform)

CT 投影通常进行对数变换,将指数衰减线性化:

p=ln(II0)

可得到:

p=Lμ(s)ds

这就是 Radon 变换的物理来源。


3.2 Radon 变换

Radon 变换描述了物体在不同角度下的线积分,是 CT 投影数据(sinogram)的数学表示。


(1)Radon 变换定义

二位对象 μ(x,y) 在角度 θ 上的投影写为:

p(θ,t)=+μ(x,y)ds

将积分路径参数化后:

p(θ,t)=+μ(tcosθssinθ,tsinθ+scosθ)ds

其中:

  • θ:射线方向
  • t:射线到原点的垂直距离
  • p(θ,t):sinogram 数据

(2)Radon 反变换(理想情况)

理论上,物体可通过 Radon 反变换恢复:

μ(x,y)=R1{p(θ,t)}

实际重建必须结合滤波反投影(FBP)。


3.3 滤波反投影(FBP)

FBP(Filtered Back Projection)是经典 CT 重建算法,是目前临床普遍使用的重建框架之一。


(1)卷积滤波(Filtering Step)

对每个角度的投影 p(θ,t) 做滤波:

p~(θ,t)=p(θ,t)h(t)

其中:

  • h(t):重建滤波器,例如

    • Ram-Lak(理想高通)
    • Shepp-Logan
    • Hanning、Cosine 等

Ram-Lak 滤波器的频域表达:

H(ω)=|ω|

滤波的作用是补偿反投影带来的低频增强。


(2)反投影(Back Projection)

将所有角度的滤波投影反投影到图像空间:

μ(x,y)=0πp~(θ,xcosθ+ysinθ)dθ

意义:

  • 将 1D 滤波投影“拉回”属于它的二维位置
  • 所有角度累加即可恢复物体衰减系数分布

(3)FBP 总公式

μ(x,y)=0π[p(θ,t)h(t)]t=xcosθ+ysinθdθ

3.4 CT 值(HU)转换公式

CT 图像通常以 HU(Hounsfield Unit)为单位,用来衡量组织对 X 射线的衰减能力。


(1)HU 标准化公式

HU=1000μμwaterμwater
  • μ:组织衰减系数
  • μwater:水的衰减系数(基准)
  • 水 = 0 HU
  • 空气 = –1000 HU

(2)线性窗函数(Windowing)

显示 CT 图像时需进行 windowing:

Idisplay=clip(HU(WLWW2)WW,0,1)

其中:

  • WW:Window Width(窗宽)
  • WL:Window Level(窗位)
  • clip(·):将结果限制在 [0,1]

示例:

  • 软组织窗口:WL=40, WW=400
  • 肺窗口:WL=-600, WW=1500
  • 骨窗口:WL=400, WW=2000

4. MRI(Magnetic Resonance Imaging)的关键公式

MRI(磁共振成像)的数学基础主要包括核磁共振信号的产生(Larmor 进动与 Bloch 方程)、组织弛豫过程(T1、T2)、以及 k-space 的傅里叶编码与重建。本节给出 MRI 成像中最核心的公式。


4.1 脉冲序列基础

MRI 信号由磁场与射频脉冲(RF pulse)作用下的核磁矩行为决定,基本动力学由 Larmor 频率和 Bloch 方程描述。


(1)Larmor 频率公式

核自旋在静磁场 B0 中的进动角频率为:

ω0=γB0

其中:

  • ω0:Larmor 频率
  • γ:旋磁比(proton: γ/2π42.58 MHz/T)
  • B0:主磁场强度

说明:高场强(如 3T)会带来更高的信噪比(SNR)。


(2)Bloch 方程(简式)

描述磁化矢量 M=(Mx,My,Mz) 在磁场中的动态变化:

dMdt=γ(M×B)Mxi^+Myj^T2(MzM0)k^T1

其中:

  • 第一项:进动(precision)
  • 第二项:横向弛豫 T2
  • 第三项:纵向弛豫 T1
  • M0:平衡磁化强度

4.2 T1 / T2 弛豫信号模型

组织在 RF pulse 后恢复到平衡状态的过程由两种弛豫描述:

  • T1:纵向恢复
  • T2:横向衰减

(1)T1 恢复(Recovery)

Mz(t)=M0(1et/T1)

含义:

  • Mz(t):随时间恢复的纵向磁化
  • T1:纵向弛豫时间
  • 白质、灰质、脑脊液具有不同的 T1 值,用于对比增强

(2)T2 衰减(Decay)

Mxy(t)=M0et/T2

说明:

  • T2 反映横向磁化的衰减速度
  • 脑脊液 T2 长 → 信号亮
  • 白质 T2 短 → 信号暗

(3)Proton Density(PD)信号表达

未强烈依赖 T1/T2 的情况下,信号主要由质子密度(PD)决定:

SPDρ(1eTR/T1)eTE/T2

在 PD 强调序列中:

  • 长 TR → 消除 T1 影响
  • 短 TE → 消除 T2 影响

最终信号约似:

SPDρ

4.3 k-space 采样与重建

MRI 数据首先采样在 k-space(频域) 中,而不是直接得到图像。k-space 采样与二维傅里叶变换直接相关。


(1)MRI 信号方程(二维傅里叶编码)

物体磁化分布 ρ(x,y) 在频率编码与相位编码梯度作用下,采样信号为:

S(kx,ky)=ρ(x,y)ej2π(kxx+kyy)dxdy

其中:

  • S(kx,ky):采集到的 k-space 数据
  • kx,ky:由梯度磁场决定的编码量
  • ρ(x,y):被成像组织的质子密度或复合信号

这是 二维傅里叶变换 的标准形式。


(2)逆 Fourier 重建

图像恢复通过对 k-space 做逆傅里叶变换:

ρ(x,y)=S(kx,ky)ej2π(kxx+kyy)dkxdky

数值实现:

ρ=F1{S}

临床 MRI 设备中采用快速傅里叶变换(FFT)。

5. 超声成像(Ultrasound)关键公式

超声成像以机械波的传播、反射与散射为基础,其信号处理链路相比 CT/MRI 更依赖波动方程、回波强度及包络检测。本节总结超声 B-mode 成像中最重要的数学公式。


5.1 声波传播基本关系

超声本质是纵波(压力波),在组织中传播时,其速度、频率和波长存在基本物理关系。


(1)波速、频率与波长

声速 c、频率 f、波长 λ 的关系为:

c=λf

典型组织声速:

组织声速 (m/s)
脂肪~1450
肌肉~1580
软组织平均值1540(临床常用值)

(2)声压波表达式(1D)

传播中的声波可表示为:

p(x,t)=p0cos(2πftkx)

其中:

  • k=2πλ 为波数
  • p0 为压力振幅

5.2 回波形成机制

超声图像亮度主要取决于界面反射与组织衰减。


(1)组织衰减模型

声波在传播距离 d 后,振幅衰减为:

A(d)=A0eαd

或以 dB 表示(更常见):

AdB(d)=AdB(0)αdBd

其中:

  • α:线性衰减系数
  • αdB:以 dB/cm 表示的衰减常数

衰减随频率上升而增加,因此高频分辨率更好但穿透性更差。


(2)反射系数(Acoustic Impedance)

不同组织界面的反射强度由声阻抗决定:

Z=ρc

声阻抗差异越大,反射越强。

界面反射系数为:

R=(Z2Z1Z2+Z1)2

其中:

  • Z1,Z2:两种组织的声阻抗
  • R:反射强度比例(0~1)

这是 B-mode 成像亮度的最基础来源。


5.3 B-mode 成像数学

B-mode(Brightness mode)是最常见的超声成像方式,涉及回波包络提取与对数压缩。


(1)包络检测(Hilbert 变换)

接收信号通常为射频信号 x(t),需要提取其包络:

A(t)=x2(t)+x^2(t)

其中:

  • x^(t)x(t) 的 Hilbert 变换
  • A(t):包络(代表强度)

包络代表界面反射的强度,是 B-mode 灰度图的核心。


(2)B-mode 对数压缩(Log Compression)

原始 RF 包络的动态范围非常大(>60 dB),需要压缩到可显示范围:

Idisplay =log(1+A(t))

或常见的 dB 形式:

IdB=20log10(A)

对数压缩可:

  • 压缩动态范围
  • 增强弱反射组织的可见性
  • 提高整体对比度

(3)扫描线(Scanline)到图像

B-mode 最终图像是由多条 A-scan 组成。

数学上可视为:

I(x,y)=LogCompress(A(t))

其中 x 由扫描角度决定,y 为深度(传播时间)。

6. PET / SPECT 成像关键公式

PET(Positron Emission Tomography)与 SPECT(Single Photon Emission Computed Tomography)基于放射性核素衰变产生的γ光子来成像,其数学本质包括放射性衰变模型、泊松统计前向模型以及迭代重建(MLEM / OSEM)。本节给出 PET/SPECT 常用的核心公式。


6.1 放射性衰变

PET/SPECT 的信号源是放射性核素,其示踪剂活度遵循指数衰减。


(1)放射性衰减公式

N(t)=N0eλt

其中:

  • N(t):时间 t 的核素数量
  • N0:初始核素数量
  • λ:衰变常数,与半衰期相关

半衰期公式:

T1/2=ln2λ

(2)活度(Activity)

衰变率(每秒衰变次数)为:

A(t)=λN(t)

单位为贝可(Bq)。


6.2 PET 前向模型(Forward Model)

PET/SPECT 探测到的投影数据本质上是放射性衰变 → γ光子发射 → 探测器响应的统计采样,通常遵循​泊松分布


(1)泊松统计模型

探测器 bin i 的计数服从泊松分布:

yiPoisson(λi)

其中:

  • yi:实际观测计数(sinogram 的一个像素)
  • λi:期望计数

(2)投影数据形成方程

PET 的前向投影可表示为:

λi=jaijxj+ri

其中:

  • xj:像素 j 处的放射性活度(待重建)

  • aij:系统矩阵(system matrix)

    • 包含几何因素、衰减、散射、检测效率
  • ri:随机事件、散射事件、背景噪声

向量形式:

λ=Ax+r

这是 PET 重建的基础。


6.3 PET/SPECT 重建(MLEM / OSEM)

PET/SPECT 多采用基于统计的 ​MLEM 或 OSEM 迭代重建,源于最大似然估计(MLE)。


(1)MLE(Maximum Likelihood Estimation)

观测数据 yi 的似然函数:

L(x)=iλiyieλiyi!

其中 λi=jaijxj

对数似然:

logL(x)=i[yilnλiλi]+C

MLE 目标:

x^=argmaxxlogL(x)

(2)MLEM(Expectation–Maximization)更新公式

经典的 MLEM 更新为:

xj(k+1)=xj(k)iaijyimaimxm(k)iaij

其中:

  • 第一个分数:数据一致性项
  • 分母:归一化因子
  • 形式类似于“前投影 → 归一化 → 反投影”

MLEM 收敛性好但速度慢。


(3)OSEM(Ordered Subsets Expectation Maximization)

OSEM 将 sinogram 分成多个子集(subsets),每次只用部分投影更新,提高速度。

OSEM 更新形式:

xj(k+1)=xj(k)iSkaijyimaimxm(k)iSkaij

其中 Sk 是第 k 个子集。

  • 加快重建速度(约快 MLEM 的 S 倍)
  • 临床 PET/SPECT 重建常用 OSEM

7. X-ray / DR 成像关键公式

X-ray / DR(Digital Radiography)成像的核心来自光子穿透组织时的衰减与探测器响应。其物理模型通常可由 Lambert-Beer 定律 + 线积分投影模型 + 探测器增益校正 构成。本节总结 DR 成像中最重要的公式。


7.1 投影模型(线积分)

在 DR(投影摄影)中,X 射线从单一方向穿过物体,穿透路径上的衰减构成二维影像像素值。


(1)光子衰减模型(Lambert–Beer)

对于入射强度 I0,透射强度 I 为:

I=I0exp(Lμ(s)ds)

其中:

  • μ(s):路径上位置 s 处的衰减系数
  • L:光线穿过的路径

(2)投影(线积分)模型

定义投影:

p=Lμ(s)ds

则 DR 图像的理想亮度模型可表示为:

I=I0ep

log-transform 后得到线性表达式:

p=ln(II0)

意义:

  • DR 是 Radon 变换的单角度特例(CT 是多角度)
  • p 反映 X 射线的整体衰减量,决定成像亮度

(3)亮度与衰减关系(直接表示)

亮度(透过率)通常与衰减呈负相关:

Brightness(x,y)eμ(x,y)d

其中 d 为组织厚度。


7.2 图像归一化与增益校正

真实探测器存在不均匀性、暗电流、增益偏差,因此必须对 DR 图像进行平场(Flat-field)校正,以恢复正确的衰减印记。


(1)探测器响应模型

原始 DR 图像可表示为:

Iraw=GIsignal+D

其中:

  • G:像素增益(gain),随像素变化
  • D:暗电流(dark field)
  • Isignal:理想信号

(2)平场校正(Flat-field Correction)

平场校正的公式为:

Icorr=IrawIdarkIflatIdark

其中:

  • Iraw:原始采集图像
  • Iflat:均匀照射下的平场图
  • Idark:无照射时的暗场图

意义:

  • 校正增益不均匀(pixel gain variation)
  • 校正暗电流偏置
  • 恢复正确的射线透射信息

(3)线性归一化(用于可视化)

校正后图像常做归一化:

Inorm=Icorrmin(Icorr)max(Icorr)min(Icorr)

用于:

  • 显示优化
  • 后续图像处理 / 机器学习算法

8. 图像处理与增强的常用公式

医学影像处理中,预处理、增强和特征计算是 CT、MRI、超声、PET、X-ray 等各模态共同依赖的基础步骤。本节总结常用的标准化方法、滤波器、边缘算子,以及重采样中的仿射变换与插值公式。


8.1 直方图与归一化(Normalization)

标准化是提高图像可比性与模型鲁棒性的关键步骤。


(1)Min–Max 归一化

将值线性映射到 [0,1]

x=xxminxmaxxmin

适用于灰度归一、窗宽映射(如 CT 图像)。


(2)Z-score 标准化

常用于深度学习模型的输入标准化:

x=xμσ

其中:

  • μ:均值
  • σ:标准差

使数据满足零均值、单位方差。


(3) 直方图均衡化(Histogram Equalization)

通过增强对比度,使灰度分布更均匀。

CDF(累计分布函数)为:

CDF(x)=i=0xh(i)N

均衡化后的像素:

x=(L1)CDF(x)

其中:

  • h(i):灰度 i 的频率
  • N:像素总数
  • L:灰度级数(通常 256)

适用于 DR、超声、部分 MRI 场景。


8.2 滤波与特征计算

图像滤波用于平滑、去噪、边缘增强,是图像处理的基础操作。


(1)高斯滤波(Gaussian Filter)

一维高斯核:

G(x)=12πσ2ex22σ2

二维高斯核:

G(x,y)=12πσ2ex2+y22σ2

作用:

  • 平滑图像
  • 减少高频噪声
  • 常用于去噪前处理(如 CT、X-ray、Ultrasound)

(2)Sobel 边缘算子

用于检测水平或垂直边缘。

Sobel-x:

Gx=[101202101]

Sobel-y:

Gy=[121000121]

梯度强度:

|I|=(GxI)2+(GyI)2

适用于边缘检测、形态分析。


(3)Laplacian 边缘增强

二阶导数算子:

2I=2Ix2+2Iy2

典型离散模板:

[010141010]

可用于锐化或边缘增强。


8.3 重采样与对齐(Resampling & Registration)

医学图像对齐常基于仿射变换与空间插值。


(1)仿射变换矩阵

三维仿射变换(常用于 CT/MRI 注册):

x=Ax+b

齐次形式:

[x1]=[Ab01][x1]

其中:

  • A:包含旋转、缩放、剪切
  • b:平移向量

用于:

  • 多模态配准(MRI ↔ CT)
  • 图像对齐
  • 数据标准化(e.g., 统一 voxel spacing)

(2)三线性插值(Trilinear Interpolation)

重采样三维体数据最常用的方法。

三线性插值的通式:

f(x,y,z)=i=01j=01k=01f(i,j,k)(1|xi|)(1|yj|)(1|zk|)

含义:

  • 每个点由周围 8 个体素加权求得
  • 权重由距离线性决定

适用于:

  • 体数据重采样
  • CT/MRI 归一化 spacing
  • 空间变换中的 resample 步骤

9. 深度学习中的关键公式(医学影像常用)

深度学习已广泛应用于医学影像的分割、分类、检测和重建任务。本节总结在医学影像任务中最常用的卷积公式、损失函数和评价指标,为后续算法理解提供数学基础。


9.1 卷积层(2D / 3D)

卷积是 CNN 在医学影像中最重要的运算(例如 2D MRI 切片、3D CT 体数据、超声序列等)。


(1)卷积运算公式

● 2D 卷积(图像)

y(i,j)=mnx(im,jn)k(m,n)

● 3D 卷积(体数据)

y(i,j,k)=uvwx(iu,jv,kw)k(u,v,w)

3D 卷积广泛用于 CT/MRI 分割和 3D 检测任务。


(2)卷积输出尺寸计算公式

● 2D 输出尺寸

Hout=HinK+2PS+1Wout=WinK+2PS+1

● 3D 输出尺寸

Dout=DinK+2PS+1

参数说明:

  • K:kernel size
  • S:stride
  • P:padding
  • 输入/输出维度用于 CNN 结构设计(UNet、VNet 等)

9.2 损失函数(Loss Functions)

医学影像任务常涉及类别不平衡,因此 Dice Loss、Focal Loss 在分割与检测任务中尤其常用。


(1)Dice Loss(分割常用)

Dice 系数:

Dice=2|AB||A|+|B|

Dice Loss:

LDice=1Dice

用于分割任务(尤其是器官、病灶、小目标)。


(2)Cross-Entropy Loss(分类/分割基础)

● 二分类交叉熵

LCE=[ylog(y^)+(1y)log(1y^)]

● 多分类交叉熵

LCE=c=1Cyclog(y^c)

(3)Focal Loss(解决类别不平衡)

Focal Loss 抑制简单样本,突出困难样本:

LFocal=(1y^)γylog(y^)

其中:

  • γ:调节难样本的权重(典型值 1–3)
  • 常用于肺结节检测、肿瘤检测等类别极不平衡任务

9.3 评价指标(Segmentation & Classification Metrics)

评价指标反映模型在医学影像任务中的性能,尤其是在病灶分割、器官分割和病理分类中尤为关键。


(1)Dice 系数

Dice=2|AB||A|+|B|
  • 0(差) → 1(完美)
  • 常用于 CT/MRI 器官/病灶分割评估

(2)IoU(Intersection over Union)

IoU=|AB||AB|

与 Dice 关系:

Dice=2IoU1+IoU

(3)Sensitivity(敏感度)

Sensitivity=TPTP+FN

衡量“发现病灶”的能力。


(4)Specificity(特异度)

Specificity=TNTN+FP

衡量“避免误报”的能力。

Released under the MIT License.