摘要:在肿瘤影像分析里,“异质性”(Intratumor Heterogeneity,简称 ITH)是个绕不开的关键词。它描述的是同一个肿瘤内部的“多样性”:不同位置可能有不同的结构、密度、代谢活性,甚至不同的微环境。ITH 越高,往往意味着肿瘤更复杂、更难预测,也
在肿瘤影像分析里,“异质性”(Intratumor Heterogeneity,简称 ITH)是个绕不开的关键词。它描述的是同一个肿瘤内部的“多样性”:不同位置可能有不同的结构、密度、代谢活性,甚至不同的微环境。ITH 越高,往往意味着肿瘤更复杂、更难预测,也可能与不良预后相关。
本文用通俗方式,带你理解几种常见的,PixelmedAI支持的 ITH 评分思路:
基于连通性聚类的 ITH(cluster map)基于图像区域特征的 ITH(regionprops)基于空间自相关的 ITH(全局莫兰指数 Moran’s I)基于机器学习预测概率的 ITH(模型输出概率)想象一座“城市”(肿瘤),这座城市里有不同的“街区”(病灶的局部区域):
有的街区房屋整齐、密度类似(低异质性);有的街区新旧混杂、风格迥异(高异质性)。ITH 要做的,就是量化这种“混杂”的程度。不同的方法,相当于不同的“城市规划视角”。
核心问题:肿瘤内部被划分为多个类别/亚区后,这些类别在空间上是“一整块为主”还是“碎碎散散”?直觉理解: 如果每个类别都能形成“大块连续区域”,说明结构比较统一,异质性较低;如果各类别都被撕碎成很多小块,彼此交错分布,说明内部很不一致,异质性较高。评分思路: 看“每个类别的连通片数量”和“最大的连通片有多大”,再与整体肿瘤大小比较;连通片越多、越碎,评分越高(更“杂”)。适合场景: 已经有了明确的肿瘤“亚区分割”或“分型标签”(比如不同功能区域、不同增强模式);关注空间“碎片化”程度对临床结果的影响(如预后、治疗反应)。小结:这是“拼图视角”——同一种颜色是连成大块,还是被撕成碎片散落一地?
核心问题:同样是看类别/亚区在肿瘤内部的空间形态,但从“区域形态统计”的角度概括。直觉理解: 我们不逐片数,而是用区域的“面积”“填充程度”等特征,概括这个类别在空间上是“稳态大块”还是“分散破碎”。评分思路: 汇总每个区域的“典型形态指标”,再做整体的归纳;当“大片连续区域”占主导时,倾向低异质性;当“形态破碎、填充不足”的区域增多时,倾向高异质性。适合场景: 同样适用于已经分好类/分好区的肿瘤;强调用“形态学统计”来概括异质性,更便于与其他形态学指标联动(如紧致度、圆度等)。小结:这是“形态学视角”——用区域的形状与填充特征,来概括内部一致性。
核心问题:肿瘤内部的“相似值”是否更喜欢“扎堆”在一起?还是彼此交错混合?直觉理解: 如果“高值挨着高值、低值挨着低值”很多,说明空间上“物以类聚”,整体更有规律,异质性相对较低;如果“高值和低值像盐和胡椒一样撒在一起”,则空间结构更混乱,异质性更高。评分思路: 把肿瘤里的每个体素看成地图上的一个格子,观察相邻格子的数值是否相似;相似的格子越爱扎堆,指数越高;越是“你中有我、我中有你”,指数越低,甚至呈反相关。适合场景: 你有一个“连续型的影像特征”(比如强度、纹理响应、功能参数),想量化它的空间“聚集”还是“混杂”;想从“全局空间模式”的角度定义 ITH,而不是依赖明确的类别标签。小结:这是“地图视角”——看相似区域是否成群结队,还是打散重叠。
核心问题:如果用机器学习模型来判断肿瘤的某种属性(如分子分型、复发风险),模型的“信心分布”能否反映肿瘤的异质性?直觉理解: 对同一个肿瘤,若模型在不同位置给出的“属于某类的概率”起伏很大(有的地方很确定,有的地方很不确定),说明内部信息不一致,可能更“异质”;如果整块肿瘤模型都很“笃定”同一类,说明内部较一致,异质性可能较低。评分思路: 用模型输出的“概率地图”或“整块概率分布”的离散度(比如波动程度、置信-不确定对比)作为 ITH 的替代指标;概率越分散、越不稳定,ITH 越高。适合场景: 你已经训练了一个稳定的模型,希望把“模型对空间的理解”转化为异质性的量化表达;希望把 ITH 与“预测不确定性”结合起来,服务于决策。小结:这是“模型视角”——用模型的“信心波动”侧写肿瘤内部是否一致。
已有明确的“亚区标签/分区图”,想看空间是否碎片化:
首选:基于“连通性聚类”的 ITH(cluster map)辅助:基于“区域特征”的 ITH(regionprops)没有明确标签,但有“连续型影像特征”(强度、功能参数等),想看整体空间模式:
首选:全局莫兰指数 Moran’s I已有成熟模型,希望结合模型“信心地图/概率分布”来量化内部一致性:
可用:模型输出概率作为 ITH 替代指标强调可解释性与空间直观可视化:
连通性/区域特征更直观(看“碎片”与“大块”)Moran’s I 更像“整体空间规律”的温度计模型概率强调“预测不确定性”的角度实践中的注意事项数据一致性 同一项目中尽量统一邻域定义(2D 的 8 邻域、3D 的 26 邻域)和空间分辨率,以保证可比性。掩膜与标签质量 ITH 完全建立在“掩膜”和“分区/特征”之上。掩膜粗糙或标签漂移都会放大量化误差。显著性与统计学稳健性 如果需要“统计显著”的说法,应考虑置换检验或多重比较校正,而非只用阈值硬切分。解释与临床关联 ITH 是“中间指标”。一定要结合结局(预后、治疗反应)去验证其临床意义,而非只看数值大小。它们都是 ITH 的不同侧面,没有绝对的“谁更好”,只有“谁更适合你的数据与问题”。最好的做法,是在一个清晰的实验设计中,用两三种互补的方法,交叉验证你的发现,让 ITH 的刻画更全面、更稳健。
来源:影像诊断小札记一点号