买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开了一种基于SDF扩散的医学超声影像三维重建方法和系统,属于计算机视觉技术领域。首先使用在医学数据上预训练的视觉模型对输入超声图像提取特征。随后开始SDF扩散过程,反向扩散过程由完全随机噪声开始,逐步去噪以得到干净的SDF场,其中使用状态空间模型和交叉注意力对SDF特征和超声图像特征进行融合,以实现SDF场所表示三维表面与超声图像一致。经过实际验证,本发明提供的基于SDF扩散的医学超声影像三维重建方法具有高效、高精确度的特点。
主权项:1.一种基于SDF扩散的医学超声影像三维重建方法,其特征在于,包括以下步骤:S1:获取医学超声图像数据,并提取该超声图像特征,用于指导后续的扩散过程;S2:随机初始化SDF场,将SDF场V按照正态分布进行随机初始化即S3:利用扩散模型进行SDF扩散过程,扩散模型包含两个关键过程:前向扩散过程和反向扩散过程;先使用状态空间模型对体素和超声图像特征进行融合,得到融合超声图像特征后的体素特征,再在体素分辨率较小的阶段使用交叉注意力对体素特征和超声图像特征进行融合;具体包括:S3-1:前向扩散过程用马尔可夫链表示,每个时间步t都会添加一定量的高斯噪声,直到最终时刻T,原始数据变成纯噪声;给定一个数据样本X0~qX0,正向过程qX0:t逐渐将数据样本转换为纯高斯噪声: 其中xt表示时间步t时的样本,xt-1表示前一个时间步的样本,qxt∣xt-1为高斯转移概率: 其中表示正态分布,βt表示噪声调度超参数,是一个学习的系数或设置为一个常数;正向过程以封闭形式在任意时间步t采样xt: 其中at=1-βt,因此,xt直接通过下式采样: 其中的∈是一个从正态分布随机采样的噪声;S3-2:反向扩散过程被定义为具有学习高斯跃迁的马尔可夫链: 其中是标准正态分布,μθxt,t表示由θ参数化的去噪函数,是一个时间步长相关的方差,设置为从pxT中采样,然后通过公式6绘制xt-1~pθxt-1∣xt为: 其中∈θxt,t是一个由θ参数化的神经网络,它从噪声输入xT预测噪声;通过重复这个过程,最终生成X0;因此,目标函数比较了预测噪声∈θxt,t与应用噪声ε之间的差异: 此外,通过神经网络预测x0而不是噪声ε来修改μθxt,t:μθxt,t=γtfθxt,t+δtxt10其中,fθxt,t是由θ参数化的神经网络,它预测无噪声数据x0;在这种情况下,目标函数变为: 具体来说,给定一个干净的数据样本按照正向过程中的公式4采样具有相同形状的 然后,训练一个网络来预测无噪声数据,其MSE目标函数如下所示: 其中的Fp即S1中提取的超声图片特征;在推理过程中,使用训练后的神经网络经过t=T,…,1的过程按照公式14逐步预测较小的噪声样本来生成新的SDF体素: S3-3:扩散过程使用的是一个类U形网络,每一层的体素特征分辨率减半,通道加倍;为了使生成的SDF场表示的物体与超声图像保持一致,需要在扩散过程中对SDF特征和超声图像特征进行融合,让超声图像特征指导SDF扩散过程;状态空间模型将将一个一维的序列xt通过一个隐藏状态ht映射至yt,这个系统使用A作为演化参数,B、C作为投影参数:h′t=Aht+Bxt15yt=Cht16Mamba中包括一个时间尺度参数Δ将连续参数A、B转换为离散参数常用的变换方法是零阶保持,定义如下: 在离散之后,公式1516表示为: yt=Cht20最后,模型通过全局卷积计算输出: 其中M是输入序列x的长度,是结构化卷积核;为了融合超声图像特征与体素特征,将超声图像特征Fp经过线性映射至与体素特征相同的通道数后与体素特征连接,得到SSM的输入x;经过上述Mamba的计算后得到输出y,将体素特征部分取出后将一维序列重塑回体素特征的原形状,得到融合超声图像特征后的体素特征;S3-4:体素特征经过模型的顶部后,进行下采样使体素特征的分辨率下降,通道数增加,整体数据量减少,在体素分辨率较小的阶段使用交叉注意力对体素特征和超声图像特征进行融合;同时计算一组查询的注意力函数,打包成一个矩阵Q,键和值也打包到矩阵K和V中;计算输出矩为: 使用公式如下:MultiHeadQ,K,V=Concathead1,...,headhWO24headi=AttentionQWiQ,KWiK,VWiV25其中concat表示拼接操作,WO、WiQ、WiK、WiV均是可学习的权重矩阵;对于网格中的体素v,将其中心投影到图像上,得到投影坐标P;选择靠近P的相邻图像块与v交互,邻域图像补丁集用NV表示,选择如下:如果P与Pj中心之间的距离小于距离阈值dδ,则补丁Pj属于NV;使用多头自注意力对v处的体素特征fV和属于NV中的补丁的超声图像补丁特征集fI之间的特征交互进行建模,如下所示:Q=fVWQ,K=fNWK,V=fNWV26 这里,MultiHead·是标准的多头注意力操作,WQ、WK、WV是可学习的矩阵,M是视图投影引起的注意力计算的掩码,对体素和超声图像块使用绝对位置编码;S3-5:经过交叉注意力后进一步将超声图像特征与体素特征进行了融合,此时输出的体素特征就是高精度的SDF场;S4:使用行进立方体提取网格,最终重建完成由超声图像指导的三角形网格模型。
全文数据:
权利要求:
百度查询: 中国海洋大学 一种基于SDF扩散的医学超声影像三维重建方法和系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。