Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于姿态识别的精准定位方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:范修睿

摘要:本发明涉及基于姿态识别的精准定位领域,具体为一种基于姿态识别的精准定位方法及系统,精准定位方法包括S1、设备安装;S2、图像采集处理;S3、构建精准定位模型;S4、给精准定位模型设计损失函数;S5、对精准定位模型进行训练,得到精准定位训练模型;S6、对精准定位训练模型进行验证;S7、对精准定位训练模型进行优化;S8、利用精准定位优化模型对采集到的原始患者全身图图像进行处理分析,以对患者的各器官进行精准定位。本发明通过利用摄像头对特定区域进行扫描,然后构建精准定位模型,并对精准定位模型进行训练、验证以及优化,最后利用优化后的模型对患者的原始患者全身图图像进行姿势识别,从而精准定位患者的各器官的位置。

主权项:1.一种基于姿态识别的精准定位方法,其特征在于,包括以下步骤:S1、设备安装:在床的两侧设置等间距的标志点,并在床的正上方设置摄像头,使摄像头能够对正下方以及斜下方区域内进行拍摄;S2、图像采集处理:图像采集,匀速移动床,使摄像头采集患者全身图,并生成原始患者全身图图像,原始患者全身图图像包括患者仰卧姿势原始患者全身图图像和俯卧姿势原始患者全身图图像;图像处理:器官标注,对原始患者全身图图像的各个器官进行标注;格式转换,先后对原始患者全身图图像进行格式转换和数据归一化,归一化患者全身图图像;图像增强,对归一化患者全身图图像进行颜色变换、高级变换及组合增强,得到增强患者全身图图像;S3、模型构建:基于增强患者全身图图像构建精准定位模型;精准定位模型包括:1、输入层;输入图像格式:输入层接受固定大小的图像,图像通过预处理归一化到相同的大小和分辨率;输入通道:通常输入图像包含三个通道,三个通道分别为宽度通道、高度通道和颜色通道;2、卷积层;特征提取:卷积层通过卷积核进行特征提取,提取低层次的边缘、纹理特征,再逐层提取高层次的语义特征;卷积核尺寸:使用3x3或5x5的卷积核;激活函数:使用非线性激活函数增加网络的非线性表示能力;3、池化层;下采样:池化层通过最大池化或平均池化操作,对特征图进行下采样,减少计算量,保留重要特征;池化窗口:使用2x2的池化窗口,通过逐步下采样压缩特征图的空间尺寸;4、跳跃连接;残差连接:在特定层之间添加残差连接,直接将前一层的输出加到后一层的输入上;5、全连接层;特征映射:若干个全连接层将卷积层提取的特征映射到具体的输出空间,生成各个器官的预测区域;输出维度:根据需要预测的边界框数量和每个边界框的参数,确定全连接层的输出维度;6、输出层;边界框预测:输出层通过多个边界框预测器,预测每个器官的具体位置和范围,边界框通常以x,y,w,h的形式表示,其中,x,y为中心坐标,w,h为宽度和高度;置信度分数:每个边界框还会输出一个置信度分数,表示该预测的可信度;类别概率:输出每个边界框所属的类别概率分布,确定具体的器官类别;S4、给精准定位模型设计损失函数;损失函数包括:1、位置损失;回归损失:使用L1与L2的损失加权来计算预测边界框与真实边界框之间的误差,其中,位置损失的公式为:位置损失=∑i∣pi-gi∣\text{位置损失}=\sum_{i}\left|p_i-g_i\right|位置损失=∑i∣pi-gi∣;或者,位置损失=∑ipi-gi2\text{位置损失}=\sum_{i}\leftp_i-g_i\right^2位置损失=∑ipi-gi2,其中,pip_ipi为预测边界框参数,gig_igi为真实边界框参数;2、分类损失;交叉熵损失:使用交叉熵损失计算预测类别与真实类别之间的误差,交叉熵损失用于衡量两个概率分布之间的差异;其中,分类损失的公式为: 分类损失=-∑igilogpi,其中,pip_ipi为预测类别概率,gig_igi为真实类别的one-hot编码;3、置信度损失;均方误差:使用均方误差计算预测置信度与真实置信度之间的误差,均方误差用于衡量预测值与真实值之间的平方差;置信度损失的公式为:置信度损失=1N∑ipi-gi2\text{置信度损失}=\frac{1}{N}\sum_{i}\leftp_i-g_i\right^2置信度损失=N1∑ipi-gi2,其中,pip_ipi为预测置信度,gig_igi为真实置信度,NNN为样本数量;4、总损失;加权总损失:综合位置损失、分类损失和置信度损失,对位置损失、分类损失和置信度损失进行加权,形成总损失,用于指导模型的优化,总损失可以根据具体需求进行对各部分损失进行加权组合;其中,总损失的公式为:总损失=α位置损失+β分类损失+γ置信度损失\text{总损失}=\alpha\cdot\text{位置损失}+\beta\cdot\text{分类损失}+\gamma\cdot\text{置信度损失}总损失=α位置损失+β分类损失+γ置信度损失,其中,α\alphaα、β\betaβ和γ\gammaγ为加权系数,调整各部分损失在总损失中的权重;S5、对精准定位模型进行训练,得到精准定位训练模型;对精准定位模型进行训练包括以下步骤:1、数据预处理;图像归一化:将输入图像的像素值归一化到0-1范围,标准化图像数据,确保输入一致性;数据增强:在训练过程中,对图像进行随机裁剪、旋转、翻转和缩放操作,增加数据的多样性;2、批量训练;小批量训练:将训练数据分成若干小批次,每批次输入模型进行前向传播和反向传播,更新精准定位模型参数;批量大小:选择合适的批量大小,使训练过程中GPUCPU的高效利用;3、优化算法;随机梯度下降:使用SGD优化算法最小化损失函数,通过逐步调整精准定位模型权重和偏置,对精准定位模型的参数进行优化;动量方法:引入动量项,结合前几次梯度的方向,平滑梯度更新,减少振荡,加速收敛;Adam优化器:使用Adam优化器结合动量和自适应学习率调整;4、超参数调整;学习率:选择合适的学习率,使精准定位模型参数的稳定更新;正则化:引入正则化项防止精准定位模型过拟合,增强精准定位模型的泛化能力;批量大小:调整批量大小,平衡训练速度和稳定性,使精准定位模型有效训练;得到精准定位训练模型;S6、对精准定位训练模型进行验证,对精准定位训练模型进行验证包括以下步骤:1、验证数据集;独立验证集:使用独立于训练集的数据集评估精准定位训练模型性能,使精准定位训练模型在未见过的数据上具有良好的泛化能力;验证数据准备:对验证数据进行与训练数据相同的预处理和归一化操作,确保输入数据的一致性;2、指标评估;准确率:衡量精准定位训练模型预测结果的准确性,计算正确预测的比例;召回率:衡量精准定位训练模型对真实正样本的召回能力,计算正确预测的正样本比例;F1分数:结合准确率和召回率的综合指标,衡量精准定位训练模型的整体性能;IOU交并比:计算预测边界框与真实边界框的重叠区域与联合区域的比值,衡量边界框预测的准确性;3、早停策略;验证损失监控:监控验证集上的损失变化,若验证损失在若干轮训练后不再降低,则提前终止训练,防止精准定位训练模型过拟合;模型保存:保存验证损失最低时的模型参数,确保最终精准定位训练模型的最佳性能;S7、对精准定位训练模型进行优化,对精准定位训练模型剪枝,得到精准定位优化模型;对精准定位训练模型进行优化包括以下步骤:1、权重剪枝:根据权重的重要性,对权重进行剪枝,去除低重要性的权重;权重重要性评估:计算每个权重的绝对值或平方值,衡量绝对值或平方值对模型输出的影响;剪枝策略:设置剪枝阈值,将低于阈值的权重置零,保留高重要性的权重;微调训练:剪枝后对模型进行微调训练,恢复模型性能,确保剪枝对模型精度的影响最小;2、滤波器剪枝:根据卷积核的重要性,对卷积层的滤波器进行剪枝,减少卷积操作的计算量;滤波器重要性评估:计算每个滤波器的L1范数或L2范数,衡量L1范数或L2范数对特征提取的贡献;剪枝策略:设置剪枝比例,去除贡献较小的滤波器,保留主要特征的滤波器;微调训练:剪枝后对模型进行微调训练,恢复模型性能,确保剪枝对特征提取能力的影响最小;S8、利用精准定位优化模型对采集到的原始患者全身图图像进行处理分析,以对患者的各器官进行精准定位。

全文数据:

权利要求:

百度查询: 范修睿 一种基于姿态识别的精准定位方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。