Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种基于裁剪视口显示的工艺简图编制方法及系统,该方法包括:创建零件页面和工序页面,在目标工序所对应的工序页面中选取工艺简图区域建立所述零件页面的链接;在所述工艺简图区域中通过所述零件页面的链接,加载所述零件页面中零件图纸的原始图...
  • 本申请公开了一种基于语义负向约束文档图像分组方法、系统、设备及介质,该方法通过提取所有待分组文档图像的全局视觉特征;计算两张待分组文档图像之间的第一余弦相似度,基于第一余弦相似度对所有待分组文档图像进行粗分组,得到粗分组结果;通过多个约束条...
  • 本申请公开面向多文档批处理的标题级语义分块方法及设备,其中该方法包括:获取待处理的多篇输入文档,并将多篇输入文档加入文档处理任务队列;为文档处理任务队列中的文档视觉识别任务分配配额,以得到文档的页面识别文本及结构化内容;在多篇输入文档的全部...
  • 本发明公开一种基于线条检测约束的表格图像的自动化重建方法,包括:利用PD‑LSD算法提取图片中的表格线段;将得到表格线段端点进行合并处理得到表格的线段交点;对各交点进行筛选,得到表格中各单元格的代表点坐标;利用得到的代表点坐标,搭建html...
  • 本申请涉及文档信息处理技术领域,提供一种基于混合策略的公告PDF表格检测与识别方法及系统,方法包括:并行使用规则驱动工具与深度学习模型提取表格数据,得到包含坐标与文本的两套结果;以深度学习模型的坐标为准进行数据对齐与一致性校验,当文本不一致...
  • 本申请涉及计算机技术领域,提供一种表格识别方法、装置和电子设备,其中的表格识别方法,包括:获取待识别表格图像;将所述待识别表格图像作为源图像,输入已训练的多模态大语言表格识别模型,得到表格辨识结果;所述多模态大语言表格识别模型是采用训练样本...
  • 一种跨平台侵权实时监测与取证方法、系统、产品和介质,涉及模式比对领域。该方法包括:接收原始数据图表图像和疑似侵权数据图表图像,并分别提取近似数值信息;分别将原始数据图表图像和疑似侵权数据图表图像离散为预设数量的等宽区间;根据各近似数值信息得...
  • 本发明公开了一种图像文本检测方法、系统、终端及存储介质,所述方法包括:接收用户上传的图像文件,调用核心处理函数进行图像处理;加载预训练的YOLO模型进行文本区域检测,生成边界框,对边界框进行过滤和去除处理,得到最优检测结果;基于最优检测结果...
  • 本发明公开了一种目标用户的书写障碍检测处理方法、系统、终端及存储介质,所述方法包括:获取目标用户的监护人员上传的文本内容,根据文本内容生成书写任务,并获取目标用户完成书写任务时的书写结果;对书写结果进行检测处理得到书写障碍检测结果,并根据书...
  • 本发明公开了一种基于图像语义分割网络的打印机图像数据处理系统,包括获取模块,获取打印机图像数据;预处理模块,对打印机图像数据执行预处理,得到预处理图像;第一语义分割子网络PSPNet,输出第一语义特征图;第二语义分割子网络改进型BiSeNe...
  • 本说明书实施例公开了一种文本检测模型训练、文本检测、OCR识别方法及装置。该训练方法在文本检测模型中增加了一个三维角度表示向量预测分支,用于预测文本行的三维角度表示向量,当文本检测模型训练成功后,从输入的文本图像中提取每个文本行的外接旋转矩...
  • 本发明公开了基于多模态模型的海报Logo自动提取方法及终端,涉及图像处理技术领域,包括:获取影视剧海报图像,并获取影片名称;通过多模态大模型进行分析,确定Logo所在位置、以及Logo主体关键特征属性,以及与影片名称的匹配关系; 并自动生成...
  • 本申请提出一种基于AI、RPA、LLM和AI Agent的文件处理方法、装置和设备,涉及AI、RPA和AI Agent领域。方法包括:获取待处理的电子文件;分别采用多个目标视觉识别模型对电子文件进行视觉识别,以生成第一属性标签集;采用LLM...
  • 本申请涉及图像处理技术领域,公开了一种复杂背景文字提取方法、装置、设备及计算机存储介质,该方法包括:基于待处理图像构建颜色矩阵,颜色矩阵包含待处理图像中的每个像素点的颜色信息;对颜色矩阵进行分块处理得到多个子块;对每个子块执行像素分类处理,...
  • 本申请实施例提供了一种图像识别精度增强方法及系统,能够解决在OCR技术应用中,当面对包含低分辨率、小字号且多尺度文字特征的图像时,常因图像自身质量不足而导致识别准确率显著下降。该方法包括:对获取到的原始文字图像的边界区域进行动态扩展,以使包...
  • 本发明公开了一种基于字符级扰动的中文文本模型安全评估方法,涉及文本处理及安全技术领域,包括:通过插槽扩展建模方法以及类别间置信度差确定第一文本的目标扰动位置;根据第一文本的目标扰动位置,确定多个扰动方式,通过多个扰动方式对待评估文本处理,得...
  • 本发明属于练字领域,公开了一种练字警示方法、设备、装置及介质,方法包括:获取用户在绘写区内的触摸事件,触摸事件包括至少两项子事件,确定各子事件对应的触摸点坐标;基于预设绘制算法和触摸点坐标绘制书写图案;判断绘制的书写图案在警示区外是否存在的...
  • 本发明公开了一种目标检测边界框标签平滑方法,涉及目标检测技术领域,包括以下步骤:获取包含多个边界框标注的训练数据集,其中边界框标注包含因人工标注引入的定位误差;确定平滑策略及对应的一个或多个平滑因子,所述平滑因子为缩放比例系数,用于调整边界...
  • 本发明公开了基于图像识别与大语言模型的文本生成方法及系统,涉及文本生成技术领域,包括:对多视角图像序列进行时间校正与线性插值对齐,提取实体、区域与状态等视觉要素,形成视觉证据包,并一对一映射为证据绑定锚;按实体与时序构建统一实体时间线初稿,...
  • 本发明提供基于机器视觉的SMT元件缺陷实时检测与分类识别方法,涉及机器视觉技术领域,包括获取候选缺陷区域图像,提取多粒度语义特征构建视觉语义图;通过计算语义单元对的协同相关性与当前相关性,检测视觉矛盾并编码为矛盾向量;将矛盾向量转换为嵌入向...
技术分类