Document
拖动滑块完成拼图
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明涉及图像处理及深度学习技术领域,可应用于金融及医疗领域,公开了一种用于大模型RAG的图片解析方法、装置、设备及介质。方法包括:获取图片;使用文本检测模型识别图片中的文本框位置信息;根据文本框位置信息截取图片中的文本区域,使用文本识别模...
  • 本申请公开一种图像匹配方法和设备,方法包括,获得具有第一分辨率的第一图像;将具有第一分辨率的第一图像输入目标模型,获得目标模型处理得到的第一图像特征;根据第一图像特征,从图库中匹配得到第二图像,第二图像包括多张子图像拼接形成的第二拼接图像,...
  • 本公开提供了一种图像检索方法及电子设备,图像检索方法包括:根据输入问题生成问题向量;根据问题向量,从多个图像中确定至少一个目标图像,其中,多个图像中的各图像包括至少一个图块,各图像的不同图块表征不同语义,目标图像包括至少一个目标图块,目标图...
  • 本申请公开了一种检索方法及装置,该方法包括:获得查询语句;从查询语句中提取目标词性的文本特征;获取目标词性的文本特征匹配的局部图像特征;局部图像特征来自于特征库;至少基于局部图像特征,在图像库中检索目标图像。
  • 本申请涉及人工智能领域,公开了一种基于跨模态大模型的文件信息提取方法及装置。方法包括:获取文件信息;基于所述文件信息获取图片;利用大模型分析处理所述图片,获得目标图片;将所述目标图片存储入库。通过利用大模型自动对图片进行识别并分类,从而能够...
  • 本公开提供了一种车道线图像检索方法、装置、介质及车辆,方法包括:接收用户输入的图像检索指令;图像检索指令包括目标标签和目标提示词;基于目标标签从目标检索库中获取第一图像集合;第一图像集合为目标检索库中标签与目标标签匹配的车道线图像组成的集合...
  • 本发明公开了多尺度背景分割与检索方法、装置、计算机设备及存储介质,所述方法包括:对输入图像进行预处理,以得到预处理图像;将预处理图像输入至尺度感知剪枝特征金字塔,以生成多尺度剪枝特征;对多尺度剪枝特征进行跨尺度注意力权重计算,以得到融合特征...
  • 本公开提供一种海上交通数据集自动构建装置及方法。该海上交通数据集自动构建方法包括:收集海上图像数据的步骤;从收集的图像数据中检测对象的步骤;收集海上数字/文本数据的步骤;利用收集的数字/文本数据,通过电子海图展示海上交通数据,并提取电子海图...
  • 本发明提供一种生成式文本与图像的跨模态检索方法以及装置,应用于信息检索技术领域,其中,包括:将图像候选集中的图像样本输入至多模态大语言模型的视觉编码器,得到离散图像令牌序列;基于离散图像令牌序列进行图像令牌字典树构建,得到图像令牌字典树;基...
  • 本发明公开了一种基于视觉‑文本智能体的生成式跨模态检索方法及系统,包括:获取图像特征,构建图像结构化标识符;对多模态大语言模型进行微调,学习图像特征与结构化标识符的语义关系,学习结构化标识符与用户的查询输入之间的语义关系;基于多模态大语言模...
  • 本发明属于织物图像检索方法领域,涉及一种基于遗传算法的格子织物图像检索相关反馈方法,包括以下步骤:建立格子织物图像检索数据集;设计格子织物图像低阶和高阶特征;利用权重分配的方法进行低阶和高阶特征的联合,进行特征的相似性度量,给出初始检索结果...
  • 本发明公开了一种基于标识的工业设备异常音频数据登记方法及系统,本方法包括:1)系统为每一注册用户分配一个唯一用户id,并为注册用户提供可下载离线使用的音频指纹程序;2)注册用户通过音频指纹程序选取所需进行数据登记的音频文件,并生成该音频文件...
  • 本发明涉及歌词文本分析技术领域,具体公开了一种基于音乐推荐的歌词文本分析方法,包括以下步骤:步骤S1:建立包含发音音频的音频库,获取歌曲的歌词文本及对应音频;将歌词文本划分为若干字段,并在歌曲音频中截取各字段对应的音频段,为后续特征提取做准...
  • 本申请实施例涉及互联网技术,公开了一种素材管理方法、系统、服务器、存储介质及程序产品,能够提高素材管理效率和检索效率。该方法包括:使用素材对预置视频进行渲染,得到渲染视频;解析渲染视频生成素材的结构化信息,结构化信息用于描述素材的内容;基于...
  • 本发明提供一种视频问答任务的执行方法、装置以及电子设备,涉及人工智能技术领域。其中,视频问答任务的执行方法包括:获取待提取视频和包含视频问答任务的问题文本;利用多模态大模型,根据问题文本,从待提取视频中提取与视频问答任务匹配的视频片段;其中...
  • 本发明提供一种视频片段识别方法、装置、设备、存储介质及程序产品,涉及数据处理技术领域,该方法包括:获取查询文本和待识别视频,查询文本用于查询待识别视频包括的第一视频片段;基于查询文本确定P个视频片段,P个视频片段为待识别视频包括的多个片段中...
  • 本申请实施例提供了一种解说视频推荐方法、装置、设备、介质及计算机程序产品,该方法包括:获取用户解说视频点击序列和候选解说视频集中的候选解说视频,并输入到解说视频推荐模型,所述用户解说视频点击序列是由用户观看过的解说视频构成的序列;通过所述解...
  • 本发明公开了一种基于互联网教育平台的资源共享方法,涉及互联网资源技术领域,包括响应于学习者完成目标资源的学习操作,获取学习效果反馈数据,学习效果反馈数据至少包括目标资源的学习时长、习题作答正确率或视频重复观看次数;根据学习时长与目标资源的预...
  • 本发明公开了一种基于图对比学习的短视频推荐方法及系统,将短视频输入到视频推荐模型中生成用户对于短视频的偏好;视频推荐模型的训练过程如下:构建用户‑创作者交互图和用户‑短视频交互图;对用户‑创作者交互图按创作者内容领域聚类划分子图,并对每个子...
  • 本申请涉及一种要点摘要视频生成方法、装置、设备及计算机可读介质。该方法包括:获取目标视频,并提取目标视频的文本数据,其中,目标视频为知识密集型视频;基于文本数据构建目标视频的知识图谱;确定知识图谱中的核心知识节点,并在知识图谱中定位出与核心...
技术分类