八大检索
快速检索
高级检索
图片检索
批量检索
AI语义检索
IPC检索
LOC检索
中国专利复审无效检索
产品+服务
热门服务
年费省心管
用专利管家帮您管理
盯紧竞争对手
让情报监控跟踪对手
布局专利导航
让甬知汇按需出方案
产品
专利检索
快速检索 高级检索
批量检索 AI语义检索
LOC检索 IPC检索
中国专利复审无效检索 图片检索
高级功能
专利管家
风险监控
侵权分析
工作空间
数据分析
分析报告
AI交底书
服务
知识产权企业服务、政府服务
企业专利导航报告 专利检索报告 专利预警分析报告 企业知识产权战略规划 重点产品/关键技术分析报告
企业专利管家 专利布局报告 专利价值评估报告 企业知识产权贯标服务 政府专利创新服务
企业专利数据库 专利侵权比对 专利无效证据检索 竞争对手专利分析报告 区域专利监控系统
专利申请
中文
  • 中文
  • English
  • 日本語
  • 한글
使用指引
登录
注册
0/0

发明公开 CN120182881A 一种基于跨模态融合和可学习权重的视频非刚体运动目标分割方法  审中-公开

基本信息 权利要求书 说明书全文 PDF全文 法律信息 相似专利 专利引用 案件信息 同族数据
一种基于跨模态融合和可学习权重的视频非刚体运动目标分割方法
基本信息:
  • 专利标题: 一种基于跨模态融合和可学习权重的视频非刚体运动目标分割方法
  • 申请号:CN202510041084.1 申请日:2025-01-10
  • 公开(公告)号:CN120182881A 公开(公告)日:2025-06-20
  • 发明人: 石凡 , 李佩珊 , 王绵沼
  • 申请人: 天津理工大学
  • 申请人地址: 天津市西青区宾水西道391号
  • 专利权人: 天津理工大学
  • 当前专利权人: 天津理工大学
  • 当前专利权人地址: 天津市西青区宾水西道391号
  • 主分类号: G06V20/40
  • IPC分类号: G06V20/40 ; G06V10/26 ; G06V10/80 ; G06V10/82 ; G06T7/557 ; G06N3/0455 ; G06N3/0464 ; G06N3/084
摘要:
本发明涉及一种基于跨模态融合和可学习权重的视频非刚体运动目标分割方法,首先采用优化旋转平行四边形算子与极平面图像技术对光场图像中的多视角数据进行处理,提取光场特征。得到的光场信息作为输入,将RGB特征与光场特征通过加权特征融合网络有效结合这两种模态的信息,强化图像的几何特征。在分割过程中,光场深度特征图与标签权重预测图相结合,得到最终的权重预测。将预测的权重图、标签预测器预测的标签以及当前帧的跨模态融合特征图,输入进少样本学习器中,通过反向传播算法更新目标模型的参数,自适应地调整标签权重,为后续帧中的分割任务提供指导。最后,将目标模型输出的掩码编码以及融合特征一起输入进解码器中,生成最终的分割结果图。本发明提出的方法能够将非刚体目标在低光且有遮挡的场景下分割出准确的结果,且只需要少量的数据集,减少了视频分割数据集的标注成本。

信息查询:
中国专利公布公告 审查信息 Global Dossier Espacenet
IPC结构图谱:
G 物理
--G06 计算;推算;计数
----G06V 图像或视频识别或理解 笔记 1.本子类涵盖: 特别适用于图像或视频的模式识别或机器学习的方法或安排。 2.在本小类中,下列术语或表述的使用具有指明的含义: “模式识别”是指通过获取、预处理或提取显着特征并对这些特征或其表示进行匹配、聚类或分类,对模式进行检测、分类、认证和识别,以用于解释目的或在图像或视频中推导出某种含义; “特征提取”是指从图像或视频中得出描述性或定量的度量; “聚类”是指根据模式的(不同)相似性或接近程度对模式进行分组或分离; “分类”是指通过分配标签将对象/特征识别为属于一类对象/特征。 3.在本小类中,归入G06V20/00-G06V40/00组的主题,如果识别依赖于获取或预处理阶段的特定处理,则也分别归入G06V10/10或G06V10/20组。
------G06V20/00 场景;特定场景元素
--------G06V20/40 .在视频内容中(提取叠加文本G06V20/62)(视频检索G06F16/70)(在视频服务器中处理视频基本流H04N21/234)

甬知汇

最新中国发明专利 最新美国发明专利 技术领域 专利库 专利分类库 国际专利分类库

热门服务

找代理 排行榜 大学排行榜 专利百科
Copyright © 2019-2025 宁波甬知汇知识产权有限公司 浙ICP备2022009020号