八大检索
快速检索
高级检索
图片检索
批量检索
AI语义检索
IPC检索
LOC检索
中国专利复审无效检索
产品+服务
热门服务
年费省心管
用专利管家帮您管理
盯紧竞争对手
让情报监控跟踪对手
布局专利导航
让甬知汇按需出方案
产品
专利检索
快速检索 高级检索
批量检索 AI语义检索
LOC检索 IPC检索
中国专利复审无效检索 图片检索
高级功能
专利管家
风险监控
侵权分析
工作空间
数据分析
分析报告
AI交底书
服务
知识产权企业服务、政府服务
企业专利导航报告 专利检索报告 专利预警分析报告 企业知识产权战略规划 重点产品/关键技术分析报告
企业专利管家 专利布局报告 专利价值评估报告 企业知识产权贯标服务 政府专利创新服务
企业专利数据库 专利侵权比对 专利无效证据检索 竞争对手专利分析报告 区域专利监控系统
专利申请
中文
  • 中文
  • English
  • 日本語
  • 한글
使用指引
登录
注册
0/0

发明授权 CN116778382B 基于实例分割辅助信息的多模态海洋场景视频描述算法  有权

基本信息 权利要求书 说明书全文 PDF全文 法律信息 相似专利 专利引用 案件信息 同族数据
基于实例分割辅助信息的多模态海洋场景视频描述算法
基本信息:
  • 专利标题: 基于实例分割辅助信息的多模态海洋场景视频描述算法
  • 申请号:CN202310727600.7 申请日:2023-06-19
  • 公开(公告)号:CN116778382B 公开(公告)日:2025-06-10
  • 发明人: 赵萌 , 陈薪宇 , 张蒙恩
  • 申请人: 天津理工大学
  • 申请人地址: 天津市西青区宾水西道391号
  • 专利权人: 天津理工大学
  • 当前专利权人: 天津理工大学
  • 当前专利权人地址: 天津市西青区宾水西道391号
  • 代理机构: 北京首捷专利代理有限公司
  • 代理人: 梁婧宇
  • 主分类号: G06V20/40
  • IPC分类号: G06V20/40 ; G06V10/40 ; G06V10/80 ; G06V10/82 ; G06F16/783 ; G06F16/74 ; G06N3/0455 ; G06N3/084 ; G06N3/08
摘要:
本发明提出了一种基于实例分割辅助信息的多模态海洋场景视频描述算法,该方法首先使用特征提取器对视频文本两个模态数据进行特征提取,将两个模态的特征送入多模态交互编码器进行融合、交互、和对齐后得到多模态全局信息特征,同时使用实例分割网络将视频中的前景主体信息和背景信息分割,制作辅助信息字典,对其进行特征提取得到辅助信息特征,多模态全局信息特征和辅助信息特征对比学习后送入语言解码器进行解码,生成描述语句。通过提取海洋视频的多模态全局语义信息和辅助语义信息,加强网络对于视频的理解和认知,增强视频文本之间的关联,促使生成的描述语句涵盖海洋场景视频中的全部内容,并且描述具有高质量、高流畅度的特性。

公开/授权文献:
  • CN116778382A  基于实例分割辅助信息的多模态海洋场景视频描述算法 公开/授权日:2023-09-19
信息查询:
中国专利公布公告 审查信息 Global Dossier Espacenet
IPC结构图谱:
G 物理
--G06 计算;推算;计数
----G06V 图像或视频识别或理解 笔记 1.本子类涵盖: 特别适用于图像或视频的模式识别或机器学习的方法或安排。 2.在本小类中,下列术语或表述的使用具有指明的含义: “模式识别”是指通过获取、预处理或提取显着特征并对这些特征或其表示进行匹配、聚类或分类,对模式进行检测、分类、认证和识别,以用于解释目的或在图像或视频中推导出某种含义; “特征提取”是指从图像或视频中得出描述性或定量的度量; “聚类”是指根据模式的(不同)相似性或接近程度对模式进行分组或分离; “分类”是指通过分配标签将对象/特征识别为属于一类对象/特征。 3.在本小类中,归入G06V20/00-G06V40/00组的主题,如果识别依赖于获取或预处理阶段的特定处理,则也分别归入G06V10/10或G06V10/20组。
------G06V20/00 场景;特定场景元素
--------G06V20/40 .在视频内容中(提取叠加文本G06V20/62)(视频检索G06F16/70)(在视频服务器中处理视频基本流H04N21/234)

甬知汇

最新中国发明专利 最新美国发明专利 技术领域 专利库 专利分类库 国际专利分类库

热门服务

找代理 排行榜 大学排行榜 专利百科
Copyright © 2019-2025 宁波甬知汇知识产权有限公司 浙ICP备2022009020号