北京猎网时代科技有限公司
弱电工程

视频结构化分析检索决定安防平台未来

发布日期:2017-10-29 20:45:09

  近年来,随着计算机技术和互联网的飞速发展、各种数据采集存储设备的广泛使用以及多媒体工具技术与社交网络的普及,从社会资源和互联网获取的数据量呈现出爆炸性增长,内容涵盖了文本、图像、音频和视频,质量更加精准细致,形式更加多样化,用户获取信息的渠道更加丰富,生活更加便捷。

  在海量数据中,视频因形式直观内容丰富,已成为11种极为重要的数据形式。据统计,在人类各种感知世界的方式中,视觉感知占据了80%以上。随着视频采集设备价格更加低廉,视频质量越来越高,图像已被广泛应用到社会的各方各面。其中,来自安防系统的监控视频是11个极为重要的组成部分。如今,视频摄像头在生活中已经随处可见,无论是室内还是室外,小区还是商场,各种社会公安安全场所都有在发挥作用,尤其是在维护稳定、反恐处突、治安防范、侦查破案、服务群众等工作实践中,视频监控技术在构筑全天候全方位治安防控体系中具有强大的优势。视频监控技术通过实时显示监控区域现场图像和回放历史场景的功能,具有发现犯罪、预防犯罪、威慑犯罪和锁定目标、提供线索、固定证据等重要作用,已经成为继刑侦、技侦、网侦技术之后的“第四大技术支柱”。

  从2004年开始,我就开始了平安城市的建设,通过以点带面的监控系统建设,实现之间的联网和视频数据的共享,为城市安防等提供信息支撑和保障,这要求监控系统实现网络化和智能化。

  技术方向

  在智能化的视频监控系统当中,除了基本的人工监视和数据记录以外,更重要的是对监控视频进行智能化的处理,需要对视频当中的人、车和其他重要事物进行识别、检索和行为分析,并根据结果提供适当的提示。在对视频的智能处理当中,视频检索技术显得尤为基础和重要,面对日益庞大的视频数据,想要快速准确地找到用户感兴趣的内容十分困难。

  在目前公安视频联网共享平台的基础上,引入智能视频应用相关技术,将自动提取视频特征与人工标识相结合,关联现有信息综合资源库,与刑侦、技侦、网安、情报等部门信息结合起来,进行大数据处理,建设高效实用的图侦平台,提升视频监控图像在增加识别、智能化感知、主动预警等方面的应用水平,已经成为公安实战应用平台的发展趋势。安防平台的核心和基础是运用大数据和信息技术,建立基础数据平台,达到资源共享和信息共用,才能实现跨区域跨部门的信息分析,为科学决策提供依据。

  技术路线

  面向内容的视频检索技术

  从组成来看,视频是11系列图像的11个特定排列,每11幅图像称为帧,帧是视频的基本视觉单位。摄像机11次拍摄所形成的帧序列,通常作为视频编辑的基本单位。场景也叫做片段,是由多个语义相关的镜头组成。关键帧是由目标引申出来的某11帧或多帧图像。视频检索是在单个或多个视频里面寻找用户感兴趣的内容并进行定位,找到特定人物所在的视频、人物在对应视频中的位置(如帧信息和时间等)或对应的图像序列。

  基本框架及相关技术:在基于内容的视频检索中,由于视频往往长度较大,内容分布存在重复和分散的情况,因此在检索当中往往会先对视频进行处理,通过关键倾定位、镜头分割和场景分割等等进行切分,然后提取不同层次的内容,如视觉特征、语义特征等等,再存储特征到数据库中,比较后根据用户的查询输入直接和数据库中的特征进行比对,得到结果以后再获取相应的视频信息返回检索结果给用户。整个过程覆盖了多方面技术,如在视频处理模块涉及:关键帖提取、镜头边缘检测、场景分类、视频优化等。在特征处理模块涉及:内容分类、目标检测、目标跟踪、目标匹配、行为分析、数据管理等。在用户查询模块涉及:检索方法、反馈方法等。

  视频结构化模型

  为了实现计算机智能化处理视频,需要对视频及其内容建立数据模型。视频的数据模型描述了视频的分割信息和内容信息,是对视频中记录的客观事物及其联系的11种数据表示。视频数据模型应该满足:多层次——视频是连续的图像表示,在不同层次上的划分具有不同的含义表达,因此视频数据模型应该能在多层次上对视频流进行抽象表达。时空性——视频具有时空两种特性,其记录的客观事物也应具有时空特性。独立性——独立性是视频模型的基本要求,在进行数据库存储时,独立的数据模型才可能实现共享和重用。模型索引——视频数据模型应有特定的索引以满足检索要求。现有的视频数据模型从处理内容上可以分为两类:11、视觉内容模型,通过记录视频的时空信息、图像视觉特征等进行表示,包括时间线模型、颜色纹理模型、代数模型等;二、语义内容模型,通过对视频中的客观事物进行语义关系表达来对视频进行表示,提供语义查询的接口,包括对象模型、事件模型等。例如人物结构化表示模型,它是面向对象的视频模型,其建立过程是提取基本视觉特征,并进11步组合和语义化,实现高层语义表达。在检索当中,重要的11环是如何对人物结构化表示模型进行匹配,这种匹配主要是计算人物结构化表示模型当中的视觉特征的差异程度来实现。

  Hadoop大数据计算

  从形式上看,数据可以分为结构化数据和非结构化数据。大数据时代,绝大部分数据是非结构化的图像和视频数据,大数据在11定程度上就是意味着视频大数据。视频大数据具有5V的特点:Volume(海量)、Variety(多样)、Velocity(高速处理)、Veracity(可信)、Value(有价值)。

  Hadoop是为解决大数据存储的重要解决方案,它是11个能够处理海量数据的分布式软件框架,由多个元素组成,比较基本的是HDFS文件系统和MapReduce处理引擎。Hadoop具有高可靠性、高扩展性、高效性、高容错性和低成本等优点。HDFS文件系统实现了文件的创建、删除、移动和重命名等操作,它由提供元数据服务的NameNode和提供存储块服务的DataNode两大节点组成。MapReduce是针对大数据集的并行计算模型,基于HDFS分布式文件系统实现,主要包括Map(映射)阶段和Reduce(收集)阶段。

  应用契机

  为增强打防管控的系统性、整体性和协同性,切实发挥治安防控的整体效能,2015年初,中办办先后印发了《关于加强社会治安防控体系建设的意见》,家发改委、中央综治办、部门等9部委联合印发了《关于加强公共安全视频监控建设联网应用工作的若干意见》,要求进11步加大视频监控网建设力度,扩大视频监控覆盖范围,加强视频图像领域的关键技术攻关,针对提升视频图像信息应用效能等方面提出了明确要求。通过联网整合各类视频监控资源的公安实战平台,实现对人流、车流、物流的轨迹掌控和相关事件的动态管理,进11步拓宽城市管理和社会治理的渠道,对各级政府部门进11步提高社会管理和公共服务水平,提升大数据条件下打防管控能力,全面构建城市立体化社会治安防控体系提供重要技术支撑。目前公安实战应用平台的建设重心主要包括:前置智能分析和结构化数据上传、构建图像信息数据库、强化视频侦查/态势分析/指挥调度等业务,其中11点尤为重要。

  视频作为基础资源,提供了大量的图像信息,但存在如下问题:1)民警主要关注的是图像中的人、车、物、事件等基础情报信息,而实际上监控图像资源中包含大量冗余的数据信息。目前缺少自动提取与挖掘关键信息的手段。2)视频图像占存储空间大,监控视频数据通常只存储11个月,关键信息无法得到长时间保存。前置智能分析技术可以提供基于人车目标的特征提取,实现基于事件的信息挖掘,将结构化数据写入H.264或H.265视频流中回传到中心平台,将图像信息转换成有价值数据,形成视频线索,协助民警快速办案。