谁说AI看不懂视频?

摘要:人工智能在视觉领域发展趋于成熟,基于人工智能的视频内容分析能从根本上解决传统内容分析方法性能低下的问题,视频分析开启2.0智能时代。

视频数据量激增,数据处理和内容运营成本居高不下

云计算、大数据、物联网、人工智能等信息技术飞速发展及传统产业数字化的转型,一方面媒体数据量呈现几何级增长,据IDC预测,全球数据总量预计2020年达到44ZB,我国数据量将达到8060EB,占全球数据总量的18%;另一方面,媒体的生产、传播和消费形式升级。巨量数据中,70%将会以图片和视频的形式存储和传播。这些数据从生产、传播到用户消费,传统方式运营成本居高不下。人工智能在视觉领域发展趋于成熟,基于人工智能的视频内容分析能从根本上解决传统内容分析方法性能低下的问题。AI助力,视频分析将全面进入智能时代。

视频从生产到消费全流程智能化

视频从生产到消费的全流程升级,如图1所示。

图1 视频生产、编辑、分发和消费流程升级

华为云EI助力视频分析全面进入智能时代。

生产

  • 视频采集,从专业设备到移动终端,视频内容采集大众化。华为云EI在采集阶段可提供美颜、个性化等特效处理技术,助力视频采集即处理。
  • 内容审核,用户采集内容上传存储前,华为云EI提供视频内容智能审核能力,包括视频质量评估、黄/暴/恐鉴别、重复/相似鉴别及版权指纹分析等,解决重复/疑似不安全内容进入传播流程。

编辑

  • 结构化分析,华为云EI针对各种类型的长、短视频,提供智能结构化分析,将视频以镜头、内容片段等结构化形式进行描述,便于后续的内容分析、存储和分发。
  • 内容分析,对结构化表示的视频内容,华为云EI从场景识别、主体识别、行为/事件检测、语音/文本分析及内容描述等方面对其进行智能化分析,支持多维护内容查询和检索。
  • 智能编辑,基于智能内容分析,初步提供以下智能视频编辑技术:

(1)视频拆条

相比较长视频,短视频更有利于在互联网传播,对传统媒体的节目进行拆条是不可或缺的。华为云EI基于人物、场景、语音、OCR字幕等多模态信息分析技术,快速精确地把长视频分割成不同主题的片段。面向海量多媒体视频,大幅提高视频识别、剪辑、检索等处理的效率,降低人工运营的成本。整体效率相对人工提升10+倍,新闻类视频拆条准确率超过95%,特定场景准确率超过98%。

(2)视频摘要

静态摘要,基于视频镜头变换、内容理解技术,华为云EI针对不同类型的长、短视频提供视频静态摘要服务,能够将1个小时视频压缩成5分钟的摘要内容,可用于运营管理人员的内容快速浏览及用户快速内容播放。

视频浓缩,使用背景建模、主体检测、运动轨迹跟踪、前/背景融合技术,华为云EI提供视频浓缩服务,将极长的视频中的事件提取出来,浓缩到较短的视频片段,便于视频内容中事件的快速观看。

(3)视频封面

基于视频镜头变换、内容理解和分析技术,快速提取内容相关、构图优美的关键帧作为封面吸引用户进一步观看。相比于人工选取封面,智能封面选取速度提高20+倍,大幅降低运营成本;同时精彩的封面能够吸引用户的注意,大幅提高视频点击率。

(4)视频内容标签

视频OCR,视频物体识别,视频人物识别,从多维度对视频内容进行提取,将非结构化的视频文件,转换为结构化的数据,为视频搜索,视频推荐,视频运营等提供了必不可少的信息。

(5)水印处理

用户上传的内容除了新采集的视频,还有很大一部分为已有视频的重新传播。而重复传播的这部分视频极有可能已经打上了不同的水印。为了便于企业内容管理,华为云EI提供水印检测和处理技术,能够智能检测水印位置、重构水印并对水印进行处理。

(6)音视频指纹

视频指纹具有极大的使用场景,包括:(1) 对用户上传的内容进行重复检测;(2) 可对内容进行版权追踪;(3) 支持多维度、多粒度内容存储和检索;

华为云基于音频、视频内容分析技术,提供音、视频指纹生成、存储及检索技术。

(7)自动唱词

在新闻媒体、教育等领域往往只有视频和对应的音频信息,自动唱词技术可以根据视频自动添加字幕,相比人工添加字幕,可以极大提高视频发布的及时性,提高生产效率。

  • 分发,基于前述的视频结构化和智能分析,视频内容可按照多维度进行存储,结合用户行为日志分析,支持快速检索和关联推荐,将内容以最快的速度推送到相应的用户。
  • 消费,在用户消费视频的过程中,华为云EI提供自动评论及交互播放技术方案,提升终端用户体验。

人工智能正在进入以标准化、自动化、模块化为特点的工业大生产阶段。AI会将人类社会带入智能时代。本文针对视频从生产、编辑、分发到消费的整个过程如何实现智能化,进行了技术分析,希望能为对AI感兴趣的小伙伴们指点迷津,也为一直苦于传统运营模式下的你打开局面。

 

点击关注,第一时间了解华为云新鲜技术~