近年来,5G通信技术与AI技术的发展将视频行业推向了一个新高潮,视频行业的发展也愈发与人工智能技术紧密结合。为此,易有料特别邀请了网易杭州研究院的高级产品经理陆徳,在易有料举办的“有料小馆”沙龙中做了有关“AI视频内容理解技术的实践”的主题分享。作为“有料知识官”,陆徳在演讲中围绕视频生产、视频管理、视频分发、视频互动这四个模块,展示了AI技术如何赋能内容运营、如何助力品牌内容营销数字化。
视频内容生产实现自动化
在短视频场景中,横屏视频会被调整成适配手机竖屏的尺寸,传统方式是通过填充黑边,但会影响视频整体美观度。因此,为满足用户的沉浸式内容体验,可以使用目标检测和镜头预测技术识别视频主体,保留视频主体来自动切割竖版视频。AI内容理解技术还可以用于字幕自动生成环节,利用该技术自动生成带有时间戳的字幕位置,用户可以在对应的位置上作编辑,还可以一键导出字幕文件,方便后续视频压制。
AI技术应用于视频内容管理
视频管理最核心的能力是为视频打标签,网易杭州研究院的AI视频标签体系已经支持三级1.2万+个标签,包括明星识别、动漫识别、行为动作识别、情绪识别等等,目前也在与易有料一起探索自训练能力。在音乐播放器边听边看的场景中,要确保字幕跟音乐播放的歌词相匹配,可以运用图像领域OCR技术,通过画面中的图形识别相应的文字。音频内容理解方面,运用AI技术对原始音频进行识别,对说话的对象、语种、声音事件进行标记,声音事件主要根据不同业务领域进行定制,进一步规避有风险的内容。
视频内容智能推荐与智能检索
在内容社区推荐场景中,运用AI技术还可以为大量视频提供内容标签,扩大视频个性化推荐内容池。基于视频指纹技术实现“以影搜影”与版权保护,视频指纹在业界又被称为视频DNA,为每一个视频抽取唯一的特征进行识别。在海量的视频中,其中大部分创作者会采用其他来源的素材形成重复性比较高的视频,因此可以通过视频指纹技术去实现视频的去重和原创保护。视频指纹同样可用于视频检索,用户搜视频一般是通过文字匹配标签,而使用了该技术,用户便可以上传影视片段来搜索出完整的视频。
直播场景下的AI内容理解技术应用
视频互动主要发生在直播场景,目前直播有两个痛点:实时直播内容与封面无关,造成跳出率高;封面无法实时自动更新,会损失一部分的用户点击。通过AI技术来实现“高光封面”,在视频流和直播流的过程中,通过对视频、图像等内容的理解,从丰富度、图像质量、精彩程度和吸引程度等多方面进行分析,同时结合时序和音频辅助判断,截取主播当前最精彩片段生成静态、动态封面。
多项AI能力赋能社区视频业务,能为社区业务的内容流转效率、内容分发效率、内容自动化质量提升能力带来可观的改善,可以更有效降低业务的人力投入,促进全局资源的优化配置。AI视频内容理解技术大大降低了特定场景中视频应用的成本,为品牌实现内容营销数字化起到了推动性作用。
易有料成立于2019年,专注于企业级内容智能运营服务,是国内较早提出做企业级内容中台解决方案的公司。整合全网优质内容及优质内容创作者,通过AI智能技术,实现企业从内容入库到内容管理再到内容分发全链路的智能运营,协助企业最大化挖掘私域价值。易有料期待与更多的行业朋友们一起探索内容的价值与内容行业的未来发展趋势,助力企业内容营销的数字化转型。