12月19日至20日,由腾讯官方举办的本年度技术性盛典2020Techo Park开发人员交流会于北京市顺利举办。此次交流会特邀了200多名国内外权威专家和和数千位与会者就人工智能技术、多媒体等前沿科技话题讨论进行沟通交流。在视频通讯云分社区论坛上,腾讯官方多媒体实验室主管李松南开展了《智媒-多模态与内容生产制造》的题材共享。

腾讯官方多媒体实验室主管 李松南

聪慧媒体就是指用AI人工智能技术性重新构建新闻报道生产制造与散播全步骤的媒体,由智能化媒体、聪慧媒体和中国智库媒体三一部分组成。近些年,以流行媒体组织为象征的各媒体、公司等积极主动寻找媒体聪慧化的演变对策,紧紧围绕媒体数据采集、媒体内容生产制造等层面,对聪慧媒体的未来发展途径作出了一系列探寻。日趋完善的5G、人工智能技术、云计算技术等新一代展现技术性,正逐步成为了支撑点聪慧媒体发展趋势的关键技术群。

做为腾讯官方集团旗下顶级高新科技实验室,也是世界多媒体技术性的引领者,聪慧媒体是腾讯官方多媒体实验室的关键研究领域之一。李松南表明,最近多媒体实验室发布了AI媒体内容生产制造服务平台——聪慧媒体,能够根据构建根据跨多形式(图象、声频、文字、视频语音)优化算法的多媒体内容剖析和了解架构,完成媒体标识、归类、检验、引言、内容叙述等作用。

社区论坛上,李松南关键详细介绍了聪慧媒体的内容生产制造。他强调,媒体内容包括视频、照片、响声及内容等各种形状,综合性应用这种媒体形状的技术性即是多模态技术性。聪慧媒体内容生产制造,便是根据人工智能技术的方法,自动化技术、大批量化的生产制造这种不一样多形式的内容。

李松南用“胡编乱造”、“涅盘重生”和“移花接木”三个词来描述聪慧媒体的内容生产过程。说白了“胡编乱造”就是指从零到一,不断发展的写作全过程,例如给AI实体模型一些随机性的噪音数据信号,AI实体模型能够转化成一首诗或一段钢琴曲子。涅盘重生”即同多形式间的转换,例如键入一段歌曲,輸出也是一段歌曲,仅仅演奏这一段歌曲的传统乐器发音了转变,例如从电子琴变成了琵笆。 “移花接木”就是指不一样多形式中间的配对或转换,例如视频与背景音乐中间的相互配对,照片与文案中间的互相转换等。

目前为止,腾讯官方智媒的媒体内容生产量已遮盖12种技术性工作能力,一部分工作能力已在腾讯云服务上的设备开展运用。李松南表明,将来,腾讯官方多媒体实验室会不断深耕细作多媒体技术性,服务周到腾讯官方內部商品的与此同时,根据腾讯云服务将技术性开展輸出,为社会发展造就大量使用价值。

下列为李松南演说纪实:

小伙伴们好,我是腾讯官方多媒体实验室的李松南,很高兴能参与腾讯官方Techo交流会,为大伙儿报告多媒体实验室新近发布的AI媒体内容生产制造服务平台-智媒。报告的副标题的格式是多模态与内容生产制造。最先我介绍一下多模态与内容生产制造的关联。

大家都了解,媒体内容包括多种多样形状,例如视频、照片、响声、文本这些。

做技术性的朋友把综合性应用这种媒体形状的技术性,称为多模态技术性。AI媒体内容生产制造,便是根据人工智能技术的方法,自动化技术、大批量化的生产制造这种不一样多形式的内容。

这儿,为了更好地便于记忆力,大家把AI媒体内容生产过程,梳理为三种,而且给每一种方法各自起了一个抽象化的名称,分别是“胡编乱造”、“涅盘重生”和“移花接木”。

下边我各自介绍一下这三种方法。

最先是“胡编乱造”,说白了,是一个从零到一,不断发展的写作全过程:给AI实体模型一些随机性的噪音数据信号,AI实体模型能够转化成一首诗,或是一段钢琴曲子,或是一副超清的人像图片,或是一段视频。

第二种方法,大家把它称为“涅盘重生”,就是指同多形式间的转换,例如传统乐器变换,键入是一段歌曲,輸出也是一段歌曲,仅仅演奏这一段歌曲的传统乐器发音了转变,例如从电子琴变成了琵笆。

最终一种方法,大家把它称为“移花接木”,就是指不一样多形式中间的配对或转换,例如,视频与背景音乐中间的相互配对,或是图象与文案中间的转换。

第一种方法,实验室干了一些基本的试着,已经找寻适宜的落实情景,这儿便不详细介绍了。下面我能对于第二和第三种内容生产过程得出一些更主要的事例。

第二种内容生产制造方式,大家把它称为“涅盘重生”,指的是同样多形式内容中间的转换。由于多媒体实验室的首要工作中在视频上,因此 下边我终视频做为事例开展表明。优化算法的填写是视频,輸出也是视频。

视频解决就这样一个全过程,键入是一段视频,輸出也是一段视频,是通过加工处理后的一段视频。这一处理方式很有可能包含了这一段demo中呈现的各种实际操作,例如减少缩小失帧、提升屏幕分辨率、提升帧数、颜色提高这些;把超清的内容变为4K乃至8K,把一般的视频变为HDR的视频;乃至修补一段老影片,除掉老影片中常常出现的刮痕、小雪花,让老影片中的角色更清楚这些。视频解决是实验室长期性付出的角度之一,大家已经与腾讯官方视频云、腾讯影业一起,根据画面质量再生、智能化影视制作等商品,向外界公司供应高质量的视频解决服务项目。

此外一个事例是视频的全屏转坚屏。大家如今见到的许多 短视频内容全是坚屏的,而许多 高质量的视频内容全是https://www.qwh168.com/全屏拍攝的。大家经过剖析界面的明显地区,设计方案了一个全自动的剪裁优化算法,将大批量的全屏视频全自动的变换为坚屏视频。这儿列出了好多个事例,大伙儿还可以见到,视频的行为主体内容在坚屏界面上都被保留住了,与此同时摄像镜头的活动也很当然。大家经过很多的主观性完成,与目前市面上的相似设备做好了比照,确认了大家优化算法的优势。

还有一个事例是视频拆条与视频锦集。这儿以足球队视频举例说明,给优化算法一段90分钟的足球赛事视频,优化算法能够解析出不一样事情造成的时间范围,例如任意球事情、射球事情、入球事情这些,随后把这个长视频拆分为许多 一段的一段的短视频。大家还能够把大家以为是精彩纷呈的短视频拼凑在一起,产生一个精彩纷呈锦集,例如,针对足球队而言,我们可以把射球、慢镜头、入球等事情拼凑起來,自动生成一段对于一场足球赛事的出彩锦集。

第三种媒体内容生产制造方式,大家把它称为“移花接木”,指的是不一样多形式中间的配对或是转https://www.qwh168.com/换。这张PPT里得出的两给事例,分别是照片到文本、视频到内容的转换。左侧是一张图片,里边是一个产品,大家可以用优化算法转化成对这种产品的叙述,协助商户更快的吸引住消费者。右侧是一段手机游戏视频,大家可以用优化算法自动生成对游戏里面精彩纷呈事情的叙述。

最后一个事例是视频背景音乐,键入一段短视频,依据对这一段视频内容的剖析,寻找合适这一段视频的音乐背景。自己做过短视频的朋友们都了解,给短视频找一段顺心如意的配乐很不便,而音乐背景推荐系统能够帮你节约许多時间。

好的,以上全部事例都来源于多媒体实验室的智媒服务平台,这页ppt里列举了智媒服务平台现在供应的全部媒体内容生产量,在其中的一部分早已逐渐业务于腾讯云服务上的商品。实验室会根据腾讯云服务,不断的对外开放键入大家的工艺工作能力。

感谢大家的倾听!多媒体实验室会不断深耕细作技术性,服务周到腾讯官方內部商品,与此同时根据腾讯云服务将技术性开展輸出,为社会发展造就大量使用价值。谢谢你们!

免责协议:销售市场有风险性,挑选需慎重!该文仅作参考,未作交易根据。

作者 adminqw17