56星座屋
当前位置: 首页 星座百科

gan风格迁移原理(用GAN消除会议模糊)

时间:2023-06-16 作者: 小编 阅读量: 1 栏目名: 星座百科

疫情下,这种场景已经成为很多打工人工作的常态。此外,NVIDIAVid2VidCameo还可利用AI从专业摄像头或智能手机拍摄的标准2D视频中捕捉面部动作和表情,协助动画师、照片编辑师和游戏开发者轻松制作脸部动画。Vid2VidCameo很快将在NVIDIAVideoCodecSDK中作为AIFaceCodec推出。

gan风格迁移原理?无需会议室和出差,打开手机,登录APP,就可以和千里之外的人“面对面”开会疫情下,这种场景已经成为很多打工人工作的常态,今天小编就来说说关于gan风格迁移原理?下面更多详细答案一起来看看吧!

gan风格迁移原理

无需会议室和出差,打开手机,登录APP,就可以和千里之外的人“面对面”开会。疫情下,这种场景已经成为很多打工人工作的常态。

作为一种实时的网络应用,视频会议对网络的要求比较高。当下视频会议过程中,因网络信号问题,常会导致与会者频频掉线、屏幕共享画面不清晰,影响开会的效率。此外,成像角度不佳、客观原因造成个人形象不佳等问题,也将影响与会者的开会体验。如何在低网络带宽下,进行流畅、清晰的视频会议,成为困扰众多视频会议开发者的难题。

此前,开发者大多通过调整图像分辨率、码流、帧数等方式实现视频数据压缩,解决低网络带宽下视频会议问题。虽然这类方法可以缓解视频会议卡顿问题,但会导致视频图像模糊、不连贯。

而以深度学习为代表的卷积神经网络具有更深的学习层次,能够有效的去除掉冗余数据特征,获得更高的压缩比,开发者们倾向于使用神经网络来替代以前的方法。同时,由于带宽一般很难增加,而增强算力相对容易,所以开发者们也更希望将带宽问题转化为计算问题。

基于此,NVIDIA 研究团队从AI维度出发,开发了一个用于视频会议软件 NVIDIA Maxine SDK的深度学习模型Vid2Vid Cameo,只需一张照片或卡通头像,就能合成逼真的3D人脸说话视频。

一、视频会议Maxine SDK背后的AI生成模型

受疫情影响,远程协作和办公已逐渐成为不可逆转的趋势,这使得各种视频会议APP下载量激增,成为打工人的标配。

为了增强用户的视频会议使用体验,NVIDIA推出了一套基于云的、GPU加速的 AI 视频会议软件Maxine。NVIDIA Maxine 包括三个 AI SDK:视频特效 SDK 、音频特效 SDK 和 AR SDK ,每个SDK里面都配有预训练好的深度学习模型,使开发者可以快速构建或增强其实时应用程序。

Vid2Vid Cameo 是基于 NVIDIA Maxine SDK 专为视频会议打造的深度学习模型之一。它使用生成式对抗网络(Generative Adversarial Networks,GAN),在一个人的真实照片或卡通头像上合成动态的3D说话视频。

二、仅需一张照片合成逼真的3D人脸说话视频

NVIDIA Vid2Vid Cameo只需两个元素:一张参考照片和一个指导图像应该如何动的视频流。其中,把上传的清晰照片作为源图像,从中获取外貌特征;然后把视频中一帧帧画面作为重构视频的依据,从中提取出面部表情和头部姿势等信息。通过这些信息,模型可以将参会者的面部动作映射到静止的照片上,进而合成视频会议上的逼真人脸说话视频。

同时,该模型基于NVIDIA DGX系统开发,并使用包含18万个高质量人脸说话视频的数据集进行训练。这让该网络学会了识别20个人脸关键点,而这些关键点可以在没有人工标注的情况下用来模拟面部运动,借此修正使用者在会议中低头、看两旁,而未专注于镜头方向的情况,让使用者在会议中看起来更有参与感。

在 NVIDIA Vid2Vid Cameo 提供的交互式体验Demo中,可以在Pitch俯仰角(向下/向上)、Yaw偏航角(左/右)、Roll翻滚角(顺时针/逆时针)三个方向上任意旋转,每个方向上最多旋转30度。甚至眼球也可以上下左右的旋转,每个方向上最多旋转20度。

现在点击【AI Demo | NVIDIA 研究团队】试用NVIDIA Vid2Vid Cameo交互式Demo。

此外,NVIDIA Vid2Vid Cameo还可利用 AI 从专业摄像头或智能手机拍摄的标准 2D 视频中捕捉面部动作和表情,协助动画师、照片编辑师和游戏开发者轻松制作脸部动画。

三、视频会议的网络带宽成本最高可降低90%

NVIDIA Vid2Vid Cameo能够辨识脸部的20个关键点,而这些关键点可以针对包括眼睛、嘴巴和鼻子在内的位置进行编码。接着模型会从通话者的参考图片中撷取这些关键点,并将这些关键点可以提前发送给其他的视频会议参与者。

如此一来,视频会议平台只需发送参会者脸部关键点的移动情况数据,而不用在每一个与会者之间发送庞大的直播视频流。而对接收者来说,GAN 模型在接收端使用这些信息合成一个模仿参考图片外观的视频内容。

由于关键点的分布十分稀疏,比全像素图像的数据量小得多,因此发送的数据要少得多。而Vid2Vid Cameo通过来回压缩及发送头部位置和关键点,而不是完整的视频流,可以让视频会议的网络带宽成本最高可降低90%,从而提供更流畅的用户体验。同时,该模型可以进行调整,传输不同数量的关键点,以实现在不影响视觉质量的条件下,适应不同的带宽环境。

四、视频会议和直播软件开发团队的新Pick

作为 NVIDIA 研究团队的重要成果之一, Vid2Vid Cameo 将网络瓶颈问题转化为计算任务,从而借助本地或云端资源更轻松地解决此类问题。Vid2Vid Cameo 也可用于直播软件,制作表演者说话、唱歌或移动头部的视频片段。此外,它还可减少了对高网络带宽的依赖,这不仅为提供商削减了成本,也为最终用户提供了更流畅的视频会议体验,成为视频会议和直播开发团队解决因网络所造成画面卡顿及模糊问题的新选择。

Vid2Vid Cameo 很快将在NVIDIA Video Codec SDK中作为AI Face Codec推出。SDK 支持免费下载,还可与 NVIDIA Jarvis 平台搭配用于对话式 AI 应用,包括转录和翻译;也可与3D 人体姿态估计工具协作,像Notch 和 Pixotope 等公司,创作者们使用 NVIDIA Vid2Vid Cameo 和 3D 人体姿态估计工具,将自己的动作传输到虚拟角色,从而快速制作数字角色上的特定动作。

之后,我们还将陆续介绍 NVIDIA 研究团队推出的计算机视觉、深度学习模型以及有意思的交互式Demo,如NVIDIA GauGAN360,可将粗略的草图变成可用于3D场景的360度环境。

体验更多人工智能和深度学习互动Demo,点击【AI Demo | NVIDIA 研究团队NVIDIA HomeMenuMenuCloseCloseCloseCaret down iconCaret down iconCaret up iconCaret right iconCaret right iconCaret right iconCaret left iconCaret left iconCaret left iconShopping CartSearch iconNVIDIA 引领人工智能计算NVIDIAFacebookTwitterLinkedInYouTubeNVIDIA】立即体验“NVIDIA AI 互动 Demo”。
    推荐阅读
  • 形成酸雨的主要气体是什么(形成酸雨的主要气体)

    以下内容大家不妨参考一二希望能帮到您!形成酸雨的主要气体是什么酸雨是指PH小于5.6的雨雪或其他形式的降水,形成的主要气体有二氧化硫、三氧化硫、硫化氢、二氧化氮。酸雨主要是人为的向大气中排放大量酸性物质所造成的。酸雨又分硝酸型酸雨和硫酸型酸雨。

  • 木棉花的花语是什么(木棉花的意义)

    接下来我们就一起去了解一下吧!珍惜眼前的幸福,珍惜身边的人给他们快乐与幸福。它的花期通常在3月或者4月份,在这一段时间盛开,而传说中四月的第十一天,是木棉花盛开的日子,所以4月11被定为木棉花的日子。

  • 炒凉皮不碎技巧(炒凉皮不碎有什么技巧)

    以下内容大家不妨参考一二希望能帮到您!炒凉皮不碎技巧炒凉皮不碎技巧:就是在做凉皮时不能炒太久,变软会失去筋度。胡萝卜切丝,蒜薹切段,葱切花,猪肉切丝,大蒜拍扁。成品凉皮一张张卷起切粗条,抖散备用。生抽,白糖,盐,鸡精,醋,胡椒粉调成汁备用。热锅倒适量食用油烧热加入大蒜,肉丝翻炒至金黄,加入胡萝卜丝和蒜薹炒熟,凉皮翻炒均匀后随即淋入调好的汁儿翻炒均匀。

  • 近几年灭绝的鱼(瞭望在长江源寻鱼)

    长江被誉为我国淡水渔业的摇篮、鱼类基因的宝库。据青海省渔业部门统计,长江流域青海段分布有土著鱼类21种。因此,严格意义上长江源的关键鱼类指的是裂腹鱼中的小头裸裂尻鱼。2019年,李伟带领团队参加长江源科考时,将小头裸裂尻鱼列为长江源鱼类研究的代表对象。2019年4月,科考小组五个人,两台车,开始了沿河寻觅之旅。“全球平均气温上升已是科学界的共识,位于青藏高原的长江源是全球气候变化的敏感区。”科考发现,江源地区

  • 鹧鸪在什么时候季节鸣叫(鹧鸪的孵化期有多长)

    鹧鸪在什么时候季节鸣叫鹧鸪一般会在繁殖季节鸣叫,繁殖期为3-6月,3-4月间开始求偶交配。求偶期间鸣叫更为频繁,常在山岩、树桩、灌木或乔木枝上鸣叫,尤以黎明和黄昏时更甚,往往是一鸟先鸣叫,其他雄鸟一起跟随,此起彼伏。鹧鸪的孵化期在21天左右,雏鸟出壳后不久即可跟随亲鸟活动。鹧鸪的繁殖期为每年的3-6月,3-4月间开始求偶交配,每窝产卵3-6枚,多时可达8枚,卵为椭圆形或梨形,颜色为淡皮黄色至黄褐色。

  • 秋天的诗词(这些都是关于秋天的诗句)

    迢迢新秋夕,亭亭月将圆《戊申岁六月中遇火》,今天小编就来说说关于秋天的诗词?《戊申岁六月中遇火》自古逢秋悲寂寥,我言秋日胜春朝。《秋词》是处红衰翠减,苒苒物华休。惟有长江水,无语东流。宋·柳永《八声甘州》落时西风时候,人共青山都瘦。《昭君怨》雨色秋来寒,风严清江爽。《酬裴侍御对雨感时见赠》秋声万户竹,寒色五陵松。唐·李颀《望秦川》秋色无远近,出门尽寒山。宋·苏轼《九日次韵王巩》

  • 广州有几种车牌(广州车牌你有吗)

    在广州的普通上班族,有房贷还想拥有一辆车,已经不容易了。但有车想让个广州牌,那更是难上加难,再加之限行,参与摇号,竞价的人是越来越多,那中标的机会更是渺茫了!截止日期是8日24时止。9月拟配置的中小客车增量指标共16313个,是这样分配的:1.以摇号方式向单位和个人配置节能车增量指标7285个,其中,单位指标100个,个人指标7185个。

  • qq注销账号有哪几个步骤(QQ将开注销帐号功能)

    1999年2月10日,一个名为OICQ、只有几百K的软件正式上线。当时,腾讯方面表示,这是QQ团队对帐号注销功能的灰度测试。网友截图出于安全考虑,也有网友表示支持有人说,QQ不推出注销服务有自己的考虑,这是为了防止用户QQ密码被他人知道后恶意注销,给用户带来无法挽回的损失。腾讯2018年第三季度财报显示,QQ智能终端月活跃账户同比增长6.9%至6.979亿。

  • 高跟鞋不合脚怎么办(穿高跟鞋不合脚怎么办)

    4、合理利用袜子,如果不喜欢垫各种鞋垫的朋友,可以穿一双船袜,再穿高跟鞋,那样既不影响穿着效果,也不影响美观,也是比较简单和实用的方法。

  • 年四旺名字打分104分 年四旺事迹

    文章目录:一、年四旺相关名字打分113二、年四旺相关名字评分115三、年四旺相关名字推荐四、年四旺相关名字大全五、其他人还看了一、年四旺相关名字打分113年灯石志明年橘纪红兵武尊道后书法孔多塞年贷款孙敬媛年立秋里蓝业珍冯景华年见朱诗词林于思冯桂年粤日林格孟昭毅年家薛邑马布鱼鲁初雪苏沫沫卜庆中年上年掌柜秦源达刘登龙严学锋国韵酒年线高成江裘梦年维泗红沙日年周王克斌王翔千毛淑红龙威信李万和年神范小慧王大