网页资讯视频图片知道文库贴吧地图采购
进入贴吧全吧搜索

 
 
 
日一二三四五六
       
       
       
       
       
       

签到排名:今日本吧第个签到,

本吧因你更精彩,明天继续来努力!

本吧签到人数:0

一键签到
成为超级会员,使用一键签到
一键签到
本月漏签0次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行补签。
连续签到:天  累计签到:天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
08月13日漏签0天
人工智能吧 关注:116,669贴子:509,188
  • 看贴

  • 图片

  • 吧主推荐

  • 视频

  • 游戏

  • 1 2 下一页 尾页
  • 48回复贴,共2页
  • ,跳到 页  
<<返回人工智能吧
>0< 加载中...

【脑洞】如何可以用人工神经网络高真模拟人脸的动态表情?

  • 只看楼主
  • 收藏

  • 回复
  • click4i
  • T800
    10
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
这里的目的不是做识别,而是要ANN在无监督或有监督(加上情绪标签)的情形下学会人脸表情的动态模式,然后可以应要求实时造出高度逼真的动态表情(哭,笑,尴尬,爱慕,等)。模拟目标可以是某个特定人物,或是来自多人的综合表情。
【实验条件】首先只考虑正面2D的情形。无需导出人脸3D模型。样本光线不定。样本可能来自多人。
【相关技术】LSTM/RNN。以ANN学习艺术风格(论文:A Neural Algorithm of Artistic Style)。一般CNN以逐层提特征的方式降维。


  • OrochiZ
  • 2B
    13
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
如果人工分类什么表情是什么,或者人工提交个表情只管模拟。
前阵子倒是有个 实时移植 A人视频表情 到 B人脸上的


2025-08-13 20:39:57
广告
不感兴趣
开通SVIP免广告
  • Pallashadow
  • 9S
    12
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
CNN能实时生成图片?


  • 江月望像似
  • T1000
    11
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
不知道人类的表情动作是不是基因遗传的,感觉这东西后天无法学到


  • 墨渍
  • 人脸辨识
    1
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
人的脸部有80多块肌肉,能产生7000种表情,所以说还是用颜色代替吧


  • Pallashadow
  • 9S
    12
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
把人脸用点云表示或者网格模型表示,表情就是每个点和邻居点的相对位置关系以及和参照系的位置关系。
两步:
1、(用intel realsense之类)收集人脸RGB-D图像;映射到标准人脸点云模型,缺失的地方自动补足,生成训练集
2、用概率图模型或LSTM预测标准人脸模型的表情变化


  • Pallashadow
  • 9S
    12
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼

对标准模型上的每个点,分配一个LSTM,输入为此点位置+全局表情编码E,E由某CNN生成,CNN可以先借用人脸识别网络。由p+v生成下一个时间的标准模型p,再生成RGB图像,图像扔给CNN得到下一个时间的E,图像再得到p,如此循环


  • 巴蒂毅
  • Alphago
    5
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
提取特征识别容易,但信息丢失了,重现生成就麻烦了。模仿这种事情,传统计算机不是更容易。


2025-08-13 20:33:57
广告
不感兴趣
开通SVIP免广告
  • click4i
  • T800
    10
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
(续9楼)
楼上提出了个从图像样本产生个先验模型的想法。下面再补充些细节。
1. 铭印阶段:首先根据一组單纯表情的图像样本(RGB或RGBD)透过CNN提出各层级脸部特征。结果大致如下。

这一步骤可以看成是大体类似某些动物的铭印(imprinting)现象,以短期性的学习提出重要脸部的标准特征,然后据此造出个脸部模型供进一步的用途。这些标准特征在完成铭印阶段以后就固定不变了。
2. 学习复杂表情阶段。含有复杂表情的图像样本首先根据上面导出的标准特征分解成一个【标准特征云】,然后设法学会需要何等的变形操作才能让这个标准特征云趋近于观察到的图像。
3. 加标签学习阶段。这里是学习标签(如伤心,尴尬,开心,等)和上面提出模型之间的映射。
4. 表演阶段。当收到表情要求时,可以按要求根据上面学到的标准特征,变形操作元,以及目标表情实时输出高真表情图像序列。


  • ieBugH
  • 9S
    12
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
输出各器官开闭程度,曲率,微位移就好了,再卡通线条式表意一下应该更简单更萌。特征提取也只需针对这些参数。可以通过DQN训练,被模仿者对模仿的效果打分。关键在于数据量不可能够,或者在网上搜关键词,然后取出那些是人脸的图片?这样也只能让agent学会某种表情对应的特征,要输出参数必须有打分机制啊。


  • 就是小邪
  • 人脸辨识
    1
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
真正是需要准确的面部识别和语音识别是需要建立庞大的个人面部表情数据库和声音识别库的。这在目前,是理论能做到,而现实是无法做到的。庞大的个人面部、个人声音数据采集是目前条件下无法完成的工作。更别提数据的更新了。


  • jj521111443
  • 纳斯德
    7
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
用WRL三维模型来做比较好吧,取其中几点来定义基准点,然后要活动的点相对位移。显示是可以用ocx控件的,人头可以先在zbrush里画好。导出WRL文件。


  • impkq
  • 铁皮人
    8
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
不知道索尼手机自带相机中的AR面罩算不算你说的那种,最近朋友的z5p里发现的,表面看就是追踪头部位置+PS另一个人或动物的脸在自己脸上。我试着张嘴嘟嘴皱眉眨眼抽动脸部肌肉,新合成的脸是会实时跟着你做出表情做同样的变化的,所以并没那么简单。我看上面还有“AR效果”,“AR趣拍”,启动的时候会叫你先对准一个位置然后左右平移一至两秒,对准移动的过程中会看到在颜色明暗交界处,比如瓷砖接缝地面和墙之间的转角地上鲜艳的图案交界不断泛起水波涟漪点,然后就能实时将3d模型和显示场景合成在一起,我发现有趣的是里面有个叫“童话”的ar,里面很多卡通小人走来走去,碰到我地上放的垃圾桶和凳子还有墙是会拐弯的,根本不会碰到,当时我就震惊了一下。综合起来分析如果使用的是同一技术的话,应该是在平移过程中截取两张生成3d图片利用Shift特征点匹配两张图片中的对应位置点,生成粗略3d模型再平滑处理一下,叠加待合成的场景3d模型上去就是AR了,AR面罩就是将他人的脸贴图到一个NURBS曲面上,实时人脸提取的Shift特征点和NURBS曲面上点做映射,Shift特征点位置变化带动NURBS曲面变形,然后PS,分析完毕不知道对不对


  • Hard_Words
  • 无人机
    3
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
对于人工的智能,表情真那么重要?


登录百度账号

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频!
  • 贴吧页面意见反馈
  • 违规贴吧举报反馈通道
  • 贴吧违规信息处理公示
  • 1 2 下一页 尾页
  • 48回复贴,共2页
  • ,跳到 页  
<<返回人工智能吧
分享到:
©2025 Baidu贴吧协议|隐私政策|吧主制度|意见反馈|网络谣言警示