新書推薦:
《
快人一步:系统性能提高之道
》
售價:HK$
113.9
《
我们为什么会做梦:让梦不再神秘的新科学
》
售價:HK$
79.4
《
算法图解(第2版)
》
售價:HK$
80.3
《
科学的奇幻之旅
》
售價:HK$
79.4
《
画艺循谱:晚明的画谱与消闲
》
售價:HK$
147.2
《
新民说·现实政治史:从马基雅维利到基辛格
》
售價:HK$
102.4
《
宽容是件奢侈品(人生360度·一分钟经典故事)
》
售價:HK$
45.8
《
甲骨拼合六集
》
售價:HK$
342.7
|
內容簡介: |
《人脸感知从二维到三维》围绕人脸这一研究对象,从计算机图像认知的角度,对二维人脸图像分析和三维人脸建模进行全面介绍,内容包括:人脸检测及特征点标定,人脸轮廓定位,三维人脸建模完整方案包括人脸形状知识库的建立、人脸统计模型、基于特征点的形变算法、人脸建模具体方案、纹理映射,光照分析及姿态估计。最后,本书对一些经典算法以附录的形式加以详述,并提供源代码,以利于读者理解并尽快上手应用。
《人脸感知从二维到三维》可作为信息处理、计算机、人工智能、模式识别、认知心理学等有关专业的高年级本科生、硕士生和博士生的学习参考用书,也可供以上领域的研究工作者参考。本书由王国胤博士和龚勋博士著。
|
目錄:
|
前言
第1章 人类视觉感知概述
1.1 人脸感知
1.2 人类视觉认知
1.3 计算机视觉
1.4 机器视觉与人类视觉的联系
1.5 本书各章内容简介及阅读本书要注意的问题
第一部分 二维人脸图像处理
第2章 人脸及其特征的自动检测
2.1 概述
2.2 图像处理基本技术
2.3 基于Adaboost的人脸检测
2.4 主动形状模型ASM
2.5 主动外观模型AAM
2.6 人脸轮廓检测
2.7 小结
第3章 人脸特征提取及识别
3.1 人脸识别技术的发展
3.2 人脸识别原理及方法
3.3 动态主成分子空间的构造
3.4 人脸图像的增强Gabor特征构造与应用
3.5 小结
第二部分 人脸三维建模
第4章 人脸三维建模概述
4.1 背景
4.2 生活中的三维人脸
4.3 人脸三维建模技术发展
4.4 三维人脸数据库
4.5 商业三维人脸建模软件
4.6 小结
第5章 标准化三维人脸库
5.1 三维人脸数据库标准化基本概念
5.2 基于特征区域分片的三维人脸数据重采样
5.3 基于AAM特征点定位的三维人脸数据重采样
5.4 标准化人脸的应用
5.6 小结
第6章 三维人脸形状建模
第7章 根据单张照片进行三维人脸建模
第8章 光照分析及姿态估计
附录A PCA算法及其在人脸识别中的应用
附录B LFA理论
附录C 基于单高斯模型的肤色检测及高斯混合模型参数优化
附录D 平面曲线法向量及曲率的数值计算
参考文献
|
內容試閱:
|
第1章 人类视觉感知概述
1.1 人脸感知
人脸在人们日常交往的情感表达中扮演着重要的角色,是人类的喜怒哀乐等
复杂情感的载体。长期以来对人脸的描述和刻画一直得到了人们的广泛关注,至
今留存下数量不菲的历史人物肖像及雕刻,其中不乏高品质的历史文化珍品,如
三星堆出土的古蜀国金面罩铜质人头像,达芬奇画笔下神秘的蒙娜丽莎,唐宋时
期古典雅韵的仕女图以及一系列直逼人灵魂深处的梵高自画像等。
感知是指人通过感知器官对外部客观事物的要素及特性在头脑中所做出的
反映。反映可以是分析识别,也可以是再创造。就人脸感知而言,感知器官为人
眼(相机、摄像机)、外部客观事物为人脸(人脸图像)、要素和特性为人脸特征、反
映为模式识别和人脸三维结构再合成。本书中所指的人脸感知包括两个方面内
容,即对人脸二维图像的分析理解以及人脸三维合成(也称建模)。
众所周知,人类视觉系统(humanvisualsystem,HVS)具备感知人脸复杂模
式的能力,仅仅通过一张照片就能够准确、快速地在大脑中塑造出人脸三维形状,
进而实现身份辨别。此外,HVS具有超强的鲁棒性,能在很宽广的光照变化范围
内识别人脸,当人脸部分遮掩或发生一定形变,甚至经过一段相当长的时间后,还
能对其正确感知并进行正确识别。深入探索人类视觉认知原理对设计一个更好
的机器自动识别系统具有重要意义。
目前,学者们已经对人脸识别的问题做了大量研究[1,2],也在理论上取得了一
系列的进展,但要实现计算机的自动人脸分析及建模,现有技术远达不到实际应
用的要求。究其原因在于认知心理学、认知神经科学以及生物学对人类感知问题
的认识还处于初级阶段,相关理论问题的研究还不成熟。而现有人脸识别系统通
常根据统计理论以及图像处理的方式来实现表观的识别,对认知科学理论成果的
应用还不够深入。
如果能够借鉴人类的认知机理和相关数学理论的最新研究成果,建立新的计
算模型和方法,实现对人脸图像的准确分析及建模是当前计算机视觉、人工智能
等领域的一个关键问题。使计算机在一定程度上具有对人脸的感知能力,更是众
多研究人员孜孜以求的目标,近年来已取得一定的进展,这些技术都在本书中进
行了归纳总结。
1.2 人类视觉认知
1.2.1 视觉的地位
感觉是人的大脑与周围世界联系的窗口,它的任务是识别周围的物体并判断
这些物体之间的关系。人的思维活动是建立在对客观世界与环境认识的基础上,
而感觉则是客观世界与人对环境认识之间的桥梁,它使我们的思维与周围世界建
立某种对应关系。人有多种感觉,其中对人的智力产生影响的主要是视觉和听
觉。味觉和嗅觉是丰富多样的,但平常人们很少深入地去思考它们。在视觉和听
觉中,形状、色彩、运动、声音等很容易被结合成各种明确、高度复杂、多样的基于
空间和时间的组织结构,所以这两种感觉就成了理智活动得以发挥作用的非常合
适的媒介。就听觉而言,人要从所听到的声音中获取具有意义的信息,还需要联
系其他感性材料。视觉则不同,它是一种高度清晰的媒介,所提供的关于外界世
界中各种物体和事件的信息十分丰富,它是思维的一种最基本的工具。总体而
言,视觉是人类最重要的感觉,它是人的主要信息来源。研究表明,人类所认识的
外界信息中80%来源于视觉[3]。
1.2.2 视觉的内涵
眼睛是我们的视觉器官,整个视觉系统就像一台精确的摄像机,它具有较完
善的光学系统及各种使眼球转动并调节光学装置的肌肉组织。视觉过程的生理
机制包括折光机制、感光机制、传导机制和中枢机制。其中折光机制和感光机制
使人感知事物。当眼睛注视外物时,由物体发出的光线通过上述折光装置使物像
聚焦在视网膜的中央凹,形成清晰的物像。
人类视觉的内涵不仅指视力,其基本功能包括光觉、形觉、色觉、眼球运动和
双眼单视等。视觉的基础是光觉,感受外界光的刺激是视觉的最基本特征。在光
觉基础上眼睛还具有形态觉,即能够分辨和认识外界物体形状的能力,又叫中央
视力或视锐度。对于中央视力而言,眼球向正前方固定注视一个目标时所见的空
间范围称为视野。在视野中,越趋向周边的范围对物体的精细分辨力就越差。
除了以上我们所分析的单只眼睛所具有的能力,其实人类区别于许多生物的
视觉能力之一是我们还具备非常完善的双眼视觉。双眼视觉分三级,最初级为同
时知觉,即双眼能够同时看到两个不同的画面;第二级为像融合功能,即双眼将两
个大部分相同、但在细节上有某些差别的图像看成一个图像;第三级为立体视觉,
即三维空间知觉,又称深度视觉或空间视觉。具有完善的双眼视觉,才能感知物
体的立体形状及该物体与人眼的距离或两个物体相对的远近关系。立体视觉是
最高级的双眼单视功能,它是人类从事各种高级精细工作的基础。
如上所述,人类对外界的感知绝大部分通过视觉系统获得,但人的视觉并不
是与生俱来的,刚出生时的新生儿的眼睛只有光觉反应。实际上完善的视觉系统
所完成的功能十分复杂。人的视觉功能主要是在出生后接受了大量的视觉刺激
后逐渐发育成熟完善的,所以在视觉的形成期间,大量的视觉刺激对视觉发育的
作用是十分重要的。
有学者认为视觉本身就包含了思维的一切基本因素。设想你要在一个会场
中寻找一位朋友,呈现在你眼前的是由参加会议的人、桌、椅、主席台等组成的复
杂景物。眼睛得到这些信息以后先要对景物的各部分进行分类,然后从中选出与
朋友的外表有关的特征作出判断,那么在人的眼睛视网膜上映照的景物成像是否
就能直接提供判断时所需要的有关特征呢?不是的。这里需要大脑的思考。例
如,虽然人在不同距离处观察同一物体时在眼睛中成像的实际大小不同,但人们
在观察某人的身高时却不会因为他在近处就判断他比实际高,也不会因他处在更
远的位置就判断他比实际矮。这是大脑根据被观察物体的距离与周围物体的比
较,并依靠有关的知识对输入的图像信息进行处理、解释的结果。假设你在一个
灯光昏暗的剧院中寻找朋友,这个问题就变得更为困难。你刚走进剧院时会感到
一片漆黑什么都看不清楚,过了几分钟你的眼睛变得习惯于在黑暗中观察。这时
你的视觉系统在所处环境中对微光变得更加敏感,不能对物体和背景进行有效区
分。这时眼睛对许多本来可用的信息捕捉不到,也就导致许多细节难以分辨。即
便这样你也能认出朋友。总之,视觉是一个复杂的感知和思维过程,视觉器官眼
睛仅接受外界的刺激信息,而大脑对这些信息通过复杂的机理进行处理和解释,
使这些刺激具有明确的物理意义。
从以上分析我们还可以看到敏感(sensation)、感觉(perception)、认知(cogni-
tion)这三个概念之间的联系和差别。敏感是把外界的各种刺激转换成人体神经
系统能够接受的生物电信号。它所完成的是信号的转换,并不涉及对信号的理
解。例如,人眼是视觉的敏感器官,它使光信号通过视网膜转换成电信号,与摄像
机的光电传感器相似。视网膜的感光细胞对光信号在平面上进行采样,产生点阵
形式的电信号,所不同的是摄像机的空间采样是均匀的,而视网膜的采样是不均
匀的,在中央凹附近采样分辨率高,在周围采样的分辨率低。而感觉的任务是把
敏感器官的各种输入转换和处理成对外部世界的理解。例如,对视觉来说就是能
说出周围世界中有什么东西和这些东西之间的空间关系。这些都是关于周围世
界的概念。从输入的点阵形式的信号到形式化的对客观世界的各种概念,其中要
经过复杂的信息处理和推理。而认知是以人们对周围客观世界的概念为基础的。
如果没有感觉这个人与外部世界的桥梁或窗口,人的思维活动就会失去基本的
依据。
1.2.3 视觉的特点
人类视觉感知大致有以下特点:具有高分辨率,能立体观察,具备优越的识别
能力和灵活的推理能力,可灵活地根据各种视觉线索进行推理。
(1)深度感知。初等生物体表面上的光敏区开始时只能提供关于光源的方
向信息,例如,阴影可能表示一个捕食动物正在逼近的方向。感光区域上感知的
阴影面积的增加可能意味着捕食者正在逼近,这可能是深度感知的早期形式。这
样的进化过程只是一种分析,有依据说明在人类视觉系统中探测阴影逼近的机能
直接与感知物体在深度上的移动有关。对人类试验者进化的心理物理学实验和
对猫进行的生理学实验都支持这种机理的存在。这种类型的机理与Marr于20
世纪六七十年代提出的从视网膜上的二维表象开始,经过一个或多个中间表象计
算再作三维解释的机理不同。
(2)视觉感知是个自动进行的过程。它抵制根据与其相矛盾的知识作出的
修改。实验证明,如果让一个观察者先观察一个旋转着的收缩螺丝,那么在他习
惯以后再去观察另一个物体,如一张人脸,就会感到人脸在膨胀。观察者可能已
经知道人脸并没有膨胀,但这并不妨碍得到这种膨胀的感觉。还有许多例子可证
明人会出现这种与常识或已知情况相矛盾的感觉。虽然与感觉相矛盾的知识不
能改变人的感觉,但显然它可影响人对视觉刺激作出不同的反应。一个人如果根
据情况已知不会有大的物体正在逼近,那么当他看到出现一个影子时不会逃跑。
但当影子突然出现时,他还会不自觉地感到害怕。人类虽然已具有较高级的理解
能力,但视觉系统似乎保留着对某种刺激自动作出反应的能力。从进化的观点,
感知与知识相分离可能是有道理的,但对用于准确分析三维景物的视觉系统来说
就是不可取的。
(3)感知对启发式知识的应用。自然环境中的许多物体是刚体,所以在进化
过程中发展起来的人类视觉系统在根据视网膜上的物体投影分析物体时假设物
体是刚体以简化分析是有道理的。例如,如果视网膜上成像的大小有变化,而形
状保持不变,就可认为物体的远近起了变化。但在某些特殊情况下,在分析成像
的大小变化时视觉系统并不采用通常的刚性物体的假设,而是采用不同于刚性假
设的其他特殊假设。
除了以上特点以外,人类视觉系统有分辨率高、识别能力强、能进行灵活推理
等优点,但也存在三维形状或姿态估计错误的现象。综上所述,从建立通用的计
算机视觉系统的角度来看,关键点不是机械地模仿人类视觉系统,而是通过对人
类视觉系统的研究发现是什么因素使人类视觉系统的性能如此之好,并且把它结
合到计算机视觉系统中去。
1.2.4 人类视觉如何识别人脸
心理学和神经科学的研究成果对于设计机器人脸感知算法有着重要的借鉴
和指导意义。为了更好地设计人脸的计算机自动感知系统,我们首先应当了解人
类是怎样认识人脸的。针对这一问题,国内外许多学者做了大量的工作,本节将
介绍几个人脸认知心理学方面有趣的实验和较成熟的理论结果。
1.人脸认知心理实验
1)人脸的感知是全局还是局部特征分析的结果
在对人脸的感知和识别中,全局和局部特征的分析和处理是非常重要的。全
局特征一般用来进行粗略的匹配,局部特征则可以提供更为精细的确认。但是,
一个必须提及的现象是:如果存在某种奇特的局部特征,则全局的特征描述可能
就用不到了,此局部特征会首先被用来确定身份。例如,人们在回忆人脸时,一般
会快速地集中在那些比较奇特的特征上,如大耳朵、鹰钩鼻等。支持“人脸识别比
其他物体识别需要更多的全局特征”的一个强有力的证据是“人脸倒转实验”。研
究表明,倒转的人脸比正常的人脸更难识别。一个非常好的例子就是英国约克大
学的彼得?托马逊教授的“撒切尔夫人倒像实验”――他将两幅面积相同的图片,
放入四方格内上部,如图1-1(a)、(b)所示,位于上方的两幅图片是撒切尔夫人的
倒立头像。粗看起来,两幅头像一模一样。正立之后[图1-1(c)、(d)]观众才发
现,左边的撒切尔夫人是人们所熟知的样子,而右边的撒切尔夫人头像完全不是
正常面孔的样子,她的眼睛是“倒”的,鼻子是“歪”的,嘴巴的形状也十分奇怪。这
就是面孔视觉中的倒脸效应。也就是说,在一定的场景下,人们在识别一个人脸
时,全局信息往往会应用较多。
2)“瘦”脸效应
2010年度“最佳视觉错觉”颁奖大会在意大利举办,一幅名为?胖瘦脸错觉?
的作品引起了很多观众的兴趣。托马逊发现,倒立面孔可以让脸“减肥”。图1-2
中的两张图片是一名胖乎乎的英国中年男子。他将左边的照片倒立起来,右边的
照片则保持正立状态。在左边那幅倒立照片里,这个中年男子看起来似乎消瘦了
很多。事实上,“倒脸效应”的产生,与人类对于面孔的认知能力息息相关。在大
脑腹侧枕区的纺锤体中,存在一个面孔识别区域,这个区域一般被称为“纺锤体面
孔识别区域”。它擅长对人们遇到的正立面孔进行加工,而对倒立的面孔则存在
识别上的缺陷。
3)识别因素实验
在中国科学技术馆网站(http:b2museum.cdstm.cnidentification)上,由
中国科学院自动化研究所生物识别与安全技术研究中心设计了一系列人脸识别实
验,让参与者在实验的过程中体会自己到底是如何辨别人脸的。实验设计如下:
实验共进行4组测试。在每组测试中要求参与者对8个人进行识别,每个人
|
|