最新刊期

    2004 9 7

      综述

    • 增强现实综述

      朱淼良, 姚远, 蒋云良
      2004, 9(7): 767. DOI: 10.11834/jig.200407144
      摘要:增强现实(augmented reality,AR)技术可以将虚拟的物体合并到现实场景中,并能支持用户与其进行交互,它已经成为虚拟现实研究中的一个重要领域,也是人机界面技术发展的一个重要方向。为了使人们对其有所了解,该文首先概略描述了这个领域的主要研究内容和进展情况,并详细介绍了增强现实中的支撑技术、开发工具和相关理论;然后针对当前AR应用的现状,分析了实现中的难点问题,并给出了与AR普及应用密切相关的一些系统框架和开发平台的描述,最后介绍了几个典型的AR应用实例。  
      关键词:增强现实;虚拟现实;人机界面;AR技术;综述;光学透视式头盔显示器   
      12214
      |
      374
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56156534 false
      更新时间:2024-05-07

      学术论文与技术报告

    • 基于解析形式的二维参数可变形模板匹配算法

      汤泽滢, 卢汉清, 罗建书
      2004, 9(7): 775. DOI: 10.11834/jig.200407145
      摘要:为了更好地进行图像轮廓提取,对基于解析形式的二维参数可变形模板匹配方法中的模板结构、形变方式、离散化方案、内外部能量函数及优化算法等方面进行了研究与改进,并以生物体为原型,提出了一种具有3种生物组织结构的、形变方式可通过模板结构加以明确控制的、新的参数可变形模板匹配算法,该新算法是利用Gaussian函数来扩展外部力的作用域,并采用贪心优化快速算法进行能量函数优化。实验结果表明,这一新的模板匹配算法具有良好的轮廓提取速度、提取精度及稳定性。  
      关键词:轮廓提取;计算机视觉;参数可变形模板;能量函数;作用域扩展;贪心优化算法   
      3335
      |
      242
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56154889 false
      更新时间:2024-05-07
    • 一种基于链码的三维心血管图像匹配算法

      余霞, 辜嘉, 舒华忠
      2004, 9(7): 781. DOI: 10.11834/jig.200407146
      摘要:为了快速准确地进行三维心血管图像匹配,以帮助医生更加准确地进行心血管疾病的治疗,提出一种基于链码理论的三维心血管图像心血管中轴线的匹配方法,即首先将二维的Freeman编码拓展至三维空间,然后将其用于对已获取的三维心血管进行编码,以便于实现对不同时刻的三维心血管图像心血管中轴线的匹配。另外,还对模式识别中链码的串匹配算法作了一个简要介绍,并讨论了其中的编码、代价函数、归一化的链间距离等难点。为了验证该算法的效果,还选择了两种构造替换代价函数的方法对三维心血管进行了实验,并利用标准公式对实验结果进行了评估。实验结果表明,利用两种代价函数都可以实现图像的匹配,但是匹配的程度有较大差异,其中利用第2种代价函数可以得到更加令人满意的匹配结果。  
      关键词:心血管图;图像匹配;链码;串匹配;代价函数;模式识别   
      2867
      |
      216
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56154388 false
      更新时间:2024-05-07
    • 多网格法解总变分问题及在医学图像增强中的应用

      陈胜, 杨新, 姚丽萍, 孙锟
      2004, 9(7): 787. DOI: 10.11834/jig.200407147
      摘要:传统的各向同性平滑方法,如拉普拉斯平滑方法,虽然能去掉图像的噪声,但同时也可能使图像的边缘信息模糊,甚至丢失。针对这种情况,基于总变分的平滑方法得到重视,因为该方法可以在去除噪声的同时,对边缘的信息进行增强,但是由于基于总变分的平滑方法计算量大,且用松弛法迭代的收敛速度比较慢,因此引入了多网格预处理的共轭梯度算法来解总变分问题。计算结果表明,共轭梯度法的收敛速度明显高于松弛法,而采用多网格法收敛速度还可以得到进一步提高。为说明该方法的优点,最后对用这两种方法处理的超声医学图像的收敛曲线和平滑结果进行了比较。  
      关键词:医学图像;图像增强;总变分;多网格;共轭梯度;平滑法   
      2645
      |
      211
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56156461 false
      更新时间:2024-05-07
    • 掺气水流中气泡区域的双层动态阈值分割方法

      钱学明, 朱虹, 祝培, 冯春来, 陈刚
      2004, 9(7): 793. DOI: 10.11834/jig.200407148
      摘要:准确地提取出掺气水流中的气泡,是利用图像测量方法进行水流特性分析的前提。由于掺气水流中的气泡是无色透明的、对比度低,而且由于实验过程的光照不均,从而给图像高精度分割带来困难。由于光照不均,致使掺气水流图像中,气泡信息强弱不均,此时又会因强信息淹没弱信息而导致气泡漏提取或提取气泡缺损,为解决此问题,提出了一种双层动态阈值的分割方法,即首先在第1层完成对气泡所在局部区域的定位,再通过贴标签处理确定出每一个气泡的局部区域;然后在第2层的精分割中,对所有局部区域进行精细分割,以实现气泡区域的精确提取。实验结果证明,该方法可以大大提高气泡提取的精度。  
      关键词:掺气水流;图像分割;气泡;双层动态阈值;图像测量   
      2433
      |
      208
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56155603 false
      更新时间:2024-05-07
    • 全权, 张弘, 谢凤英
      2004, 9(7): 798. DOI: 10.11834/jig.200407149
      摘要:为了从一新的角度来解决图像形状识别问题,提出了一种从电场角度引出的基于边缘特征归一化的形状识别算法,即在图像处理过程中,像素将被赋予电量,各个图像的形状信息是用带电像素在三维空间产生的电势与电场强度的值来表征。该算法处理都是基于二值图像,并先通过边缘检测技术找出图像边缘信息,然后通过对边缘进行多边形逼近来得出边缘的角点信息,最后再对归一化的观测点进行电势与电场强度的计算。由于一个图形存在着无穷的观测点,因此在实际运用中合理选择观测点是重要且必要的,因为它能更加合理地反映图形的形状信息,故更加适合计算机对图形形状的判断。实验表明,当被识别的二值图像发生旋转、位移、变形时,该方法都能取得比较好的识别效果。  
      关键词:电势;电场强度;多边形逼近;归一化形状识别;观测点;图像处理   
      2509
      |
      208
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56154421 false
      更新时间:2024-05-07
    • 一种用区域直方图表示与描述形状的方法

      谭明金, 刘凯
      2004, 9(7): 804. DOI: 10.11834/jig.200407150
      摘要:众所周知,形状的表示与描述是模式识别的中心内容.然而,大多数简单类型的二维形状描述算法,无论是基于边界特性还是基于区域特性的,都有一定的应用范围或者在性能上存在某些不足.针对这样的情况,基于区域边界上当前像素与前后两个相邻像素的坐标关系,提出了一种称之为区域直方图的用于区域形状表示与描述的通用方法.该区域直方图是按照一定的分类与计算规则将区域沿边界序列化而得到的水平间距形式,它在像素意义上表示了区域的边界长度与面积.利用Rosen与Gleason推荐的标准二维形状进行了形状描述能力的定量测试以及同类型算法的对比试验,结果表明,该方法在区域形状描述方面显得很有效,能满足复杂区域形状的表示与描述要求,并且表现出较好的鲁棒性.它为区域形状的表示与描述提供了一种新的有效手段,从而在模式识别等机器视觉方面表现出一定的应用价值。  
      关键词:区域直方图;形状表示;形状描述;模式识别;机器视觉   
      2505
      |
      207
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56154795 false
      更新时间:2024-05-07
    • 有限衍射超声三维成像及其表面重建方法

      刘立庄, 卞正中, 李彬
      2004, 9(7): 810. DOI: 10.11834/jig.200407152
      摘要:为了正确快速地进行超声三维图像重建,讨论了有限衍射波束三维脉冲回波成像新方法,即使用有限衍射阵列声束一次发射成像,不仅成像区域声束不会发生扩散,而且可得到高信噪比、高帧率的超声三维图像。针对成像后由获取的数据归一化形成的空间散乱数据场,提出了一种新的插值三维重建算法,该算法从散乱数据场中自动提取边界,首先构造出一个辅助曲面,然后通过一种特殊的Hermite插值,在数据点的矩形作用域集合内,对辅助曲面进行变形,进而得到最终的插值曲面。实验结果表明,由于该算法无须三角剖分,因而计算速度快,且光顺效果好。  
      关键词:有限衍射阵列波束;脉冲回波成像;表面重建;Hermite插值;图像处理   
      3198
      |
      182
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56156701 false
      更新时间:2024-05-07
    • 运动模糊图像的降质过程分析与恢复技术研究

      张秉仁, 陈里铭, 高游
      2004, 9(7): 815. DOI: 10.11834/jig.200407153
      摘要:在获取图像的过程中,由于被摄物与成像系统产生相对运动,使得图像的像素并不代表该点的实际灰度,而是一定范围内相邻像素灰度值的叠加。为了有效地恢复运动模糊图像,从像素运动的角度分析了因运动造成的图像模糊的实际过程,并首先揭示了运动造成图像降质的内在原因,然后根据模糊图像像素间的关系建立了一维和二维由匀速直线运动所造成的模糊图像的模糊模型,并依据图像降质过程的逆过程推导出恢复模型。为验证该模糊图像恢复技术的效果,对匀速直线运动造成的图像模糊进行了模拟和恢复实验,取得了令人满意的效果,尤其对字母的恢复,效果更好。另外,对边界像素问题还进行了专门的讨论,同时对恢复过程中产生误差的原因也进行了分析,最后总结了该算法的优越性和需要进一步改进的问题。  
      关键词:像素运动;模糊模型;恢复模型;一维运动;二维运动;图像处理   
      3386
      |
      161
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56153743 false
      更新时间:2024-05-07
    • 基于颜色和形状特征的彩色图像检索方法

      孙君顶, 崔江涛, 毋小省, 周利华
      2004, 9(7): 820. DOI: 10.11834/jig.200407154
      摘要:针对基于内容的彩色图像相似性检索问题,提出了一种新的相似性彩色图像检索方法,该方法既考虑了图像的颜色特征,也考虑了图像的空间信息特征,即在对HSV颜色模型进行特殊处理的基础上,将提取的色调不变量作为图像的颜色特征,同时设计了图像状态矩阵来描述图像的形状信息和空间位置信息。在进行图像间的相似性测量时,为了结合不同的子特征进行全局的相似性检索,还采用Guassian模型对不同子特征间的距离进行了归一化处理。用不同类型的图像对这种方法进行的试验结果表明,它用于图像的相似性检索是很有效的,并具有较高的检索效率。  
      关键词:相似性检索;色调直方图;状态矩阵;图像检索;转移概率矩阵;HSV颜色模型   
      3091
      |
      214
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56154923 false
      更新时间:2024-05-07
    • 图像清晰度评价方法研究

      王鸿南, 钟文, 汪静, 夏德深
      2004, 9(7): 828. DOI: 10.11834/jig.200407155
      摘要:数字图像的清晰度评价一直是各类数字成像系统的一个关键问题,而在已有的一些的评价参数中,由于评价方法不同,均存在一些局限性,为此,针对图像的清晰程度提出一种新的评价方法,目的在于能够快速、准确地评价数字图像的清晰度。该评价方法评价参数可通过改进边缘锐度算法(EAV)得到,然后与机测MTF值的变化趋势一起做曲线回归分析,以便和其他传统清晰度评价参数做对比。通过上百幅各类数字图像的测试,结果表明,该评价参数与数字成像系统的MTF值变化有着很好的正相关关系,其不仅能够更准确地反应数字图像清晰度变化的趋势,而且便于简捷、快速地应用于各类数字图像的清晰度评价。  
      关键词:清晰度;曲线回归分析;点锐度算法;调制传递函数;数字图像;数字成像系统   
      5040
      |
      304
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56153686 false
      更新时间:2024-05-07
    • 一种栅格图层的模糊叠置分析模型

      虞强源, 刘大有, 王生生
      2004, 9(7): 832. DOI: 10.11834/jig.200407156
      摘要:为了更好地进行GIS空间分析,根据GIS应用领域中属性数据的区间值特征,首先利用区间值模糊集来描述模糊属性数据的模糊图层,然后基于区间值模糊集给出了一种栅格图层的模糊叠置分析模型,并改进了基于经典模糊集的模糊叠置分析方法。该模型利用区间值模糊集的基本运算,可以实现普通模糊叠置和加权模糊叠置,而采用区间值,则可以减少属性值模糊性的丢失,且叠置结果符合人们的认知和推理规律,实例结果表明,该模型能够较好地解决区间值属性图层间的模糊叠置分析问题。  
      关键词:地理信息系统;栅格图层;模糊叠置分析;区间值;区间值模糊集;GIS   
      2912
      |
      193
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56154680 false
      更新时间:2024-05-07
    • 基于连续小波变换的NOAA影像尺度分析

      陈建裕, 郭德方
      2004, 9(7): 837. DOI: 10.11834/jig.200407157
      摘要:小波变换具有数学显微镜特点和频域带通特性,可用于对遥感图像进行分析,为了探索更好的遥感图像尺度分析方法,提出利用二维连续小波变换(墨西哥帽小波)结合地物类型分布图来对NOAA/AVHRR影像的4波段数据进行尺度分析。结果表明,在小尺度下连续小波变换系数可显示不同地物类型、相对差异、位置及形状等信息,可用作细致分析;而在大尺度下该系数则主要表现了由水陆、地貌导致的地域差异,可用于概貌观察。另外,不同时相数据的大尺度分析对比,还体现了空间格局和变化趋势。通常小波变换系数确定的不同地物类型的尺度曲线反映了不同地物的影像信号强度和相互影响,而过零点位置的变化则反映了信号的突变。  
      关键词:连续小波变换;尺度分析;细微分析;宏观观察;墨西哥帽小波;NOAA影像   
      2167
      |
      211
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56154725 false
      更新时间:2024-05-07
    • 基于小波分析的等高线数据压缩模型

      朱长青, 王玉海, 李清泉, 柳林涛
      2004, 9(7): 841. DOI: 10.11834/jig.200407158
      摘要:鉴于矢量地图数据压缩在地形环境仿真、制图综合、GIS等研究中具有重要作用,为此,利用小波变换理论和矢量地图数据的特点,提出了一种用于等高线数据压缩的模型和方法,即首先,基于小波变换的特征,提出了基于小波变换的等高线数据压缩的基本思想;然后,根据等高线数据的小波变换特点,研究了小波变换的边界处理;同时,给出了用于等高线数据压缩的特征点选取方法;并提出了基于小波变换的等高线数据压缩模型;最后,根据提出的压缩模型,对实际等高线数据进行了实验。理论分析和实验结果表明,该方法不仅能保持较高的压缩比,而且能使压缩后的数据保留原来数据的变化趋势,从而较好地反映了原数据的内在特性和规律性。  
      关键词:小波分析;等高线数据压缩;边界处理;特征点追踪;矢量地图;制图综合;GIS   
      2932
      |
      490
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56156651 false
      更新时间:2024-05-07
    • 改进的平面模板两步法标定摄像机

      毛剑飞, 邹细勇, 诸静
      2004, 9(7): 846. DOI: 10.11834/jig.200407159
      摘要:最近,张正友提出用平面模板两步法来标定摄像机。该方法能高精度地标定摄像机,且简便易行,可以说是两步法标定的代表,但其算法模型仅考虑了镜头径向畸变,其对切向畸变较大的场合,如鱼眼镜头成像,则不适用。为此,通过改进其摄像机模型,提出了一种改进的两步法,该方法先用图像中心附近点求取初值,由于图像中心附近点畸变很小,故求取的初值能很好地逼近准确值,然后采用一种基于内部映射牛顿法的子空间置信域法通过求精来得到所有参数。仿真实验和真实实验的结果表明,该方法的标定精度要优于张正友的方法,鲁棒性也更好。  
      关键词:摄像机;标定;平面模板两步法;切向畸变;子空间置信域法;图像中心附近点   
      3059
      |
      214
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56156496 false
      更新时间:2024-05-07
    • 基于路径识别的移动机器人视觉导航

      张海波, 原魁, 周庆瑞
      2004, 9(7): 853. DOI: 10.11834/jig.200407161
      摘要:跟随路径导引是自主式移动机器人广泛采用的一种导航方式,其中视觉导航具有其他传感器导航方式所无法比拟的优点,是移动机器人智能导航的主要发展方向。为了提高移动机器人视觉导航的实时性和准确性,提出了一个基于路径识别的视觉导航系统,其基本思想是首先用基于变分辨率的采样二值化和形态学去噪方法从原始场景图像中提取出目标支持点集,然后用一种改进的哈夫变化检测出场景中的路径,最后由路径跟踪模块分直行和转弯两种情况进行导航计算。实验结果表明,该视觉导航系统具有较好的实时性和准确性。  
      关键词:自主式移动机器人;视觉导航;路径识别;跟随路径导引;智能导航   
      4262
      |
      265
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56155489 false
      更新时间:2024-05-07
    • 一种基于直线模型的道路识别算法研究

      徐友春, 王荣本, 李克强, 赵玉凡
      2004, 9(7): 858. DOI: 10.11834/jig.200407162
      摘要:为了提高道路识别的鲁棒性和抗干扰能力,提出了一种道路边缘识别算法。该算法的创新点在于采用自然边界作为道路识别的依据,同时算法也可以将白色路标作为识别道路边缘的标志。由于道路的自然边界不像车道标志线那样容易受到污染,因而使该算法具有了较高的鲁棒性。该算法是采用像素级特征和帧图像特征来识别道路边缘,可称为全局道路边界模型。在模型中由于采用了有关的道路约束条件,因而使得算法具有较好的抗干扰能力。该算法包括初始检测算法和跟踪算法两个部分,其中在跟踪算法中采用感兴趣区域算法(ROI)来限制检测区域,以提高实时性。最后,还提出了一个道路边界可信度检测函数,该函数可以用于计算道路边缘检测结果的可信程度。  
      关键词:智能车辆;道路边界检测;感兴趣区域;直线模型;全局道路边界模型   
      2734
      |
      257
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56156321 false
      更新时间:2024-05-07
    • 静态彩色图像的多维DCT变换压缩

      邵凌一, 李久贤, 余加兵
      2004, 9(7): 865. DOI: 10.11834/jig.200407163
      摘要:为了在高信噪比条件下来对静态彩色图像进行高倍压缩,提出了一种具有自适应功能的多维离散余弦变换图像编码算法。该算法首先将图像分割成互不覆盖的 8× 8子块;然后抽取每个子块的统计特征,再根据子块的方差和均值来判断子块内部信息的丰富程度,其中对于内部信息丰富的子块,可利用三维DCT编码来消除块内相邻像素间、色彩空间Y、U、V各分量间的相关性,而对于内部信息不丰富的子块,则利用四维DCT编码来消除块内相邻像素间、色彩空间Y、U、V各分量间、相邻子块间的相关性;最后对变换系数进行量化编码。实验结果证明,此算法可以提供比JEPG更高的压缩率和更高的平均峰值信噪比  
      关键词:图像处理;离散余弦变换;DCT;图像压缩;静态彩色图像   
      2933
      |
      139
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56154845 false
      更新时间:2024-05-07
    • 一种基于单环结构的扩展基本层FGS视频编码方法

      江涛, 张兆扬, 马然, 石旭利
      2004, 9(7): 869. DOI: 10.11834/jig.200407164
      摘要:可分级编码是解决Internet流视频应用中网络带宽不断波动的一种有效方法,所以MPEG-4标准中采用了FGS(fine granularity scalability)编码方法来获得精细颗粒可分级能力,但其代价是编码效率的下降。为解决此问题,现提出在增强层中采用运动补偿的MC加FGS(motion compensation加FGS)结构,用于去除FGS方案中增强层在时域上的冗余,以提高FGS方案编码效率的双环和单环两种方法。在比较了两种结构各自的优缺点后,选定了一种复杂度小、实现简单、效率高的单环结构,并提出了对单环结构的缺陷进行改善的方法。实验结果表明,该方法的编码性能优于MPEG-4 FGS方法。  
      关键词:流视频;精细颗粒可分级;编码效率;运动补偿;MPEG-4   
      2378
      |
      196
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56154595 false
      更新时间:2024-05-07
    • 一种改进的最佳时频原子搜索策略

      刘利雄, 贾云得, 廖斌, 张敏
      2004, 9(7): 873. DOI: 10.11834/jig.200407165
      摘要:在极低编码速率条件下,Neff和Zahor提出的基于匹配跟踪信号分解的视频编码器不仅具有比H.263编码器更高的编码性能,而且能够避免产生人眼敏感的方块效应,但由于该算法需要在一个冗余字典里搜索最佳匹配误差结构的原子函数,其实现所需要的运算量比传统的编码器要高很多,因而影响了该编码器的效率。为了提高编码效率,在对能量优先原子搜索策略进行分析的基础上,提出了一种改进的全搜索策略和加权能量优先搜索策略,从而改进了最佳时频原子搜索策略。最后还对搜索策略的编码性能和运算效率进行了评价和实验。  
      关键词:视频编码;原子搜索;匹配跟踪;编码器   
      2693
      |
      207
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56155287 false
      更新时间:2024-05-07

      本期目录

    • 一种欠约束草图求解方法的研究

      董玉德, 谭建荣, 赵韩, 李道伦
      2004, 9(7): 878. DOI: 10.11834/jig.200407166
      摘要:基于约束的参数化描述及求解是计算机辅助设计研究的一个热点,欠约束图的求解是参数化设计的基本问题,为了提高欠约束草图求解的参数化设计效率,提出了一种基于隐式约束优先级的欠约束草图求解方法,并首先给出了欠约束图求解的一般方法以及欠约束图的基本特征,提出了利用隐式约束去匹配缺少的显式约束;然后将隐式约束按照一定的规则分成不同的优先级,再利用优先级高的隐式约束去匹配变动约束图中的欠约束,直到完成约束图的有向化;最后,探讨了无尺寸约束图有向化过程中的基本特点,并给出了无尺寸约束图的求解算法和应用实例。实例应用结果表明,效果较好。  
      关键词:参数化设计;欠约束;约束图;有向约束图;约束传播   
      2562
      |
      206
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56155317 false
      更新时间:2024-05-07
    • 一种基于三维模型和照片的合成“说话头”

      赖伟, 孙岭, 王仁华
      2004, 9(7): 886. DOI: 10.11834/jig.200407167
      摘要:视觉语音的研究已经成为人机交互技术中一个非常活跃的领域,在语音的相关视觉信息当中,最主要的是说话人的口型乃至整个头部的图像,即“说话头”(talking head)。为了合成具有真实感的三维“说话头”模型,提出了一种基于三维模型和真人照片来合成真实“说话头”的方法,即在一个中性的三维人头部模型的基础上,从任意人的正面和侧面两张照片当中,通过提取脸形和五官位置等特征参数来校正模型,并且从照片中提取皮肤和头发等纹理,使得合成的模型能在较大程度上贴近真人。该方法综合了基于三维模型和基于图像库的建模方法,因此同时具有两者的优点,即既能够灵活控制表情和口型,又可自由旋转,不仅可实时合成,而且合成效果接近真人,自然度高。已将此模型应用于视觉语音合成系统,并获得了满意的效果。  
      关键词:说话头;视觉语音合成;三维模型;人脸动画;人机交互   
      2729
      |
      208
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56156588 false
      更新时间:2024-05-07
    0