数字图像处理重点汇总(通用)-范文网

数字图像处理重点汇总

第一篇：数字图像处理重点汇总

数字图像处理心得

数字图像处理&视频处理之体会

姓名：宋彦

学号：08370902

班级：1310809

在这一学期，我选修了《数字图像处理基础》这门课程，同时，老师还讲授了一些视频处理的知识。在这里，梳理一下这学期学到的知识，并提出一些我对这门课程的建议。

图像处理是指对图像信息进行加工，从而满足人类的心理、视觉或者应用的需求的一种行为。图像处理方法一般有数字法和光学法两种，其中数字法的优势很明显，已经被应用到了很多领域中，相信随着科学技术的发展,其应用空间将会更加广泛。数字图像处理又称为计算机图像处理，它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。数字图像处理是从20世纪60年代以来随着计算机技术和VLSL的发展而产生、发展和不断成熟起来的一个新兴技术领域。数字图像处理技术其实就是利用各种数字硬件与计算机，对图像信息通过转换而得到的电信号进行相应的数学运算，例如图像去噪、图像分割、提取特征、图像增强、图像复原等，以便提高图像的实用性。其特点是处理精度比较高，并且能够对处理软件进行改进来优化处理效果，操作比较方便，但是由于数字图像需要处理的数据量一般很大，因此处理速度有待提高。目前，随着计算机技术的不断发展，计算机的运算速度得到了很大程度的提高。在短短的历史中，它却广泛应用于几乎所有与成像有关的领域，在理论上和实际应用上都取得了巨大的成就。

1. 数字图像处理需用到的关键技术

由于数字图像处理的方便性和灵活性，因此数字图像处理技术已经成为了图像处理领域中的主流。数字图像处理技术主要涉及到的关键技术有：图像的采集与数字化、图像的编码、图像的增强、图像恢复、图像分割、图像分析等。

图像的采集与数字化：就是通过量化和取样将一个自然图像转换为计算机能够处理的数字形式。

图像编码：图像编码的目的主要是来压缩图像的信息量，以便能够满足存储和传输的要求。

图像的增强：图像的增强其主要目的是使图像变得清晰或者将其变换为机器能够很容易分析的形式，图像增强方法一般有：直方图处理、灰度等级、伪彩色处理、边缘锐化、干扰抵制。

图像的恢复：图像恢复的目的是减少或除去在获得图像的过程中因为各种原因而产生的退化，可能是由于光学系统的离焦或像差、被摄物与摄像系统两者之间的相对运动、光学或电子系统的噪声与介于被摄像物跟摄像系统之间的大气湍流等等。

图像的分割：图像分割是将图像划分为一些互相不重叠的区域，其中每一个区域都是像素的一个连续集，通常采用区域法或者寻求区域边界的境界法。

图像分析：图像分析是指从图像中抽取某些有用的信息、数据或度量,其目的主要是想得到某种数值结果。图像分析的内容跟人工智能、模式识别的研究领域有一定的交叉。

2. 数字图像处理的特点

数字图像处理的特点主要表现在以下几个方面：

1) 数字图像处理的信息大多是二维信息，处理信息量很大。因此对计算机的计算速度、存

储容量等要求较高。

2) 数字图像处理占用的频带较宽。与语言信息相比,占用的频带要大几个数量级。所以在成

像、传输、存储、处理、显示等各个环节的实现上技术难度较大，成本亦高。这就对频带压缩技术提出了更高的要求。

3) 数字图像中各个像素不是独立的，其相关性大。在图像画面上，经常有很多像素有相同

或接近的灰度。所以，图像处理中信息压缩的潜力很大。

4) 数字图像处理后的图像受人的因素影响较大，因为图像一般是给人观察和评价的。

3. 数字图像处理的优点

数字图像处理的优点主要表现在4个方面。

1) 再现性好。数字图像处理与模拟图像处理的根本不同在于它不会因图像的存储、传输或

复制等一系列变换操作而导致图像质量的退化。只要图像在数字化时准确地表现了原稿，那么数字图像处理过程始终能保持图像的再现。

2) 处理精度高。将一幅模拟图像数字化为任意大小的二维数组，主要取决于图像数字化设

备的能力。

3) 适用面宽。图像可以来自多种信息源,它们可以是可见光图像，也可以是不可见的波谱图

像。只要针对不同的图像信息源，采取相应的图像信息采集措施，图像的数字处理方法适用于任何一种图像。

4) 灵活性高。图像处理大体上可分为图像的像质改善、图像分析和图像重建三大部分，每

一部分均包含丰富的内容。

4. 数字图像处理的应用领域

图像是人类获取和交换信息的主要来源，因此，图像处理的应用领域必然涉及到人类生活和工作的方方面面，随着人类活动范围的不断扩大,图像处理的应用领域也将随之不断扩大。

航天和航空技术：在飞机遥感和卫星遥感技术中用配备有高级计算机的图像处理系统来判读分析，既节省人力又加快了速度，还可以从照片中提取人工所不能发现的大量有用情报。生物医学工程：除了CT技术之外，还有对医用显微图像的处理分析，如红细胞、白细胞分类，染色体分析，癌细胞识别等。

通信工程：当前通信的主要发展方向是声音、文字、图像和数据结合的多媒体通信。在一定意义上讲，编码压缩是这些技术成败的关键。除了已应用较广泛的熵编码、DPCM编码、变换编码外，目前国内外正在大力开发研究新的编码方法，如分行编码、自适应网络编码、小波变换图像压缩编码等。

工业和工程领域：图像处理技术有着广泛的应用，如自动装配线中检测零件的质量并对零件进行分类，印刷电路板疵病检查，弹性力学照片的应力分析，流体力学图片的阻力和升力分析,邮政信件的自动分拣，在一些有毒、放射性环境内识别工件及物体的形状和排列状态，先进的设计和制造技术中采用工业视觉等等。

军事方面：图像处理和识别主要用于导弹的精确末制导,各种侦察照片的判读，具有图像传输、存储和显示的军事自动化指挥系统，飞机、坦克和军舰模拟训练系统等;公安业务图片的判读分析，指纹识别，人脸鉴别，不完整图片的复原，以及交通监控、事故分析等。文化艺术：电视画面的数字编辑、动画的制作、电子图像游戏、纺织工艺品设计、服装设计与制作、发型设计、文物资料照片的复制和修复、运动员动作分析和评分等等。

视频和多媒体系统：电视制作系统广泛使用的图像处理、变换、合成，多媒体系统中静止图像和动态图像的采集、压缩、处理、存贮和传输等。

电子商务：图像处理技术在电子商务中也大有可为,如身份认证、产品防伪、水印技术等。

在这门课程的最后，代课老师给我们讲授了数字视频处理，让我们了解到数字视频就是以数字形式记录的视频，和模拟视频相对的。数字视频有不同的产生方式，存储方式和播出方式。比如通过数字摄像机直接产生数字视频信号，存储在数字带，P2卡，蓝光盘或者磁盘上，从而得到不同格式的数字视频。然后通过PC，特定的播放器等播放出来。了解了数字视频发展过程和视频压缩的概念和分类等。

我们这门课程主要是上理论课，其中有很复杂的数学原理，专业术语多，基础知识要求高，理解起来有些困难。当初选择这门课是希望能有一些具体软件的教学。就我了解，视频处理的软件有MAYA、Premiere、绘声绘影、windows自带的MOVE MAKER;处理数字图像的软件主要有matlaB、photoshop、ImageJ(java图像处理程序)。其中，matlaB和PS

很具有教学性，这两个软件也运用的很广。

MATLAB全称是MatrixLaboratory(矩阵实验室)，一开始它是一种专门用于矩阵数值计算的软件，从这一点上也可以看出，它在矩阵运算上有自己独特的特点。实际运用中MATLAB中的绝大多数的运算都是通过矩阵这一形式进行的，这一特点决定了MATLAB在处理数字图像上的独特优势。理论上讲，图像是一种二维的连续函数，然而计算机对图像进行数字处理时，首先必须对其在空间和亮度上进行数字化，这就是图像的采样和量化的过程。

Photoshop是Adobe公司旗下最为出名的图像处理软件之一，集图像扫描、编辑修改、图像制作、广告创意，图像输入与输出于一体的图形图像处理软件，深受广大平面设计人员和电脑美术爱好者的喜爱。

如果能理论和实践相结合，相信我们会把数字图像处理理解的跟透彻，同时也锻炼了大家的动手能力。希望老师能考虑我的这点建议，多开设实际动手的课程。

第二篇：数字图像处理学习心得

数字图象处理心得体会

经过这几周的学习，我从一个什么都不了解的小白，变成了一个明白这门课程的意义的初学者，觉得学到了不少有用同时又很有趣的知识，也对数字图象处理有了新的理解。老师从数字图像处理的意义讲起，中间介绍了许多目前仍在应用的相关技术，让我明白了图像处理在我们生活中的重要性，下面我来谈谈我自己的学习成果和感受。

从定义上来说，图像处理是指按照一定的目标，用一系列的操作，来“改造”图像的方法。我觉得字面上的意思就是，对图像进行处理，得到自己想要的效果。图象处理的内容有很多种：几何处理，算术处理、图像增强、图像复原、图像重建、图像识别、图像压缩。而目前进行图像处理就是指用计算机对图像进行空域法和变换域法。资料上介绍说，数字图象处理起源于20世纪20年代，那时第一次通过海底电缆传输图像;1921年人们用电报打印机采用特殊字符在编码纸带中产生图像;1922年在信号两次穿越大西洋后，从穿孔纸带得到数字图像;1929年从伦敦到纽约用15级色调设备传送照片。到了20世纪60年代早期，计算机发展，有了第一台可执行有意义的图像处理任务的大型计算机，美国利用航天器传送了第一张月球照片。从20世纪60年代末到70年代初，开始用于医学图像、地球遥感、天文学等领域，如CT图像和X射线图像。至今，数字图象处理仍旧广泛应用于工业、医学、地理学、考古学、物理学、天文学等多个领域。比如，太空技术中的航天技术、空间防御、天文学;生物科学的生物学和医学;刑事(物证)上的指纹、人脸分析;国防方面的军事探测，导弹目标识别;工业应用中的产品检测还有日常生活中的照片编辑、影视制作。

从概念上来说，数字图像用f(x，y)表示一幅图像，x，y，f为有限、离散值。图像处理涉及到图像的分析和计算机视觉，其中分为低级处理、中级处理、高级处理。低级处理是指输入输出均为图像(如图像缩放、图像平滑);中级处理是输入图像，然后输出提取的特征(如区域分割、边界检测);高级处理则是理解识别的图像(如无人机驾驶，自动机器人)。数字图像处理的几个基本目的是：

图像输入->图像处理(增强、复原、编码和压缩)->图像输出。以人为最终的信息接收者，其主要目的是改善图像的质量。

图像输入->图像预处理(增强、复原)->图像分割->特征提取->图像分类->图像输出。另一类图像处理以机器为对象，目的是使机器或计算机能自动识别目标，称为图像识别。

图像输入->图像预处理->图像描述->图像分析和理解->图像解释。利用计算机系统解释图像，实现类似人类视觉系统理解外部知识，被称为图像理解或计算机视觉。其正确的理解要有知识的引导，与人工智能等学科有密切联系。当前理论上有不小进展，但仍是一个有待进一步探索的领域。

数字图像处理主要研究的内容包括：

1)图像变换：如傅里叶变换、沃尔什变换、离散余弦变换(DCT)等间接处理技术，将空间域的处理转换为变换域处理，不仅可减少计算量，而且可获得更有效的处理。目前小波变换在时域和频域中都具有良好的局部化特性，它在图像处理中也有着广泛而有效的应用。

2)图像编码压缩

图像编码压缩技术可减少描述图像的数据量(即比特数)，以便节省图像传输、处理时间和减少存储器容量。压缩可以在不失真前提下获得，也可以在允许的失真条件下进行。编码是压缩技术最重要的方法，它在图像处理技术中是发展最早且比较成熟的技术。

3)图像增强和复原

目的是提高图像的质量，如去除噪声，提高清晰度等。图像增强不考虑图像降质的原因，突出图像中所感兴趣的部分。如强化图像高频分量，可使图像中物体轮廓清晰，细节明显;如强调低频分量可减少图像中噪声影响。图像复原要求对图像降质的原因有一定的了解，建立“降质模型”，再采用某种方法，恢复或重建原来的图像。

4)图像分割

图像分割是数字图像处理中的关键技术之一。图像分割是将图像中有意义的特征部分提取出来，其有意义的特征有图像中物体的边缘、区域等，这是进一步进行图像识别、分析和理解的基础。虽然目前已研究出不少边缘提取、区域分割的方法，但还没有一种普遍适用于各种图像的有效方法。因此，对图像分割的研究还在不断深入之中，是目前图像处理中研究的热点之一。

数字图像处理的特点主要表现在数字图像处理的信息大多是二维信息，处理信息量很大。因此对计算机的计算速度、存储容量等要求较高;数字图像处理占用的频带较宽。与语言信息相比,占用的频带要大几个数量级。所以在成像、传输、存储、处理、显示等各个环节的实现上技术难度较大，成本亦高。这就对频带压缩技术提出了更高的要求;数字图像中各个像素不是独立的，其相关性大。在图像画面上，经常有很多像素有相同或接近的灰度。所以，图像处理中信息压缩的潜力很大。数字图像处理后的图像受人的因素影响较大，因为图像一般是给人观察和评价的。

数字图像处理的优点主要表现在再现性好、处理精度高、适用面宽、灵活性高等方面。图像处理大体上可分为图像的像质改善、图像分析和图像重建三大部分，每一部分均包含丰富的内容。

数字图像处理的主要应用有：

通讯技术---图像传真，电视电话，威信通讯，数字电视;

宇宙探索---其他星体图片处理;

遥感技术---农林资源调查，作物长势监视，自然灾害(水、火、风、虫等)监测、预报，地势、地貌以及地质构造测绘，找矿，水文、海洋调查，环境污染监测，等等;

生物医学---X射线、超声、显微图片分析，内窥镜图、温谱图分析，断层及核磁共振分析;工业生产---无损探伤，石油勘探，生产过程的自动化(识别零件，装配，质量检查)，工业机器人视觉;

计算机科学---文字、图像输入的研究，计算机辅助设计，人工智能研究，多媒体计算机与智能计算机研究;

气象预报---天气云图测绘、传输;

高能物理---核子泡室图片分析;

军事技术---航空及卫星侦察照片的判读，导弹制导，雷达、声纳图像处理，军事仿真;

侦缉破案---指纹识别，印鉴、伪钞识别，手迹分析;考古---恢复珍贵的文物图片，名画，壁画。

由此可见，数字图像在我们日常生活中占有多大的地位。它是我们生活中接触最多的图形类别，它伴随人们的生活、学习、工作，并在军事、医学和工业方面发挥着极大的作用，可谓随处可见，尤其在生活方面作为学生的我们会在外出旅游、生活、工作中拍下许多数字相片，现在已经进入信息化时代，图像作为信息的重要载体在信息传输方面有着声音、文字等信息载体不可替代的作用，并且近年来图像处理领域，数字图象处理技术取得了飞速发展。

通过课程学习，我们虽说还没有完全掌握数字图像处理技术，但也收获不少，对于数字图像方面有了更深入的了解，更加理解了数字图像的本质，即是一些数字矩阵，但灰度图像和彩色图像的矩阵形式是不同的。对于一些耳熟能详的数字图像相关术语有了明确的认识，比如常见的：像素(衡量图像的大小)、分辨率(衡量图像的清晰程度)、位图(放大后会失真)、矢量图(经过放大不会失真)等大家都能叫上口却知识模糊的名词。也了解图像处理技术中一些常见处理技术的实质，比如锐化处理是使模糊的图像变清晰，增强图像的边缘等细节。而平滑处理的目的是消除噪声，模糊图像，在提取大目标之前去除小的细节或弥合目标间的缝隙。对常提的RGB图像和灰度图像有了明确的理解，这对大家以后应用Photoshop等图像处理软件对图像进行处理打下了坚实的基础。

虽然这门课是只有7周理论课，但老师所讲的内容让我非常感兴趣，数字图象处理的应用贯通各个行业，遍布我们生活的电子产品，这让我学习后感觉离这些产品的使用和了解更进了一步。学习数字图象处理对我们学电子工程的学生非常有用，无论以后是否从事相关工作都让我感觉受益良多。随着现代电子技术发展的越来越快，我相信图像处理技术一定会有更大的进步，从国防到娱乐给我们的生活带来更多的便利，和更好的科学技术。

第三篇：数字图像处理学习心得

——学习数字图像处理后对于车牌识别过程的认识

本人导师张崎，主要从事智能交通方面的研究。高年级学长曾做过车牌识别的研究。在学完数字图像处理这门课后，于是有了这篇关于车牌识别系统的心得体会。

仔细翻阅了几遍平时上课做的笔记，梳理了下各种图像处理方法在各中图像处理中起到的作用。结合对实际车牌识别过程的了解，谈谈自己对图像处理的各种方法在识别过程中起到的作用。

老师总说图像处理就是不讲道理，我觉得这就是最大的道理。为什么有人能够把不讲道理的东西做出来?这其中实际上蕴藏着深刻的道理。就像爱因斯坦证明布朗运动是毫无规律的运动一样，你发现他是毫无规律的，这其实就是他最大的规律。我想，只有对图像有了深刻的认识，才能完成这种你也说不出道理的事。好了，现在我想结合这门课和车牌识别展开说说。

有时候，计算机跟人相比真的很傻，扔一张车牌尾号过来，不管它多么破旧、不清晰，人们能够轻而易举的读出上面的数字。而计算机呢?他要不停的运算、识别，而你算法上的一个小小漏洞，更会导致识别的大大不同。通过数字图像处理这门课的学习，我觉得可能通过下面的一些列步骤能较好的识别出车牌上的号码数字。

首先，我觉得我们需要将彩色的图片转换为灰色图像，这样便于计算机分析，计算机跟人刚好相反，好看的不一定好处理，而灰色的图像虽然不美观，但是正好适合计算机来处理。另一方面，将彩色图像转化为灰色图像也能减少图像所占的存储空间，简化和加快后续处理的工作。

其次，我觉得我们需要根据实际需要，对图像就行简单的预处理。我们应当让我们所关心的图像内容，显现的更加突出。而弱化那些我们所不关心的背景类似的东西。这里我觉得，我们就可以利用我们上课所学到的图像增强的知识了。需要注意的是，图像增强并不能增加原始图像的信息，只是通过某些技术有选择的突出对某一具体应用有价值的信息，即图像增强只通过突出某些信息，以增强对这些信息的辨识能力，而其他信息信息则被削弱，这就是我对图像增强的理解，

我认为他是我们后期识别车牌的重要准备，增强的好坏直接影响了后期识别的准确度和速度。

然后，图像增强后，我觉得我们就应该对处理后的图像就行边缘检测，这里就直接会用到我们上课所学到的边缘检测的各种方法，边缘是图像的最基本特征，边缘部分集中了图像的大部分信息。边缘确定和提取对于整个图像场景的识别是非常重要的。而上一部的图像强也增强了边缘信息。

下一步，我认为就应该进行图像分割了，把各个字母数字单独分割出来，便于后续的进一步识别。

最后，就应该开始识别这些分割出来的图像，这一部分，我们课上内容并没有涉及，查阅了些资料，找到了比较可行的办法。即模式识别。我理解的过程是，首先我们应该建立一个标准模版库，然后通过将提取出来的样品与标准模版进行比较，来识别他们。

这就是上完数字图像处理课，我所能想到的车牌识别的整个过程，基本上需要用到我们所学的所有内容，而且都是比较基础的知识，我觉得，往往一个图像处理的问题，就是应该分成很多小问题来解决，一步步简化问题。一步步将图像中我们所最关心的内容提取出来。

毕竟没有深入学习过这方面的知识，本文纯属心得体会，过程中难免存在很多不足或者错误。恳请老师指出。

第四篇：数字图像处理大纲总结

第一章：数字图像处理基础概念

★

1、数字图像处理的内容：

(1)图像获取、表示和表现(图像的数字化和图像变换) (2)图像增强 (3)图像复原 (4)图像重建 (5)图像压缩编码 (6)图像分割 (7)图像分析 (8)模式识别 (9)图像理解

★

2、数字图像处理的层次关系(P 3)：

狭义图像处理-------图像分析-----------图像理解。

抽象程度

低

高

数据量

大

小

语义

低层

1 ★编码效率 = 熵 / 平均码长

★

4、霍夫曼(Huffman)编码的特点和步骤(P 118)：

思想：在信源数据中出现概率越大的符号(灰度值)，编码以后相应的码长越短

步骤：

(1)把输入符号按出现的概率从大到小排列起来,接着把概率最小的两个符号的概率求和; (2)把它(概率之和)同其余符号概率由大到小排序,然后把两个最小概率求和; (3)重复(2),直到最后只剩下两个概率为止

(4)在上述工作完毕之后，从最后两个概率开始逐步向前进行编码。对于概率大的消息赋予0，小的赋予1。特点：

(1)编码是唯一可译码。短的码不会成为更长码的启始部分;

(2)编码的平均码长接近于熵;编码效率略高于费诺仙侬Fano-Shannon编码。

5、算术编码的特点：

(1)码字本身定义一个介于0和1之间的实数区间，该区间中的任何一个实数就代表要编码的消息序列。 (2)信源符号与码字之间不存在一一对应的关系。一个码字不是赋给某个信源符号，而是赋给整个消息序列。 (3)当消息中的符号数目增加时，用于描述消息的间隔变得更小，而表示间隔所需要的信息单元(如编码位数)变得更多了。

第七章

图像分割

1、图像分析的步骤：

(1)把图像分割成不同的区域或把不同的对象分开 (2)找出分开的各区域的特征

(3)识别图像中要找的对象或对图像进行分类

(4)对不同区域进行描述或寻找出不同区域的相互联系，进而找出相似结构或将相关区域连成一个有意义的结构

2、图像分割的基本策略

(1)分割算法基于灰度值的两个基本特性：不连续性和相似性

(2)检测图像像素灰度级的不连续性，找到点、线(宽度为1)、边(不定宽度)。先找边，后确定区域。

(3)检测图像像素的灰度值的相似性，通过选择阈值，找到灰度值相似的区域，区域的外轮廓就是对象的边

★

3、图像分割的方法

(1)基于边缘的分割方法：先提取区域边界，再确定边界限定的区域。 (2)区域分割：确定每个像素的归属区域，从而形成一个区域图。 (3)区域生长：将属性接近的连通像素聚集成区域

(4)分裂-合并分割：综合利用前两种方法，既存在图像的划分，又有图像的合并。

4、边缘检测算子：

基本思想：计算局部微分算子

一阶微分：用梯度算子来计算

特点：(1)对于阶跃状变化，会出现极大值(两侧都是正值，中间的最大)

(2)对于屋顶状变化，会过零点(两侧符号相反)不变部分为零。用途：用于检测图像中边的存在二阶微分：通过拉普拉斯来计算

特点：(1)对于阶跃状变化，会过零点(两侧符号相反)

(2)对于屋顶状变化，会出现负极大值(两侧都是正值，中间的最大)不变部分为零。用途：用于检测图像中边的存在

★

5、几种常用的边缘检测算子：

梯度算子：仅计算相邻像素的灰度差，对噪声比较敏感，无法抑止噪声的影响。 Roberts算子：与梯度算子类似，效果略好于梯度算子 Prewitt算子：在检测边缘的同时，能抑制噪声的影响 Sobel算子：(1)对4邻域采用带权方法计算差分

(2)能进一步抑止噪声，但检测的边缘较宽

Kirsch算子(方向算子)：在计算边缘强度的同时可以得到边缘的方向，各方向间的夹角为45º

用法：取其中最大的值作为边缘强度，而将与之对应的方向作为边缘方向(共8个模板) ★Laplacian算子：

优点：(1)各向同性、线性和位移不变;

(2)对细线和孤立点检测效果较好。

缺点：(1)对噪音的敏感，对噪声有双倍加强作用;

(2)不能检测出边的方向; (3)常产生双像素的边缘。

注意：由于梯度算子和Laplace算子都对噪声敏感，因此一般在用它们检测边缘前要先对图像进行平滑。

Marr算子：马尔算子是以拉普拉斯算子为基础，首先用一个二维高斯函数对图像卷积以减低图像噪声的影响(平滑);再用二阶导数差分算子(拉普拉斯算子)计算优点：是快速，能得到一个闭合的轮廓。缺点：由于使用二阶导数，对噪声敏感。

曲面拟合法：求平均后再求差分，因而对噪声有抑制作用

5、单方向锐化处理：

定义：单方向的一阶锐化是指对某个特定方向上的边缘信息进行增强。因为图像为水平、垂直两个方向组成，所以，单方向锐化实际上是包括水平方向与垂直方向上的锐化。

特点：处理结果对于人工设计制造的具有矩形特征物体(例如：楼房、汉字等)的边缘的提取很有效。但是，对于不规则形状(如：人物)的边缘提取，则存在信息的缺损。后处理：这种锐化算法需要进行后处理，以解决像素值为负的问题

方法1：整体加一个正整数，以保证所有的像素值均为正。

这样做的结果是：可以获得类似浮雕的效果。

方法2：将所有的像素值取绝对值。

这样做的结果是，可以获得对边缘的有方向提取。

方法3：为了检测边缘点，选取适当的阈值T，对梯度图像进行二值化

这样形成了一幅边缘二值图像g(x,y)

6、交叉方向锐化处理：

特点：这类锐化方法对边缘的方向没有选择，又称为无方向的锐化算法。交叉Priwitt锐化算法：与Sobel相比，有一定的抗干扰性。图像效果比较干净交叉Soble算法：锐化的边缘信息较强

7、Canny边缘检测算子：

定义：Canny边缘检测——最优的阶梯型边缘检测算法

原理：图像边缘检测必须满足两个条件：一能有效地抑制噪声;二必须尽量精确确定边缘的位置。根据对信噪比与定位乘积进行测度，得到最优化逼近算子。这就是Canny边缘检测算子。

★最优边缘检测算子应有的指标：

(1)低误判率

(2)高定位精度

(3)抑制虚假边缘

8、边缘跟踪：

出发点：由于噪音的原因，边界的特征很少能够被完整地描述，在亮度不一致的地方会中断。因此典型的边检测算法后面总要跟随着连接过程和其它边界检测过程，用来归整边像素，成为有意义的边

概念：将检测的边缘点连接成线就是边缘跟踪(线是图像的一种中层符号描述) 由边缘形成线特征的两个过程：

(1)可构成线特征的边缘提取 (2)将边缘连接成线

连接边缘的方法：

(1)光栅跟踪：一种采用电视光栅行扫描顺序，结合门限检测，对遇到的像素进行分析，从而确定是否为边缘的跟踪方法 (2)全向跟踪：跟踪方向可以是任意方向，并且有足够大的跟踪距离的跟踪方法

特点：全向跟踪改进了光栅扫描跟踪法，跟踪时把初始点的八邻点全部考虑进行跟踪

9、阈值分割法：

基本思想：确定一个合适的阈值T，将大于等于阈值的像素作为物体或背景，生成一个二值图像，在四邻域中有背景的像素，既是边界像素。特点：(1)适用于物体与背景有较强对比的情况，重要的是背景或物体的灰度比较单一

(2)这种方法总可以得到封闭且连通区域的边界。通过交互方式得到阈值：实施方法：(1)通过光标获得样点值f(x0,y0)

(2)选取容忍度R (3)if (|f(x,y)–f(x0,y0)|  R)

set 255 通过直方图得到阈值：

基本思想：边界上的点的灰度值出现次数较少

取值的方法：取直方图谷底，为最小值的灰度值为阈值T 缺点：会受到噪音的干扰，最小值不是预期的阈值，而偏离期望的值;

改进：取两个峰值之间某个固定位置，如中间位置上。由于峰值代表的是区域内外的典型值，一般情况下，比选谷底更可靠，可排除噪音的干扰

else

set 0

10、复杂图像区域分割的主要步骤：

(1)自动直方图平滑 (2)确定区域分类数 (3)自动搜索阈值

11、特征空间聚类的步骤：

(1)任意选K个初始聚类中心值

(2)使用最小距离判别，将新读入的像素分到k类中的某一类 (3)重新计算中心值，中心值等于这类中元素的平均值 (4)当新旧差异不大时停止

12、质心区域增长法

(1)选择一个为划分类型的像素作为起点 (2)起点周围未被划分的点与起点所在区域的灰度平均值差异小于阈值合并为一区域，并标记

(3)从新合并来的像素开始，反复进行第(2)步

(4)反复进行(2)(3)，直到不能合并

(5)对图像中所有未被划分的像素反复(1)—(4)步

第八章二值图像处理与形状分析

★

1、如何判断像素是否可删除：

二值图像上改变一个像素的值后，整个图像的连接性不改变，则这个像素可删除

★

2、腐蚀算法的思想和步骤：

思想：设计一个结构元素，结构元素的原点定位在待处理的目标像素上，通过判断是否覆盖，来确定是否该点被腐蚀掉。步骤：(1)扫描原图，找到第一个像素值为1的目标点;

(2)将预先设定好形状以及原点位置的结构元素的原点移到该点;

(3)判断该结构元素所覆盖的像素值是否全部为1：

如果是，则腐蚀后图像中的相同位置上的像素值为1;

如果不是，则腐蚀后图像中的相同位置上的像素值为0;

(4)重复(2)和(3)，直到所有原图中像素处理完成。

作用：腐蚀处理可以将粘连在一起的不同目标物分离，并可以将小的颗粒噪声去除。

★

3、膨胀算法的思想和步骤：

思想：设计一个结构元素，结构元素的原点定位在背景像素上，判断是否覆盖有目标点，来确定是否该点被膨胀为目标点。步骤：(1)扫描原图，找到第一个像素值为0的背景点;

(2)将预先设定好形状以及原点位置的结构元素的原点移到该点;

(3)判断该结构元素所覆盖的像素值是否存在为1的目标点：

如果是，则膨胀后图像中的相同位置上的像素值为1; 如果不是，则膨胀后图像中的相同位置上的像素值为0; (4)重复(2)和(3)，直到所有原图中像素处理完成。

作用：膨胀处理可以将断裂开的目标物进行合并，便于对其整体的提取。

4、图形线性化：

思想：图像压缩或是图像分析的过程中需要用图形部分像素来代表整个图形，因此提出图形线化的思想方法：图像线化通常使用骨架法和图形细化两种方法骨架法：(1)骨架是从距离变换图得来，是距离变换图中灰度值最大的像元集合，

(2)即使是无空洞的连通图像它的骨架不一定连通。

(3)骨架可看作是图像压缩表示之一，对骨架图经过加粗运算(加粗量=骨架像元灰度值-1)可近似恢复成原图像。

细化：(1)细化是从二值图像中提取线宽为1像素的中心线的操作。

(2)细化与骨架化不同，只要原图像连通(不管有无空洞)，细化的结果总是连通的。

5、边界跟踪法：

理论基础：先根据某些严格的“探测准则”找出目标物体轮廓上的像素，再根据这些像素的某些特征用一定的“跟踪准则”找出目标物体上的其他像素。

跟踪准则：边缘跟踪从图像左上角开始逐像点扫描，当遇到边缘点时则开始顺序跟踪，直至跟踪的后续点回到起始点(对于闭合线)或其后续点再没有新的后续点(对于非闭合线)为止

实现步骤 (1)获得原图像的首地址，及图像的高和宽。

(2)开辟一块内存缓冲区，初始化为255。

(3)将图像进行二值化处理。

(4)跟踪边界点，找到1个边界点，就将内存缓冲区中该点相应位置置0。 (5)按照跟踪准则，重复执行(4)，直到回到初始点。

(6)将内存缓冲区的内容复制到原图像中

第五篇：数字图像处理读书笔记

本学期的数字图像处理课程已经进行了3周了，通过这3周的学习让我对数字图像处理有了一定的认知和理解。数字图像处理又称为计算机图像处理，它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。这门课程的前三章主要讲解了数字图像的目的、特点、应用和发展，图像的数字化显示与图像变换。

数字图像处理最早出现于20世纪50年代，当时的电子计算机已经发展到一定水平，人们开始利用计算机来处理图形和图像信息。数字图像处理作为一门学科大约形成于20世纪60年代初期。早期的图像处理的目的是改善图像的质量，它以人为对象，以改善人的视觉效果为目的。图像处理中，输入的是质量低的图像，输出的是改善质量后的图像，常用的图像处理方法有图像增强、复原、编码、压缩等。数字图像处理是通过计算机对图像进行去除噪声、增强、复原、分割、提取特征等处理的方法和技术。数字图像处理的产生和迅速发展主要受三个因素的影响：一是计算机的发展;二是数学的发展(特别是离散数学理论的创立和完善);三是广泛的农牧业、林业、环境、军事、工业和医学等方面的应用需求的增长。

一般来讲，对图像进行处理(或加工、分析)的主要目的有三个方面：(1)提高图像的视感质量，如进行图像的亮度、彩色变换，增强、抑制某些成分，对图像进行几何变换等，以改善图像的质量。(2)提取图像中所包含的某些特征或特殊信息，这些被提取的特征或信息

往往为计算机分析图像提供便利。提取特征或信息的过程是模式识别或计算机视觉的预处理。提取的特征可以包括很多方面，如频域特征、灰度或颜色特征、边界特征、区域特征、纹理特征、形状特征、拓扑特征和关系结构等。(3)图像数据的变换、编码和压缩，以便于图像的存储和传输。不管是何种目的的图像处理，都需要由计算机和图像专用设备组成的图像处理系统对图像数据进行输入、加工和输出。数字图像处理有以下几点基本特点：(1)目前，数字图像处理的信息大多是二维信息，处理信息量很大。如一幅256×256低分辨率黑白图像，要求约64kbit的数据量;对高分辨率彩色512×512图像，则要求768kbit数据量;如果要处理30帧/秒的电视图像序列，则每秒要求500kbit～22.5Mbit数据量。因此对计算机的计算速度、存储容量等要求较高。(2)数字图像处理占用的频带较宽。与语言信息相比，占用的频带要大几个数量级。如电视图像的带宽约5.6MHz，而语音带宽仅为4kHz左右。所以在成像、传输、存储、处理、显示等各个环节的实现上，技术难度较大，成本亦高，这就对频带压缩技术提出了更高的要求。 (3)数字图像中各个像素是不独立的，其相关性大。在图像画面上，经常有很多像素有相同或接近的灰度。就电视画面而言，同一行中相邻两个像素或相邻两行间的像素，其相关系数可达0.9以上，而相邻两帧之间的相关性比帧内相关性一般说还要大些。因此，图像处理中信息压缩的潜力很大。 (4)由于图像是三维景物的二维投影，一幅图象本身不具备复现三维景物的全部几何信息的能力，很显然三维景物背后部分信息在二维图像画面上是反映不出来

的。因此，要分析和理解三维景物必须作合适的假定或附加新的测量，例如双目图像或多视点图像。在理解三维景物时需要知识导引，这也是人工智能中正在致力解决的知识工程问题。 (5)数字图像处理后的图像一般是给人观察和评价的，因此受人的因素影响较大。由于人的视觉系统很复杂，受环境条件、视觉性能、人的情绪爱好以及知识状况影响很大，作为图像质量的评价还有待进一步深入的研究。另一方面，计算机视觉是模仿人的视觉，人的感知机理必然影响着计算机视觉的研究。例如，什么是感知的初始基元，基元是如何组成的，局部与全局感知的关系，优先敏感的结构、属性和时间特征等，这些都是心理学和神经心理学正在着力研究的课题。

在数字图像处理中图像的数字化显示是基础。将模拟图像转化成数字图像的过程就是图形、图像的数字化过程。这个过程主要包含采样、量化和编码三个步骤。

1.采样采样的实质就是要用多少点来描述一幅图像，采样结果质量的高低就是用前面所说的图像分辨率来衡量。简单来讲，对二维空间上连续的图像在水平和垂直方向上等间距地分割成矩形网状结构，所形成的微小方格称为像素点。一副图像就被采样成有限个像素点构成的集合。采样频率是指一秒钟内采样的次数，它反映了采样点之间的间隔大小。采样频率越高，得到的图像样本越逼真，图像的质量越高，但要求的存储量也越大。在进行采样时，采样点间隔大小的选取很重要，它决定了采样后的图像能真实地反映原图像的程度。一般来说，原图像中的画面越复杂，色彩越丰富，则采样间隔应越小。

由于二维图像的采样是一维的推广，根据信号的采样定理，要从取样样本中精确地复原图像，可得到图像采样的奈奎斯特(Nyquist)定理：图像采样的频率必须大于或等于源图像最高频率分量的两倍。

2.量化量化是指要使用多大范围的数值来表示图像采样之后的每一个点。量化的结果是图像能够容纳的颜色总数，它反映了采样的质量。例如：如果以4位存储一个点，就表示图像只能有16种颜色;若采用16位存储一个点，则有216=65536种颜色。所以，量化位数越来越大，表示图像可以拥有更多的颜色，自然可以产生更为细致的图像效果。但是，也会占用更大的存储空间。两者的基本问题都是视觉效果和存储空间的取舍。假设有一幅黑白灰度的照片，因为它在水平于垂直方向上的灰度变化都是连续的，都可认为有无数个像素，而且任一点上灰度的取值都是从黑到白可以有无限个可能值。通过沿水平和垂直方向的等间隔采样可将这幅模拟图像分解为近似的有限个像素，每个像素的取值代表该像素的灰度(亮度)。对灰度进行量化，使其取值变为有限个可能值。经过这样采样和量化得到的一幅空间上表现为离散分布的有限个像素，灰度取值上表现为有限个离散的可能值的图像称为数字图像。只要水平和垂直方向采样点数足够多，量化比特数足够大，数字图像的质量就比原始模拟图像毫不逊色。在量化时所确定的离散取值个数称为量化级数。为表示量化的色彩值(或亮度值)所需的二进制位数称为量化字长，一般可用8位、16位、24位或更高的量化字长来表示图像的颜色;量化字长越大，则越能真实第反映原有的图像的颜色，但得到的数字图像的容量也越大。

3.压缩编码数字化后得到的图像数据量十分巨大，必须采用编码技术来压缩其信息量。在一定意义上讲，编码压缩技术是实现图像传输与储存的关键。

数学里的变换，指一个图形(或表达式)到另一个图形(或表达式)的演变。图象变换是函数的一种作图方法。已知一个函数的图象，通过某种或多种连续方式变换，得到另一个与之相关的函数的图象，这样的作图方法叫做图象变换。

在图像变换中傅立叶变换就是应用最广泛的一种变换。数字图像经二维离散傅立叶变换后，其空间域处理可变换为变换域处理，它具有很多明显的优点，最突出的是算法运算次数将大大减少，并可采用二维数字滤波技术进行所需要的各种图像处理。

二位离散余弦变换其去相关性近似于K-L(Karhunen-Loeve)最佳变换,算法复杂度适中,易于硬件实现,且具有抗干扰能力强等优点,因此,DCT及IDCT被广泛应用于H.26

1、H.26

3、H.26

4、JPEG、MPEG等视频压缩标准中。

小波分解可以覆盖整个频域(提供了一个数学上完备的描述) ;小波变换通过选取合适的滤波器，可以极大的减小或去除所提取得不同特征之间的相关性; 小波变换具有“变焦”特性，在低频段可用高频率分辨率和低时间分辨率(宽分析窗口)，在高频段，可用低频率分辨率和高时间分辨率(窄分析窗口) ;小波变换实现上有快速算法(Mallat小波分解算法)。小波变换是一种信号的时间——尺度分析方法，他具有多分辨率分析的特点，而且在时频两域都具有表征信号

局部特征的能力，是一种窗口大小固定不变但其形状可变，时间窗和频率窗都可变的时频局部化分析方法。即再低频部分具有较高的频率分辨率和时间分辨率，在高频部分具有较高的时间分辨率和较低的频率分辨率，很适合探测正常信号中夹带的瞬态反常现象并展示其成分，所以被誉为分析信号的显微镜。

小波变换是一种新的变换分析方法，它继承和发展了短时傅立叶变换局部化的思想，同时又克服了窗口大小不随频率变化等缺点，能够提供一个随频率改变的时间一频率窗口，是进行信号时频分析和处理的理想工具。它的主要特点是通过变换能够充分突出问题某些方面的特征，因此，小波变换在许多领域都得到了成功的应用，特别是小波变换的离散数字算法已被广泛用于许多问题的变换研究中。从此，小波变换越来越引起人们的重视，其应用领域来越来越广泛。