机器人视觉系统中图像分割技术传统方法概论1

姓名:寇世文

学号:21011110234

【嵌牛导读】:随着人工智能技术的不断发展,智能机器人领域也得到了空前的发展。尤其是深度神经网络广泛应用于视觉系统中后,取得了许多很明显的成效。对于自主移动机器人来说,视觉系统有着十分重要的作用,而图像分割技术更是在这个系统中担任着十分重要的角色。传统的图像分割技术基本上已经能够将图像的前景和后景分隔开来,但是近年来随着深度学习算法的发展,人们开始将其应用到图像分割中,提出了很多分割网络,也达到了很好的分割效果。在实现图像分割的基础上,人们还使得分割具有了语义类别和标签,就是现在的语义分割。本文在介绍了语义分割的基础上又引出了新的任务分割场景,实例分割和全景分割。并且介绍了最近研究的热点三维点云的语义分割问题,阐述了其实现的必要性。

【嵌牛鼻子】智能机器人,图像分割、语义分割、计算机视觉

【嵌牛提问】图像分割技术的传统常见方法

【嵌牛正文】

一、引言

        计算机视觉,即computer vision,就是通过计算机来模拟人的视觉工作原理,来获取和完成一系列图像信息处理的机器。计算机视觉属于机器学习在视觉领域的应用,是一个多学科交叉的研究领域,其涉及数学、物理、生物、计算机工程等多个学科。

计算机视觉的主要应用有无人驾驶、人脸识别、无人安防、车辆车牌识别、智能传图、3D重构、VR/AR、智能拍照、医学图像处理、无人机、工业检测等。人驾驶又称自动驾驶,是目前人工智能领域一个比较重要的研究方向,让汽车可以进行自主驾驶,或者辅助驾驶员驾驶,提升驾驶操作的安全性。人脸识别技术目前已经研究得相对比较成熟,并在很多地方得到了应用,且人脸识别准确率目前已经高于人眼的识别准确率。安防一直是我国比较重视的问题,也是人们特别重视的问题,在很多重要地点都安排有巡警巡查,在居民小区以及公司一般也都有保安巡查来确保安全。车辆车牌识别目前已经是一种非诚成熟的技术了,高速路上的违章检测,车流分析,安全带识别,智能红绿灯,还有停车场的车辆身份识别等都用到了车辆车牌识别。3D重构之前在工业领域应用比较多,可以用于对三维物体进行建模,方便测量出物体的各种参数,或者对物体进行简单复制。计算机视觉还有很多应用,随着技术的发展,应用领域也会越来越多。在工业领域的应用,在机器人技术方面的应用等。

对于传统的图像分割过程,通常可以分为5个步骤,即特征感知、图像预处理、特征提取、特征筛选和推理预测与识别。通过研究发现,在视觉的早期的发展过程中,人们对于图像中的特征并没有表现出足够的关注。且传统的分割过程是把特征提取和分类分开来做的,等到需要输出结果的时候再结合到一起,可想而知其实现的困难程度。

在深度学习算法出来之后,卷积神经网络被广泛应用于计算机视觉技术中,也因此衍生出了很多的研究方向。深度学习主要是以特征为基础来进行比对,如在人脸识别方面,使用卷积神经网络分别对两张人脸进行不同位置的特征提取,然后再进行相互比对,最后得到比对结果。目前的计算机视觉的主要研究方向有图像分类、目标检测、图像分割、目标跟踪、图像滤波与降噪、图像增强、风格化、三维重建、图像检索、GAN等。本文主要是针对图像分割这一领域,进行简要的概述。

图像分割技术是计算机视觉领域的个重要的研究方向,是图像语义理解的重要一环。图像分割是指将图像分成若干具有相似性质的区域的过程,从数学角度来看,图像分割是将图像划分成互不相交的区域的过程。近些年来随着深度学习技术的逐步深入,图像分割技术有了突飞猛进的发展,该技术相关的场景物体分割、人体前背景分割、人脸人体Parsing、三维重建等技术已经在无人驾驶、增强现实、安防监控等行业都得到广泛的应用。

二、发展现状

        近来已经有很多学者将图像分割技术应用到移动机器人的控制中,能够做到在机器人运动的同时定位、构建地图并分割出不同的前景和后景,使视觉系统扫描到的图像具有语义信息。并有学者也致力于分割得更为准确和精细,不仅能够做到区分不同类的物体,也能够实现对同类的不同物体的分类,甚至可以做到在此基础上加上对背景的分割。由于我们生活的世界是三维空间,还有学者将图像场景还原到三维中,然后使用相关方法对整个三维场景进行分割。作为计算机视觉的研究中的一个较为经典的难题,图像分割这一领域也越来越被人们所关注。

        首先是传统的图像分割方法。在传统分割方面,人们使用数字图像处理、拓扑学、数学等方面的知识来进行图像分割。虽然现在的算力逐渐增加且深度学习不断发展,一些传统的分割方法所取得的效果不如深度学习,但是其分割的思想仍有很多值得我们去学习的。

        第一种方法是基于阈值的图像分割方法。这种方法的核心思想是想根据图像的灰度特征来给出一个或多个灰度阈值,将此阈值作为一个标准值与图像中的每个像素逐一进行比较。很容易想到,通过这个逐一比较过程能够得到两类结果,一类是灰度值大于阈值的像素点集,另一类是灰度值小于阈值的像素点集,从而很自然地将图像进行了分割。所以,不难发现,此方法的最关键的一步就是按照一定的准则函数来得到最佳灰度阈值,这样才能够得到合适的分类结果。值得一提的是,如果图像中需要分割的目标和背景分别占据了不同的灰度值甚至是不同的等级,那使用这种方法会得到很好的效果。并且,假如对于一张图像的处理,我们只需要设定一个阈值时,可以将其称为单阈值分割。但是图像中如果不止一个目标,即有多个目标需要进行提取的时候,单一阈值分割就无法做到将它们都分割开来,此时应选取多个阈值对其进行处理,这个分割的过程为多阈值分割。总的来说,阈值分割法有着其独特的特点,其计算简单、效率较高。但是,由于这种方法只考虑的是单个像素的灰度值及其特征,而完全忽略了空间特征,这也就导致了其对噪声比较敏感且鲁棒性不高。

        第二种方法是基于区域的图像分割方法。这种方法具有两种基本形式:一种是区域生长,这种分割方法是从单个像素出发,逐渐将相似的区域进行合并,最终得到需要的区域。另一种方法是直接从图像的全局出发,一点一点逐步切割至所需要的区域。区域生长指的是,给定一组种子像素,其分别代表了不同的生长区域,然后让这些种子像素逐渐合并邻域里符合条件的像素点。如果有新的像素点添加进来,同样把它们作为种子像素来处理。

        区域分裂合并的分割过程可以说是区域生长的逆过程,这种方法是从图像的全局出发通过不断分裂得到各个子区域,然后提取目标的过程。此外,在此过程中,还需要合并前景区域。

        在区域分割方法中还有一种分水岭算法。受启发于分水岭的构成,这种分割方法将图像看作是测地学上的拓扑地貌,这样图像中每一个像素点对应的海拔高度可以用该点的灰度值来表示。分水岭的形成过程实际上可以通过模拟浸入过程来实现。具体做法是,在每个局部极小值的表面都刺穿一个小孔,然后把模型慢慢浸入水中,随着水慢慢浸入其中,分水岭就随之形成了。

        第三种方法是基于边缘检测的分割方法。边缘检测的思想就是试图通过检测不同物体的边缘来将图像分割开来,这种方法是人们最先想到的也是研究最多的方法之一。如果我们将图片从空间域变换到频率域中去,其中物体的边缘部分就对应着高频部分,很容易就能够找到边缘信息,因此也使得分割问题变得容易。边缘检测的方法能够实现快而且准确的定位,但是其不能保证边缘的连续性和封闭性,且当一幅图像的细节信息过多时,其就会在边缘处产生大量的细碎边缘,在形成完整的分割区域时就会有缺陷。

        第四种图像分割方法结合了特定的工具。这里所说的特定工具是各种图像处理工具以及算法等,随着图像分割研究工作的深入,很多学者开始将一些图像处理的工具和一些算法应用到此工作中,并取得了不错的结果。小波变换在数字图像处理中发挥着很重要的作用,它能够将时域和频域统一起来研究信号。尤其是在图像边缘检测方面,小波变换能够检测二元函数的局部突变能力。其次是基于遗传算法的图像分割,遗传算法主要借鉴了生物界自然选择和自然遗传机制的随机化搜索方法。其模拟了由基因序列控制的生物群体的进化过程,其擅长于全局搜索,但是局部搜多能力不足。将遗传算法应用到图像处理中也是当前研究的一个热点问题,在此选择这种方法的主要原因是遗传算法具有快速的随机搜索能力,而且其搜索能力与问题的领域没有任何关系。

        除此之外,还有基于主动轮廓模型的分割方法,这种方法具有统一的开放式的描述形式,为图像分割技术的研究和创新提供了理想的框架。此方法也是对边缘信息进行检测的一种方法,主要是在给定图像中利用曲线演化来检测目标。

  • 鏈哄櫒浜鸿瑙夌郴缁熶腑鍥惧儚鍒嗗壊鎶鏈浼犵粺鏂规硶姒傝1
    绛旓細瀵逛簬鑷富绉诲姩鏈哄櫒浜鏉ヨ,瑙嗚绯荤粺鏈夌潃鍗佸垎閲嶈鐨勪綔鐢,鑰鍥惧儚鍒嗗壊鎶鏈鏇存槸鍦ㄨ繖涓绯荤粺涓鎷呬换鐫鍗佸垎閲嶈鐨勮鑹层備紶缁熺殑鍥惧儚鍒嗗壊鎶鏈熀鏈笂宸茬粡鑳藉灏嗗浘鍍忕殑鍓嶆櫙鍜屽悗鏅垎闅斿紑鏉,浣嗘槸杩戝勾鏉ラ殢鐫娣卞害瀛︿範绠楁硶鐨勫彂灞,浜轰滑寮濮嬪皢鍏跺簲鐢ㄥ埌鍥惧儚鍒嗗壊涓,鎻愬嚭浜嗗緢澶氬垎鍓茬綉缁,涔熻揪鍒颁簡寰堝ソ鐨勫垎鍓叉晥鏋溿傚湪瀹炵幇鍥惧儚鍒嗗壊鐨勫熀纭涓,浜轰滑杩樹娇...
  • 鏈哄櫒浜鸿瑙銆佸鑸佸畾浣绯荤粺鐨勫叧閿鎶鏈
    绛旓細瑙嗚绯荤粺鐢遍珮绮惧害鎽勫儚澶淬佸浘鍍忛噰闆嗗崱绛夌‖浠惰澶囨敮鎸侊紝閫氳繃鍥惧儚澶勭悊绠楁硶鍜屽墠绔蒋浠讹紝杩涜鍥惧儚閲囬泦銆佸垎鍓层佺壒寰佹彁鍙栦笌鐩爣璇嗗埆銆備緥濡傦紝鍥惧儚鍒嗗壊灏嗗鏉傚満鏅畝鍖栵紝渚夸簬璇嗗埆鍏抽敭鐗瑰緛锛涚壒寰佹彁鍙栧杈圭紭鍜岄鑹诧紝涓哄悗缁畾浣嶆彁渚涘叧閿俊鎭紱鑰岀洰鏍囪瘑鍒垯鑳藉府鍔鏈哄櫒浜璇嗗埆鍛ㄥ洿鐜涓殑鐗╀綋锛屼负瀵艰埅鍐崇瓥鎻愪緵渚濇嵁銆傚鑸郴缁燂細瑙勫垝...
  • 鍥惧儚鍒嗗壊:鍏ㄥ嵎绉缁忕綉缁(FCN)璇﹁В
    绛旓細浣滀负璁$畻鏈瑙嗚涓夊ぇ浠诲姟锛堝浘鍍忓垎绫汇佺洰鏍囨娴嬨鍥惧儚鍒嗗壊锛変箣涓锛屽浘鍍忓垎鍓插凡缁忓湪杩戜簺骞撮噷鏈変簡闀胯冻鐨勫彂灞曘傝繖椤鎶鏈涔熻骞挎硾鍦板簲鐢ㄤ簬鏃犱汉椹鹃┒棰嗗煙涓紝姣斿鐢ㄦ潵璇嗗埆鍙氳鍖哄煙銆佽溅閬撶嚎绛夈傚叏鍗风Н缃戠粶锛團ully Convolutional Networks锛孎CN锛夋槸UC Berkeley鐨凧onathan Long绛変汉浜2015骞村湪Fully Convolutional Networks for...
  • 璁$畻鏈瑙嗚鎶鏈
    绛旓細璁$畻鏈瑙嗚鐨勫簲鐢ㄩ鍩熷寘鎷浂浠惰瘑鍒笌瀹氫綅锛屼骇鍝佹楠岋紝绉诲姩鏈哄櫒浜瀵艰埅锛岄仴鎰熷浘鍍忓垎鏋愶紝鍖诲鍥惧儚鍒嗘瀽锛屽畨鍏ㄩ壌鍒紝鐩戣涓庤窡韪紝鍥介槻绯荤粺绛夈傜2閮ㄥ垎 鏁板瓧鍥惧儚澶勭悊鍩虹 鍥惧儚棰勫鐞嗘妧鏈寘鎷浘鍍忛檷鍣拰鍥惧儚澧炲己銆鍥惧儚鍒嗗壊鎶鏈鍖呮嫭鍩轰簬杈圭紭妫娴嬬殑鍥惧儚鍒嗗壊锛屽熀浜庨槇鍊肩殑鍥惧儚鍒嗗壊锛屽熀浜庡尯鍩熷闀挎硶鐨勫浘鍍忓垎鍓诧紝鍩轰簬鍙樺舰妯″瀷鐨勫浘...
  • 鏈哄櫒瑙嗚绯荤粺鏈変粈涔堝姛鑳?
    绛旓細鏈哄櫒瑙嗚鏄汉宸ユ櫤鑳芥鍦ㄥ揩閫熷彂灞曠殑涓涓垎鏀傜畝鍗曡鏉ワ紝鏈哄櫒瑙嗚鏄敤鏈哄櫒妯℃嫙浜虹殑瑙嗚鍔熻兘锛屽嵆閫氳繃鏈哄櫒瑙嗚浜у搧(鍥惧儚鎽勫彇瑁呯疆锛屽垎CMOS鍜孋CD涓ょ)灏嗚鎽勫彇鐩爣杞崲鎴愬浘鍍忎俊鍙凤紝浼犻佺粰涓撶敤鐨勫浘鍍忓鐞绯荤粺杩涜鍚勭杩愮畻澶勭悊鏉ユ彁鍙栦俊鎭苟鍔犱互鐞嗚В锛屾渶缁堢敤浜庡疄闄呰瘑鍒佹娴嬨佹祴閲忓拰鎺у埗鐨鎶鏈銆傛満鍣ㄨ瑙夊彲鐢ㄤ簬缂洪櫡妫娴...
  • 浠涔堟槸鏈哄櫒瑙嗚?鍙互鐢ㄦ潵鍋氫粈涔
    绛旓細1銆佷粈涔堟槸鏈哄櫒瑙嗚锛熺瓟锛氭牴鎹垜鍦ㄥ箍涓滅菠涓哄伐涓鏈哄櫒浜瀛﹂櫌瀛︿範鐨勭煡璇嗘墍鐭ワ細鏈哄櫒瑙嗚灏辨槸鐢ㄦ満鍣ㄤ唬鏇夸汉鐪兼潵鍋氭祴閲忓拰鍒ゆ柇銆傛満鍣瑙嗚绯荤粺鏄寚閫氳繃鏈哄櫒瑙嗚浜у搧锛堝嵆鍥惧儚鎽勫彇瑁呯疆锛屽垎 CMOS 鍜孋CD 涓ょ锛夊皢琚憚鍙栫洰鏍囪浆鎹㈡垚鍥惧儚淇″彿锛屼紶閫佺粰涓撶敤鐨勫浘鍍忓鐞嗙郴缁燂紝寰楀埌琚憚鐩爣鐨勫舰鎬佷俊鎭紝鏍规嵁鍍忕礌鍒嗗竷鍜屼寒搴︺侀鑹茬瓑...
  • 璁$畻鏈瑙嗚鍙垎涓哄摢浜斿ぇ绫
    绛旓細Estimation锛夛細濮挎佷及璁℃槸鎸囦粠鍥惧儚涓及璁$墿浣撶殑绌洪棿濮挎侊紝濡備汉浣撳叧閿偣妫娴嬨佺墿浣撲綅濮夸及璁$瓑銆傝繖绫讳换鍔″湪鍔ㄤ綔璇嗗埆銆佸寮虹幇瀹炪鏈哄櫒浜瀵艰埅绛夐鍩熸湁骞挎硾搴旂敤銆傚父瑙佺殑濮挎佷及璁℃柟娉曞寘鎷琌penPose銆丄lphaPose銆丳OSEC3D绛夈傝繖浜斿ぇ绫昏绠楁満瑙嗚浠诲姟娑电洊浜嗚澶氬叿浣撶殑搴旂敤鍦烘櫙锛屽畠浠叡鍚屾帹鍔ㄤ簡璁$畻鏈鸿瑙夐鍩熺殑鍙戝睍鍜屽垱鏂般
  • 杈撶數绾胯矾宸$嚎鏈哄櫒浜鸿瑙夌郴缁熷浘鍍澶勭悊鍙婃ā寮忚瘑鍒爺绌跺浘涔︾洰褰
    绛旓細鍖呮嫭鍥惧儚鍒嗗壊銆佺壒寰佹彁鍙栧拰缂洪櫡璇嗗埆锛屼互鍙婄旱鍚戝墫绾挎ā寮忓垎鏋愩傜珷鑺9鑱氱劍浜庡贰绾挎満鍣ㄤ汉瓒婇殰瑙嗚浼烘湇鎺у埗锛岄氳繃鍥惧儚鐗瑰緛閫夋嫨鍜岄┍鍔ㄨ疆涓庣浉绾跨浉瀵逛綅濮夸及璁★紝瀹炵幇绮剧‘鐨勬帶鍒剁瓥鐣ャ傜粨璁洪儴鍒嗘荤粨浜嗙爺绌剁殑鎴愭灉锛屽睍绀轰簡瑙嗚绯荤粺鍦ㄥ贰绾鏈哄櫒浜轰腑鐨勯噸瑕佹у強瀹為檯搴旂敤浠峰笺
  • 鏈哄櫒瑙嗚鏄粈涔坃鏈哄櫒瑙嗚鏄粈涔堜笓涓
    绛旓細鏈哄櫒瑙嗚鏄竴绉嶅埄鐢ㄨ绠楁満鍜岃櫄鎷熺幇瀹鎶鏈锛岄氳繃鎽勫儚澶淬佸浘鍍忎紶鎰熷櫒绛夎澶囪幏鍙栧拰澶勭悊鍥惧儚淇℃伅鐨勬妧鏈拰棰嗗煙銆傚畠涓昏鐮旂┒鍜屽紑鍙戜娇鏈哄櫒鑳藉鎰熺煡鍜岀悊瑙e浘鍍忋佽棰戠瓑瑙嗚淇℃伅鐨勭畻娉曞拰鏂规硶銆傛満鍣ㄨ瑙夊彲浠ュ簲鐢ㄤ簬寰堝棰嗗煙锛屽宸ヤ笟鑷姩鍖栥佹櫤鑳戒氦閫氥佸畨闃茬洃鎺с佸尰瀛﹀奖鍍忓垎鏋愮瓑銆傚畠鍙互瀹炵幇鐗╀綋璇嗗埆銆鍥惧儚鍒嗗壊銆佺洰鏍囪窡韪3D...
  • 鏈哄櫒瑙嗚鍦ㄥ簲鐢ㄨ繃绋嬩腑鏄浣曡瘑鍒鍥剧墖鐨?
    绛旓細灏变細鍊熷姪璁$畻鏈虹殑瑙嗚鎶鏈鐒跺悗杩涜杩涗竴姝ョ殑绁炵粡缃戠粶鍥惧儚璇嗗埆📸锛屼絾鍦ㄨ繖涔嬪墠锛岃绠楁満涓渶瑕佹湁澶ч噺鐨鍥剧墖淇℃伅鍖瑰杈撳叆鐨勫浘鐗囦俊鎭⏰銆傚湪鐢佃剳绯荤粺鐨勮瑙夌涓灞傜鐞嗕笅锛屾憚鍙栧浘鐗囨渶杈圭紭鐨勯儴鍒嗭紝鐒跺悗鍦ㄨ绠楁満鐨勭缁忔搷浣滀笅锛岀缁绯荤粺涓鐨勬繁搴︾綉缁滅户缁彁鍙栨洿鍔犲鏉傜殑缁撴瀯銆傛渶鍚庡啀鎶婃暣涓粨鏋勬彁鍙栵紝鐒跺悗鍐嶈緭鍑...
  • 扩展阅读:工业机器视觉检测系统 ... 十大机器视觉公司排名 ... 人工智能聊天机器人 ... 工业机器人3d视觉识别 ... 机器视觉行业太累了 ... 人工智能机器视觉系统 ... 机器视觉外观检测 ... 人工智能机器人图片 ... 机器视觉图像处理技术 ...

    本站交流只代表网友个人观点,与本站立场无关
    欢迎反馈与建议,请联系电邮
    2024© 车视网