大发10分快三开奖计算机视觉(及卷积神经网络)简史 | 雷锋网

  • 时间:
  • 浏览:2
  • 来源:大发5分快乐8-极速5分11选5-急速5分6合

本文为 AI 研习社编译的技术博客,原标题 :

A Brief History of Com大发10分快三开奖puter Vision (and Convolutional Neural Networks)

作者 | Rostyslav Demush

翻译 | 鳄鱼艾德大发10分快三开奖克、小先生爱你         

校对 | 酱番梨        审核 | 约翰逊·李加薪       下发 | 立鱼王

原文链接:

https://hackernoon.com/a-brief-history-of-computer-vision-and-convolutional-neural-networks-8fe8aacc79f3

尽管计算机视觉近期有一一二个多多劲兴起(重大突破时刻指在在2012年,那时AlexNet网络赢得ImageNet的冠军),它人太好全是以有有一一二个多多多新的科学领域。

世界范围内的计算机方面的科学家在过去的六十年有一一二个多多劲尝试寻找使得机器也能在视觉数据中提取出含义,计算机视觉的历史是非常令人着迷的,你五种方面是大多数人所不了解的。

在这篇文章中,我因为尝试介绍现代计算机视觉系统是怎样通过卷积神经网络驱动的。

我因为从有有一一二个多多多二十世纪五十年代出現的,和软件工程毫不相关的作品时候结束。

计算机视觉中最有影响力的论文之一由两位神经生理学家David Hubel和Torsten Wiesel于1959年发表。亲们的出版物题为“猫的纹状冠部中单个神经元的感受野”,描述了视觉冠部神经元的核心反应价值形式。以及猫的视觉体验怎样塑造其皮质价值形式。

两人进行了或多或少非常精细的实验。亲们将电极贴大发10分快三开奖到 去麻醉猫脑的初级视冠部区域,观察或要花费试图在该区域进行神经元活动,同時 向动物展示各种图像。亲们的第一次努力那末结果——亲们无法让神经细胞对任何事情做出反应。

然而,在研究的几个月后,亲们注意到,有有一一二个多多多神经元在亲们将有有一一二个多多多新的幻灯片滑入投影机时被发射,而全是偶然。这是一次幸运的意外。经过或多或少初步的混淆,Hubel和Wiesel意识到让神经元兴奋的是由玻璃片的锋利边缘的阴影所产生的线条的运动。

https://goodpsychology.wordpress.com/2013/03/13/235/

研究人员通过实验发现初级视觉冠部蕴含或多或少简单和错综复杂的神经元,怎样让视觉处里过程有一一二个多多劲从之类特定方向边缘的之类简单价值形式时候结束。

听起来是全是挺熟悉?这假使 隐藏于层厚学习前一天的核心准则。

计算机视觉历史中下有有一一二个多多多值得关注的是第一台数字图像扫描仪的发明权。

在1959年,Russell和他的同学研制了一台也能把图片转化为被二进制机器所理解的灰度值的仪器。正因为亲们的成果,亲们现在也能用不同的土办法 处里数字图像。

第一张被数字扫描的图片是Russell的婴儿照。它仅仅是一副5cm*5cm的关于80976(176*176)个像素所构成的图片,但它变得举世闻名因为原始图片被保指在波特兰艺术博物馆。

https://www.engadget.com/2010/06/80/russell-kirsch-helped-create-them-now-he-wants-to-kill-square-p/

接下来讨论Lawrence Roberts的“三维甲烷气体的机器感知”,这本在1963年出版的书被广泛认为是现代计算机视觉的前导之一。

在他的博士论文中,Larry描述了从二维图片中推导三维信息的过程。他把视觉世界所看得人的错综复杂为几何价值形式。

http://www.packet.cc/files/mach-per-3D-solids.html

他在论文中描述和编写多多线程 运行的目的是将二维图像处里成线条,怎样让利用哪几种线条建立起三维重示,最终显示物体移除了所有隐藏线条的三维价值形式。

在三维到二维展示前一天,Larry写下了二维到三维的构造是计算机辅助三维系统的有有一一二个多多多良好开端,他完整版正确。

亲们应该注意到Lawrence并那末在计算机视觉这方面花费那末来越多精力,相反他加入了DARPA,现在以因特网发明权被人所熟知的项目。

在1980s,AI成为了一门学科,或多或少研究人员关于这块领域的未来非常乐观,亲们相信用不了25年时间就能发明权和人类一样智能的计算机。同一时期,MITAI实验室的Seymour Papert教授决定启动夏季视觉项目,并在几个月内处里机器视觉疑问。

他认为一小群MIT的学生在夏天开发了视觉系统的重要组成偏离 。Seymour和Gerald Sussman协调学生将设计有有一一二个多多多也能自动执行背景/前景分割,并从真实世界的图像中提取非重叠物体的平台。

你五种课题那末成功,80年前一天,亲们仍然在向处里计算机视觉前进。据亲们说,你五种项目是计算机视觉作为有有一一二个多多多科学领域的正式诞生的标志。

在1982年,有有一一二个多多多英国神经学家David Marr发表了另一篇有影响的论文-“愿景:对人类表现和视觉信息处里的计算研究”。

基于Hubel和Wiesel的想法(亲们发现视觉处里全是从整体对象时候结束),David给了亲们下有有一一二个多多多重要的见解:他选者 了你五种愿景是等级的,视觉系统的主要功能是创建环境的3维表示,以便亲们也能与之交互。

他介绍了有有一一二个多多多视觉框架,其中检测边缘,曲线,角落等的低级算法被用作对视觉数据进行高级理解的铺垫。

David Marr的视觉代表框架包括:

  • 图像的原始草图,其中表示边缘,条形,边界等(这显然受到Hubel和Wiesel研究的启发);

  • 2½维的草图表示,其中冠部,图像上的层厚和不连续性信息拼接在同時 ;

  • 根据曲面和体积基元分层组织的3维模型。

David Marr的成果在当时是开创性的,但它非常抽象和高级。 它那末蕴含任何也能在人工视觉系统中使用的数学建模的信息,也那末提到任何类型的学习过程。

要花费在同一时间,日本计算机科学家Kunihiko Fukushima也受到Hubel和Wiesel的启发,建立了有有一一二个多多多自组织的简单和错综复杂细胞的人工网络,也能识别模式怎样让不受位置变化的影响。 网络Neocognitron包括几个卷积层(通常是矩形的),他的感受野具有权重向量(称为滤波器)。

哪几种滤波器的功能是在输入值的二维数组(之类图像像素)上滑动,并在执行或多或少计算后,产生激活事件(2维数组),哪几种事件将用作网络后续层的输入。

Fukushima的Neocognitron也能说是第有有一一二个多多多神经网络; 它是今天的神经网络的祖父。

几年后,在1989年,一位年轻的法国科学家Yann LeCun将五种后向传播风格学习算法应用于Fukushima的卷积神经网络价值形式。 在完成该项目几年后,LeCun发布了LeNet-5--这是第有有一一二个多多多引入亲们今天仍在CNN中使用的或多或少基本成分的现代网络。

在他身后的Fukushima,LeCun决定将他的发明权应用于角色识别,甚至发布了用于阅读邮政编码的商业产品。

除此之外,他的工作创建手写数字的MNIST数据集 - 这因为是机器学习中最着名的基准数据集。

1997年,一位伯克利教授Jitendra Malik(以及他的学生Jianbo Shi)发表了一篇论文,描述了他试图处里感性分组的疑问。

研究人员试图让机器使用图论算法将图像分割成合理的偏离 (自动选者 图像上的哪几种像素属于同時 ,并将物体与付进 环境区分开来)。

亲们那末走得太远; 感知分组的疑问仍然是计算机视觉专家正在努力处里的疑问。

在1990s,计算机视觉作为有有一一二个多多多领域,在很大程度上改变了它的关注点。

要花费在1999年,或多或少研究人员停止尝试通过创建它们的3维模型(Marr提出的路径)来重建对象,假使 将亲们的努力转向基于价值形式的对象识别。 David Lowe的作品“来自局部尺度不变价值形式的物体识别”特别表明了你五种点。

文章描述了五种视觉识别系统,该系统使用对旋转,位置和偏离 照明变化不变的局部价值形式。 根据Lowe的说法,哪几种价值形式特别之类于在颞下冠部中发现的神经元的价值形式,哪几种价值形式涉及灵长类视觉中的物体检测过程。

不久前一天,在801年,Paul Viola 和Michael Jones推出了第有有一一二个多多多实时工作的人脸检测框架。 人太好全是基于层厚学习,但算法仍然具有深刻的学习风格,因为在处里图像时,它了解哪几种价值形式(非常简单,之类Haar的价值形式)也能帮助定位面部。

https://www.researchgate.net/figure/Haar-features-used-for-Viola-Jones-face-detection-method_fig1_268348020

Viola / Jones面部探测器仍被广泛使用。 它是有有一一二个多多多强大的二元分类器,由几个弱分类器构成; 在学习阶段,在你五种情况下非常耗时,使用Adaboost训练弱级分类器的级联。

为了找到感兴趣的对象(面部),模型将输入图像分割成矩形块并将它们完整版提交给弱检测器的级联。 因为补丁通过级联的每个阶段,则将其归类为正数,怎样让,算法会立即拒绝它。 该过程在各种规模上重复多次。

该论文发表五年后,Fujitsu 发布了一款具有实时人脸检测功能的相机,该功能依赖于Viola / Jones算法。

随着计算机视觉领域不断发展,社区迫切前要基准图像数据集和标准评估指标来比较其模型的性能。

806年,Pascal VOC项目启动。 它提供了用于对象分类的标准化数据集以及用于访问所述数据集和注释的一组工具。 创始人还在806年至2012年期间举办了年度竞赛,该竞赛允许评估不同对象类识别土办法 的表现。

809年,原本重要的基于价值形式的模型由Pedro Felzenszwalb,David McAllester和Deva Ramanan  - 可变形零件模型开发。

从本质上讲,它将对象分解为偏离 集合(基于Fischler和Elschlager在20世纪70年代引入的图像模型),在它们之间强制实施一组几何约束,并将被模拟的潜在对象中心视为潜在变量。

DPM在对象检测任务(使用边界框用于本大发10分快三开奖地化对象)和击败模板匹配以及当时流行的或多或少对象检测土办法 方面表现出色。

你因为听说过的ImageNet大规模视觉识别竞赛(ILSVRC)时候结束2010年。继PASCAL VOC前一天,它也每年举办一次,包括有有一一二个多多多赛后研讨会,参与者讨论亲们从中学到了哪几种。 最具创意的作品。

与那末20个对象类别的Pascal VOC不同,ImageNet数据集蕴含超过一百万个图像,手动清理,跨越1k个对象类。

自成立以来,ImageNet挑战已成为跨那末多量对象类别的对象类别分类和对象检测的基准。

在2010年和2011年,ILSVRC的图像分类错误率徘徊在26%左右。 怎样让自从2012年,来自多伦多大学的有有一一二个多多多团队进入了有有一一二个多多多卷积神经网络模型(AlexNet)进入竞争,这改变了一切。 该模型与Yann LeCun的LeNet-5价值形式之类,误差率为16.4%。

这是CNN的突破性时刻。

在接下来的几年中,ILSVRC中图像分类的错误率下降到几个百分点,自2012年以来,获胜者有一一二个多多劲是卷积神经网络。

正如我前面提到的,自20世纪80年代以来,卷积神经网络因为指在。 那末为哪几种它们前要那末长时间也能变得流行呢?

那末,亲们当前的CNN流行有有有一一二个多多多因素:

因为摩尔定律,与20世纪90年代发布LeNet-5相比,亲们的机器现在带宽调快,功能更强大。

NVIDIA的可并行化图形处里单元帮助亲们在层厚学习方面取得了重大进展。

最后,今天的研究人员也能访问大型,标记的高维视觉数据集(ImageNet,Pascal等)。 怎样让,亲们也能充分培养亲们的层厚学习模型,处里过度拟合。

结论

尽管最近取得了令人印象深刻的进展,但亲们仍然那末接近处里计算机视觉疑问。 然而,因为有多家医疗机构和企业找到了将由CNN驱动的计算机视觉系统应用于现实疑问的土办法 。 你五种趋势不太因为调快停止。

你会继续查看该篇文章相关链接和参考文献?

点击【计算机视觉(及卷积神经网络)简史】或长按下方地址:

https://ai.yanxishe.com/page/TextTranslation/1518

AI研习社今日推荐雷锋网雷锋网(公众号:雷锋网)雷锋网

李飞飞主讲王牌课程,计算机视觉的深化课程,神经网络在计算机视觉领域的应用,蕴含图像分类、定位、检测等视觉识别任务,以及其在搜索、图像理解、应用、地图绘制、医学、无人驾驶飞机和自动驾驶汽车领域的前沿应用。

加入小组免费观看视频:https://ai.yanxishe.com/page/groupDetail/19

猜你喜欢

【极速快3网址】安全锦囊之蹭WiFi要谨慎

安全锦囊之蹭WiFi要谨慎2016/4/1215:12:18类型:原创来源:电脑报报纸编辑:电脑报作者:奥德赛雨【电脑报在线】现在免费WiFi太久,安全性参差不齐,亲戚亲戚朋友

2019-11-21

【快3app登入-3分快3app登入】巴西红耳龟寿命 平均在35岁左右

    巴西红耳龟寿命,一般的乌龟品种它们的寿命都有比较长的,由于着在好的环境下它们能活得更长的时间,巴西红耳龟是两种比较受欢迎的宠物龟,那巴西红耳龟寿命是多长

2019-11-21

【极速快3-极速快三官方】被狗狗咬了没打疫苗 狗狗抓了要打疫苗吗

    被狗狗咬了没打疫苗,可是 人喜欢养狗肯能喜欢和狗狗玩耍,这是肯能狗狗是村里人 最亲密的村里人 ,但有的完后 村里人 要知道狗狗不像人一样,是那末

2019-11-21

【幸运6合】小狗得了细小怎么办 狗狗有细小怎么办

    小狗得了细小为甚办?狗狗生病时很正常的事情,但出生几条月的小狗正是非常关键的后后,细小的死亡率非常高,因为得只有很好的照顾,后果很严重哦。

2019-11-21

【分分快3注册】今日头条高管:多闪1月24日在腾讯应用宝上线

《今日头条高管:多闪1月24日在腾分分快3注册分分快3注册讯应用宝上线》文章可能性归档,不再展示相关内容,编辑建议你查看最新于此相关的内容:应用宝“内容外显”能力大升级成为“最

2019-11-21