计算机会超越人类的视觉能力吗？

vchalup以下为朗读小姐姐全文音频
作者 |Kevin Hartnett翻译 |茹小茹
审校|酷炫脑主创朗读|胡恩美工|雪今晶编辑 |湘蓉在某些方面，计算机的视觉优于人类，但从另一角度而言，它们可能永远无法与人类媲美。
当工程师们第一次尝试教计算机感知周围环境时，他们理所当然地认为计算机和人类一样具有视觉。约克大学的计算机科学家约翰 · 索特索斯说，20世纪60年代关于计算机第一个假说就是“它们同样受到人类视觉特性的驱使”。
但自那以后，人工智能领域发生了翻天覆地的变化。
到目前为止，计算机视觉已经从石破天惊的设想发展为了一个广阔的领域。在给相似动物进行分类，或者检测医学影象中的病理情况时，计算机的表现甚至超越了人类。可以说，人工“神经网络” 与人类处理视觉信息的方式差异越来越大了。它们已经可以做到另辟蹊径，并在人类设计的游戏中击败了我们自身。
计算机的视觉神经网络其实相当简单。它们接收一个输入图像，然后通过一系列步骤对其进行处理（首先检测像素，进而是边缘和轮廓，最后对整个物体的类型做出猜测）。这一系列流水线般的既定设置又被称为前馈系统。
人类对视觉形成还有很多未知，但我们能够确定某些假说一定是不成立的。在广达杂志最近的一篇文章《数学模型解开的视觉奥秘》中，作者描述了一个全新的数学模型，以解释人类视觉的核心理论，即大脑的视觉皮层是如何根据视网膜接收到的有限信息，重建出生动而准确的三维世界的。
该模型表明，视觉皮层可以通过一系列神经反馈回路，将外部世界数据具体化，进而呈现为眼前的图像。这种反馈过程与计算机视觉的前馈方法大相径庭。
康奈尔大学的神经系统科学家乔纳森·维克多说: “这项研究启发我们，人类和计算机视觉是多么的复杂而不同。”。
但是计算机的确在某些视觉任务处理时击败了人类。那么问题来了: 计算机与人类的视觉通路究竟有没有共同之处呢？
在某些方面，答案显然是否定的。到达视觉皮层的信息受到解剖结构的限制: 连接视觉皮层和外部环境的神经相对较少，这大大削减了大脑皮层可获得的视觉数据。
计算机并不面临这种“带宽问题”，因而也不必挣扎于过低的信息量。
“如果计算能力和内存趋于无限，机器还需要对信息进行压缩处理吗？答案大概是否定的。”。
但是索特所斯认为，人类视觉的优越之处也不可忽视。
图源网络
他说，当今计算机擅长的分类工作是一种低级智能，仅需要从海量数据中搜索相关度就可完成。而对于其他高阶任务，比如物体的多方位扫描识别(类似于绕着雕像环走并观察熟悉它的外形)而言，单纯的相关度搜索就显得不太够了。此时的计算机需要人类手动确认才能正常运行。
在去年接受《广达》杂志采访时，人工智能先驱朱迪亚?珀尔笼统地阐述了这一观点，他认为从长远来看，相关度训练并不会给人工智能系统带来光明的未来。
例如，人类视觉的一个重要特征就是能够重复观察。视觉信息处理之后，我们会对所见物体做出判断。当这个结论不太对劲时，人类可以再看一遍，而这一次我们通常得以窥得事情的真相。以前馈方式工作的计算机视觉系统往往缺乏这种能力，因而即使面对这很简单的视觉任务，计算机也会出现明显的失误。
人类视觉还有一个更微妙的、计算机永远无法拥有的特性。
人类的视觉系统需要多年时间才能成熟。2019年，索特所斯和他的合作者在一篇论文中阐述道，直到17岁左右，人们才能完全掌握在嘈杂环境中排除干扰和专注于既定目标的能力。其他研究则发现，直到20岁之前，人类对面孔的感知能力都在不断提高。
计算机视觉系统通过内化大量的数据来进行工作，这种基本程序是固定的，不会像大脑那样随着发育时间的推移而成熟。既然潜在的学习机制如此不同，二者的运行结果可能一样吗？索特索斯认为计算机视觉系统的前景不容乐观。
“这些深度学习方法与人类毫无关系，”他说。这暗示我们瓶颈期即将来临，或许日后人工智能系统的发展将寸步难行。”
参考文献[1] Wong-Kee-YouAMB, Tsotsos JK, Adler SA. Development of spatial suppression surrounding thefocus of visual attention.J Vis. 2019;19(7):9. doi:10.1167/19.7.9
酷炫脑长期征集脑科学、心理学类文章，欢迎投稿
投稿请发邮箱：2829023503@qq.com
点这里，让朋友知道你热爱脑科学

您可能感兴趣