type
Post
status
Published
date
Mar 4, 2022
slug
image_process_0
summary
欢迎来到Python图像处理专题,本专题将涉及图像处理领域的相关理论知识和延伸到计算机图形学及计算机视觉方面的相关理论,涉及方面主要从Photoshop、MSPaint等常见的绘图及图像处理工具的功能点的实现方法等。同时还会有相关的实战项目推出,尽情期待~!
tags
图像处理
Python
OpenCV
category
图像处理
icon
password
Property
Nov 16, 2022 09:10 AM
欢迎来到Python图像处理专题,本专题将涉及图像处理领域的相关理论知识和延伸到计算机图形学及计算机视觉方面的相关理论,涉及方面主要从Photoshop、MSPaint等常见的绘图及图像处理工具的功能点的实现方法等。同时还会有相关的实战项目推出,尽情期待~!

研究背景及意义

计算机图形学是一种充满乐趣且发展最快的现代技术,在当代计算机研究领域中也是工业化水平最高的学科之一。在现代计算机系统与应用软件中,计算机图形学技术也已经成为最基本的技术之一。在其不断发展壮大的过程中也产生了很多优秀的商业软件作品,其中不乏经常出现在日常生活中的工业软件,例如Adobe公司的Photoshop与Autodesk公司的3Ds Max,这些优秀的软件作品为推动数字媒体发展做出了杰出的贡献。
由于其数字化、高效率等特点,进一步带动了影视业、游戏业、广告业的蓬勃发展,出现了一大批国内外优秀的拥有计算机图形学技术的公司,如欧特克、工业光魔、皮克斯动画工作室以及华特迪士尼公司。
早期的电脑动画受传统卡通动画的启发,传统卡通需要在关键位置设置关键帧作为动作标记点,关键帧之间存在过渡帧,过度帧不需要用户制作由软件自动生成。动画内容的展现是通过帧的连续播放,两个关键帧的动作被连续的过度帧补充成为流畅的连续帧序列。电脑动画的内容十分丰富,同时,产生动画的方法也有多种在工业生产中早已广泛使用。近年来,广大计算机图形学领域的研究者们对基于物理模型的计算机动画生成方法进行了较为深入的研究,逐渐成为计算机动画研究的重要方向,这种方法是一种全新使用刚体动力学和材料力学方程的仿真模拟的计算方法,希望能够在动画制作过程中实现最接近真实世界物理学规律的效果。
值得一提的是米哈游科技(上海)有限公司在此方面一直处于领先水平,其技术总监贺甲在Unite2018开发者大会上分享了miHoYo技术团队在PBR和NPR实现的高品质卡通效果的技术方案,得到广泛关注,图1-1为其使用UE4游戏引擎实时渲染效果图。
notion image
尽管当今计算机图形学发展迅速,技术丰富度高,但是由于部分核心技术仍处于封闭状态,国内对计算机图形学的研究相较于国外起步较晚,尚无一款自主研发的全平台使用的功能齐全的图像处理工具。本课题将从这点出发,搜集近些年各顶级会议发表的优秀论文,从中尝试寻找可以适用于栅格化图像处理的算法,并尝试通过观察Photoshop实现的各种效果来推断其使用的算法,进而在本课题中实现。

国内外研究现状

计算机图形学是一门研究性学科,它使用计算机算法在计算机上存储和显示二维或三维图形,以将其计算,处理并将其转换为可以在计算机上显示的格式。术语“计算机图形学”最初是由麻省理工学院的Ivan Suzerain博士提出的。在1960到1980年期间,光栅显示器的诞生导致光栅图形算法的飞速发展,诞生了许多基本概念和相应的算法,计算机图形学迎来了第一个繁荣时期,自1980年以来,逼真的图形和实体建模技术开始受到广泛的关注和研究,从而产生了大量新的方法。自1990年以来,随着计算机硬件技术的飞速发展,为计算机图形学的发展创造了机会,尤其是在图形处理器出现之后,计算机图形学开始拥有强大的硬件计算基础。在此基础上开发的“全局光照明”模型促进了逼真的图形的进一步发展,并且已广泛用于计算机辅助设计、数据可视化和交互式文娱等各个领域。
自21世纪以来,由于微型计算机和软件系统的普及,计算机图形学的使用变得更加普遍。制定的标准越来越集成化、智能化,数字媒体、AI、数据可视化、AR/VR等分支正在蓬勃发展,三维建模方向也取得了较大的进步。ISO发布的图形标准变得越来越复杂和成熟,SGI、Microsoft、Adobe等公司都参与其中,这些标准都致力于开放与高效的开发。
从1990年到1998年,图形技术在中国开拓了发展机遇。中国的图形专家在Bezier曲线,不均匀的有理B样条曲线以及计算机逼真的图形渲染算法方面均取得了优异的成绩。自1998年以来,中国计算机图形学的研究进展顺利。中国计算机图形学行业经过产业结构调整,技术更加专业、制度更加标准、成果更加商业、产品更加智能。中国学者现在可以不断提出新的动画和渲染算法理论,并为计算机图形学顶级年度会议不断提供优质论文。近年来,随着中国改革措施的不断深入和各项政策的实施,各种先进技术得到了大规模地发展和应用,图形学的学术地位与工业价值也得到了迅速的发展,取得了令人满意的成绩。

相关理论基础

计算机图形学

计算机图形学的含义是利用数学原理和计算技术构造图形并显示在输出设备上。这里提到的图形是研究人员通过软件设计和构造的,而不是由摄像机和传感器之类的设备输入的图像。通常,图形的表现形式是矢量图形式,矢量图具有无论放大多少倍边缘都十分平滑的特点。这里举个例子,工程图中最基本的图形元素图元,图元一般是指点,线,弧等基本的易于绘制的图形。
简而言之,计算机图形学的主要研究内容是图形各种表现形式以及使用计算机算法来计算,处理和显示图形。在科学研究领域,计算机图形学可以以视觉方式向公众、向社会直观地显示各个学科的科学成就;在娱乐领域,例如游戏机,VR游戏,电影特效中,也起着越来越重要的作用。计算机图形学在创意或影视创作,商业推广,产品原型和其他行业中也起着至关重要的作用。
计算机图形学也是一门跨学科的研究领域,其中覆盖了物理学、数学、人体感知、人机交互、工程技术、平面设计以及艺术等多方面的技术理论。使用物理来模拟光线并对动画进行模拟;用数学来描述形状;使用工程技术来优化带宽、内存和处理器时间的分配;图形设计和艺术与人机交互相结合,使计算机与人的交互方式最有效。

图像处理

图像处理是分析和处理图像中非直观信息的过程,包括相关技术包括图像叠加、图像增强和场景分析等,研究对象为二维图像。图像以位图格式存储和显示,保存的信息实际上是一个点及其属性信息(在不同色彩空间下可以是颜色、灰度、亮度等)。
随着图像处理技术应用领域越来越广,在与计算机图形学、计算机视觉相融合后在娱乐领域上的应用也得到了普及与进一步发展,主要包括:摄影后期、视频播放、数字电视等。

计算机视觉

计算机视觉是一种通过传感器感知、识别、测绘进而模拟人类视觉的机器视觉。这种技术需要通过首先通过传感器获取相应的图像数据,通过识别和分析进一步将数据处理成更适合欣赏或其他操作的数据,这样做的目的是生成用于决策的符号信息,为计算机具提供类似人眼和人脑的能力。计算机视觉在构建可以从图像和多维数据中获取信息的人工智能系统中扮演着重要角色,可以创建成像过程的物理模型,并基于该模型生成场景的真实描述。简而言之,它是使用计算机来实现人类对客观世界场景的视觉,能够感知、识别和理解这个世界。当前,工业制造机器能够完成人类智能任务和某些功能的原因取决于计算机视觉的感知和认知能力,例如视觉,物体识别,面部检测和运动捕捉。

深度学习

卷积网络又称卷积神经网络。这是一种专门用来处理具有相似网格结构数据的神经网络。例如,对时间轴进行周期采样,形成时间序列数据的一维网格和可视为二维像素网格的图像数据,卷积网络在对象识别、语义提取等领域有着广泛的应用。术语“卷积网络”是指网络使用卷积的数学方法,卷积网络是指在网络结构的至少一层中使用卷积运算来代替公共矩阵乘法运算的神经网络。卷积是一种特殊的线性运算,所以从这个角度来看卷积网络也是线性的。
在一般表现形式中,卷积是面向两个实值函数的一种数学运算。卷积运算通常用星号表示:
其中,函数x为输入参数,函数w为核函数,输出有时被称作特征映射。
在机器学习的应用中,输入通常是称之为张量的高维数据数组,而卷积核也是由算法产生的张量。输入与卷积核在维度上需要匹配,假设要把二维的图像I作为输入,那么相应的也需要使用二维的核K:
卷积是可交换的,可以等价地写作:
离散卷积也可以看作是一种特殊的矩阵乘法,但这个矩阵需要加以限制,例如,对于单变量的离散卷积,这个矩阵必须是Toeplitz矩阵,即每行移动一个元素后必须等于前一行。此外,由于核比输入图像小得多,卷积通常对应于一个非常稀疏的矩阵,任何使用矩阵乘法且不依赖于矩阵结构特殊性质的神经网络算法都可以使用卷积运算,并且在修改神经网络时不需要进行大量的修改。
参数共享是指在一个模型的多个函数中使用相同的参数。在BP神经网络中,每计算一层的输出,权值矩阵乘以输入的元素后不会再用到,从输入到输出只会使用一次。而在卷积神经网络中,核的每一个元素都作用在输入的每一位置上,而不是对于每一位置都需要学习,保证了只需要学习一个参数集合,减少了参数的使用量,这虽然没有改变前向传播的时间,算法复杂度仍然保持,但这种方法显著地降低了模型的存储需求。

参考文献

  • 张妮,徐文尚,王文文. (2009). 人工智能技术发展及应用研究综述.煤矿机械,30(2).
  • 李开复,王咏刚. 《人工智能》[J]. 杭州(周刊),No.504(20):60.
  • 刘永进. 中国计算机图形学研究进展[J]. 科技导报,2016, 34(14): 76-85; doi: 10.3981/j.issn.1000-7857.2016.14.009.
  • Pharr M, Jakob W, Humphreys G. Physically Based Rendering: From Theory To Implementation [OL]. http://www.pbr-book.org.
  • Kajiya, James T . The rendering equation[J]. ACM SIGGRAPH Computer Graphics, 1986, 20(4):143-150.
  • 冈萨雷斯, 伍兹, 埃丁斯, 等. 数字图像处理: MATLAB 版[M]. 电子工业出版社, 2005.
  • Goodfellow I, Bengio Y, Courville A. Deep learning[M]. MIT press, 2016.
书籍推荐——《夜观星空:天文观测实践指南》爬虫&数据分析实战——华北水利水电大学官网通知页