搜索
当前所在位置: 首页>前沿科技

三个印度人改变压缩算法 一意孤行整个暑假 却因“太简单”申不到经费

发布时间:2022-07-11 09:12:10 作者:单栗 点击:162 【 字体:

世界上最好用的压缩软件是什么?微信。

这个段子想必很多人都听过。一张几兆的图片,经微信一发,立马降到几百 kb。

△ 如果是有损压缩画质会下降(右图天空有波纹)

△ 如果是有损压缩画质会下降(右图天空有波纹)

虽说这是个吐槽,但 u1s1,图片视频压缩其实是一项非常必要的技术。

比如视频通话、传输大量图片时,如果不压缩的话,要么图像完全无法传送,要么就是干等了。

所以在数字时代这几十年里,萌生出了很多相关的技术,比如 JPEG、H.26X。

不过你或许不知道,这些技术往上追溯,可以从 47 年前说起。

有三位名不见经传的印度工程师“一意孤行”,在没申请到研究经费的情况下,利用暑假时间鼓捣出来了一项技术,后来直接成为图像视频压缩的行业标准。

它就是 DCT。

全称为 Discrete Cosine Transform,即离散余弦变换。

而有趣的是,DCT 诞生之初时,就连作者本人都没有想到,它后来会有如此巨大的影响力。

没有 DCT,就没有 JPEG / MPEG

直接说 DCT 可能很多人不知道是什么,但 JPEG 大家肯定都听过。

它除了是一种常见的图片文件后缀名,其实也是一种有损压缩标准,可以把一张图片从左边这样变成右边这样:

三个印度人改变压缩算法 一意孤行整个暑假 却因“太简单”申不到经费

ps.有损和无损的区别:无损压缩可以再 100% 还原图像;有损不可以,但有损压缩后的图像大小会大大减少。

DCT 就是实现这个过程的一种基础技术。

它是傅立叶变换的一种,可以将图像从空域转换到频域,也就是把图像从像素矩阵变成用带有频率等信息的函数来表示。

具体变换过程,我们以一张图像中一个 3x3 的像素块为例:

△ 图源博客园博主 @沉默的背影 X-Pacific

△ 图源博客园博主 @沉默的背影 X-Pacific

对这个像素块做 DTC 变换,就相当于把除了第一个像素以外,其余像素的部分信息都抽取到第一个格中。

这样,第一个格的像素值表示的就是一张图的总体样貌,称为低频信息;其余格表示的就是图像中人物或物体的细节,称为高频信息。

经 DCT 转换后,每个 3x3 的像素块都会产生 1 个 DC(直流)系数(位于第一个格)及 8 个 AC(交流)系数(剩余格),前者是 DCT 最重要的输出。

三个印度人改变压缩算法 一意孤行整个暑假 却因“太简单”申不到经费

由于大部分的图像能量会集中在低频部分,因此转换之后输出的 DC 系数值比较大,而输出的 AC 系值比较小。

利用“人眼对低频分量的图像比对高频分量的图像更敏感”这一原理,再通过量化保存下来低频分量,舍弃高频分量(将大部分 AC 系数值变为 0)、丢掉那些对视觉效果影响不大的信息,从而达到压缩目的。

从下面这两张图像的三维投影,我们可以看到 DCT 变换带来的改变:

(上:原图;下:经过 DCT 变换后)

三个印度人改变压缩算法 一意孤行整个暑假 却因“太简单”申不到经费

在实际的 JPEG 压缩标准中,都是将一张图像分成若干个 8x8 的像素块(不够的用空白补齐)。

将色彩空间从 RGB 转为 YUV 之后,从左至右、从上至下对每个块进行 DCT 变换。

然后对每个块变换得来的系数进行量化,在这个过程中,一些重要的分量就被去除了,且无法恢复。

因此,这是一种不可逆的有损压缩技术。

接着对量化后得到的 AC 系数和 DC 系数再分别进行编码,经过哈夫曼编码后得到下面这样的一大串数字。

三个印度人改变压缩算法 一意孤行整个暑假 却因“太简单”申不到经费

解压缩时对每个图像块做 DCT 反转换(IDCT),就可以重建完整图像。

具体计算过程如下:

首先将图片中每个像素的原始灰度和亮度值用 8bit 表示,也就是 (0,255) 这个范围。

由于大多数值都会分布在 128 左右,所以会将这些值都减去 128,这样会有更多值为 0,有利于压缩,这时候范围变成 (-128,127)。

三个印度人改变压缩算法 一意孤行整个暑假 却因“太简单”申不到经费

然后再用 DCT 变换公式进行变换,二维的用这个:

三个印度人改变压缩算法 一意孤行整个暑假 却因“太简单”申不到经费

变换完后进行根据量化表进行量化,将大部分系数变为 0,完成压缩。

三个印度人改变压缩算法 一意孤行整个暑假 却因“太简单”申不到经费

ps.量化表是根据人眼对量化误差的视觉阈值来确定的,有固定的一张表。

后面就是前面说的一系列编码过程了。

1974 年 1 月,这项技术首次被发表在 IEEE Transactions on Computers 上面。

自此,图像和视频压缩领域的行业标准就诞生了。

1998 年世界首个视频压缩标准 H.261、1992 年的 JPEG 和 MPEG、2010 年的 WebP、2013 年的 HEIF、2018 年谷歌亚马逊等公司联合创建的 AV1…… 等压缩标准都是基于这项技术,且一直沿用至今。

40 多年都名不见经传的发明者

DCT 的作者有 3 位,分别是 Nasir Ahmed(纳西尔・艾哈迈德)、K.R. Rao(K.R.拉奥)和 T. Natarajan(T.纳塔拉詹)。

纳西尔是新墨西哥大学电气与计算机工程系名誉教授。

他 1940 年出生于印度班加罗尔,1966 年在新墨西哥大学获得博士学位。

1966-1968 年,他在霍尼韦尔公司担任首席工程师,1968-1983 年在堪萨斯州立大学担任教授。

1983-2001 年,他回到新墨西哥大学担任电气与计算机工程系首席教授。在此期间,他先后担任过系主任、研究生院院长等职位。

今年,纳西尔已经有 82 岁高龄。

三个印度人改变压缩算法 一意孤行整个暑假 却因“太简单”申不到经费

另一位主要作者是 K.R.拉奥。

他同样是一位美籍印度裔学者。

1960 年,他在佛罗里达大学获得核工程专业博士学位。1966 年,又在新墨西哥大学获得电气与计算机工程专业博士学位。

之后 50 年,他一直在得克萨斯州阿灵顿分校工作,担任电气工程系教授。

与此同时,他还是 IEEE Fellow。

2021 年 1 月 15 日,拉奥教授挥别人世,享年 89 岁。

三个印度人改变压缩算法 一意孤行整个暑假 却因“太简单”申不到经费

T.纳塔拉詹当时是纳西尔带的博士生,如今在互联网上已经检索不到太多他的相关信息。

可以说相比于大名鼎鼎的 DCT,几位发明者称得上是“名不见经传”了。

实际上,40 多年来,DCT 发明的幕后故事一直鲜有人关注。

甚至连纳西尔的儿子都表示,“从来没想过父亲带来的影响有如此之大”。

而将纳西尔从幕后推至台前的,还多亏了一部美剧中的一波致敬。

2020 年,《我们的生活》中有一段剧情是纳西尔以视频通话的方式,讲述了自己和妻子相爱的故事。

三个印度人改变压缩算法 一意孤行整个暑假 却因“太简单”申不到经费

片方表示,设计这一桥段的初衷,就是希望更多人意识到,当下我们能够通过互联网快速发送图片视频,都与纳西尔的工作离不开关系。

剧情播出后,不少媒体将 DCT 定义为“改变世界的算法”,也称纳西尔这位名不见经传的工程师,终于从幕后推到了台前。

不过,纳西尔在自己的回忆视频里表示,当初真的没想到 DCT 会带来如此大的影响。

我也无法预测技术发展的速度,对于 FaceTime 这些应用的出现,我感到非常惊讶。

△ 纳西尔年轻时(图左)

△ 纳西尔年轻时(图左)

要知道,DCT 最初可能差一点就被扼杀在了摇篮里。

1972 年,当时已经对 DCT 初有构思的纳西尔向美国国家科学基金会(NSF)递交了一份申请,希望 NSF 能为他研究 DCT 提供资金支持。

不过令纳西尔惊讶的是,这个申请直接被毙掉了,评审人给出的意见是“它太简单了”。

但好在纳西尔并没有放弃,他始终觉得这个 idea 很有新意。

唯一令他有所顾虑的是,他可能是只能利用假期来完成 DCT 的相关工作了,而且这期间可能没有任何收入。

所以,纳西尔回家和妻子说:

我有直觉,这事儿值得做下去。只不过我们需要计划好如何度过一个没有薪水的暑假。

妻子没有任何犹豫就支持了他。

于是,在 1973 年的夏天,DCT 的研究工作正式开始了。

参与到这项研究的,还有纳西尔的好友拉奥和博士生纳塔拉詹。

拉奥也是支持纳西尔研究 DCT 的重要人物之一。

在纳西尔的申请被毙掉后,他第一时间把自己的想法告诉了好友拉奥。

拉奥给出了这样的回复:

你要立即把这些结果以短文的形式发表。

这就是“How I Came Up with the Discrete Cosine Transform”诞生的始末。

三个印度人改变压缩算法 一意孤行整个暑假 却因“太简单”申不到经费

后来,这篇文章几乎称得上是图片视频压缩领域的必读之文。

之后的故事,也就是我们所熟知的了。

1974 年,《Discrete Cosine Transform》在 IEEE Transactions on Computers 上发表。

截至目前,这篇文章的被引次数已经达到 5878 次。

纳西尔曾在采访中表示,自己人生中最大的礼物,就是人们对 DCT 的认可。


阅读全文
相关推荐

车主注意!油价或迎年内第八涨,92号汽油折合升价约涨0.20元

车主注意!油价或迎年内第八涨,92号汽油折合升价约涨0.20元
中新经纬5月16日电 (付健青)今天(16日)24时,国内成品油新一轮调价窗口将开启。综合机构预测,本轮成品油价将上调,或为年内第八次上涨。本轮计价周期内,美油(WTI)曾跌落至100美元下方。但随着美国4月CPI、PPI数据公布,近40年高点的通胀压力致美股接连承压,叠加俄乌冲突影响持续,国际原油连续大涨。截至北京时间1...

宝洁称女人体臭是男人5倍后致歉 设有科学传播组却因虚假广告被罚

宝洁称女人体臭是男人5倍后致歉 设有科学传播组却因虚假广告被罚
“我们为宝洁会员中心账号近期一篇文章的不当内容对女性的不尊重,郑重道歉。”3月24日上午,#宝洁被指侮辱女性#话题冲上热搜,引来宝洁中国微博公号迅速致歉,但是网络对于宝洁的质疑依然难以平息。图片来源:微博截图让公众对宝洁的简单致歉难以接受的,是宝洁此前发布的内容,不仅侮辱女性,更是虚假传播。3月13日,宝洁...

河北一地倡议群众踊跃参与连花清瘟生产?招聘人员:每天180元包吃住

河北一地倡议群众踊跃参与连花清瘟生产?招聘人员:每天180元包吃住
连花清瘟“卖断货”了?近期,连花清瘟受到公众的强烈关注,市场传闻不断。23日,一则“连花清瘟断货后出现涨价 ”的新闻冲上了微博热搜。当日,以岭药业(002603.SZ)回应称:公司没有对连花清瘟相关药品进行提价,目前生产基本没有受到影响,销售也一切正常。目前在主流电商平台上,京东自营的连花清瘟胶囊24粒价格为14.8...

奔驰新款“小号C级”曝光!外观比奥迪A3还帅,取消1.3T车型

奔驰新款“小号C级”曝光!外观比奥迪A3还帅,取消1.3T车型
日前汽车元宇宙获取了一组梅赛德斯-奔驰新款CLA车型外观渲染图片,新车目前正在海外道路进行紧张的测试中,并计划将于2023年内上市开售。同时,新车也有望在明年同期继续以进口形式引入国内销售,并将继续与奥迪A3、宝马1系等车型展开竞争。此外,本代燃油版CLA也将成为最终版车型,后续将由其全新EQ系列纯电版车型所取代。...

高校推出西红柿炒月饼走红 学生:当天就被一抢而空

高校推出西红柿炒月饼走红 学生:当天就被一抢而空
每到中秋节,花式炒月饼就成了“保留节目”。近日,安徽某高校就因食堂推出的一道“黑暗料理”西红柿炒月饼上了热搜。高校中秋节推出西红柿炒月饼 (图片来源 网络)9月10日,有博主在抖音上发布了多张照片。照片中的菜品是一道西红柿炒月饼,文字介绍称“节日菜品,西红柿炒月饼,1元”。视频定位地址在安徽某高校。该视频...

90后的我 想赶紧来这些地方养老

90后的我 想赶紧来这些地方养老
随着越来越累的打工生活,许多人30岁提前预演退休生活的想法愈演愈浓,不过,如果真的要养老,去哪最舒服?当新一代老人对养老生活有着更多的心理期待,年轻的群体希望过上慢生活时,不如看看哪些康养城市排行榜上的城市能将风光景色、便捷生活完美结合,让你早早开始准备将养老生活提上日程。从2011年,海南省卫生厅提出了...

《科学》警告:今天的地球,5个危险的临界点一触即发!

《科学》警告:今天的地球,5个危险的临界点一触即发!
这个夏天,地球遭遇了非同寻常的极端天气。我们最直观的感受无疑是持续的高温:包括中国在内,北半球大片区域经历了历史级别的高温天气,山火也因此而更加频繁;而在另一些地区,罕见的极端降雨导致洪灾,例如淹没了巴基斯坦全国三分之一的土地……极端天气出现的原因是复杂的,但在这些事件背后,全球气温上升对气候系统的...

获嘉县司法局学习贯彻县委 十三届八次全会暨县委经济工作会议精神

获嘉县司法局学习贯彻县委 十三届八次全会暨县委经济工作会议精神
日前,获嘉县司法局先后召开党组会议、党员干部会,学习贯彻县委十三届八次全会暨县委经济工作会议精神,并结合司法行政工作实际部署落实意见。会议认真学习了县委书记赵明俊的讲话以及2025年经济工作的具体部署,深刻领会了会议的重要意义和丰富内涵,明确了司法行政工作在推动县域经济社会高质量发展中的责任与使命。就贯...

极狐阿尔法S、阿尔法T新车型上市,补贴后售价21.88万起

极狐阿尔法S、阿尔法T新车型上市,补贴后售价21.88万起
凤凰网汽车讯8月18日,极狐阿尔法S 525S、阿尔法S 525S+、阿尔法T 480S、阿尔法T 480S+四款新车正式上市。上市后,极狐阿尔法S由原在售车型525S、603H、708S+三个车款扩充为525S、525S+、603H、708S、708S+五个车款,最低起售价直降超2万至22.38万;极狐阿尔法T原四个车款型扩充至五个车款,最低起售价由24.23万降至2...

从中石油到比亚迪,投资中企20年,巴菲特赚了多少钱?

从中石油到比亚迪,投资中企20年,巴菲特赚了多少钱?
核心提示:1、巴菲特在2008年持仓比亚迪。如果以7月11日比亚迪港股收盘价306.8港元计算,巴菲特所持股份价值约为690亿港元(约合87.9亿美元),投资回报率超过38倍。2、巴菲特对中国公司的第一笔投资始于2002年港股的中国石油(00857.HK)。到2007年下半年,巴菲特以40亿美元的价格将中国石油股票尽数抛售,获得大约700%的超...
返回顶部