你的位置:金发大奶 > 海选av女优 >

欧美视频 好意思本科生更正哈希表, 颠覆40年数据科学

欧美视频 好意思本科生更正哈希表, 颠覆40年数据科学

欧美视频

Rutgers大学本科生Andrew Krapivin发明新哈希表,搜索速率超乎念念象,推翻40年猜念念,揭示数据存储新可能。

2021年秋天,Rutgers大学本科生Andrew Krapivin巧合读到一篇论文,那时他并未太防范。两年后,他终于抽出时辰细读这篇名为“Tiny Pointers”的著述,隧谈出于意思,却没念念到这会彻底改动他对诡计机科学的主意。文中提到的“指针”是调换你找到诡计机内存中某个信息的箭头般存在。Krapivin突发奇念念,能否让这些指针更“工致”,占用更少的内存。可要竣事这个方向,他得先找到一种更聪惠的方针来整理这些指针指向的数据。

他把眼神投向了常用的哈希表。这种数据存储神气肤浅实用,但在摆弄流程中,Krapivin发现我方意外间创造出了一种全新哈希表。它的速率快得惊东谈主,查找特定元素时用时更短、步伐更少。他的前教诲Martín Farach-Colton开始并不看好这个联想。毕竟,哈希表是诡计机科学里磋议最彻底的结构之一,这么的打破听起来像是离奇乖癖。为了保障起见,Farach-Colton请来了常配合的伙伴William Kuszmaul襄助考证。Kuszmaul却欢叫地说:“你不仅仅搞了个酷炫的哈希表,你径直推翻了一个40年的老猜念念!”

Krapivin(现为剑桥大学磋议生)、Farach-Colton(现任职纽约大学)和Kuszmaul联手在2025年1月发表论文,讲明这个新哈希表确乎能以超乎念念象的速率找到元素,径直诡辩了始终被视为真谛的猜念念。Cornell Tech的Alex Conway评价谈:“这篇论文谈理首要。哈希表是最迂腐的数据结构之一,于今依然存储数据的高效时代,但仍有未解之谜。这篇著述出东谈主预感地解开了几个。”

女王 调教

哈希表之是以无处不在,是因为它肤浅好用。它只撑捏三种操作:搜索元素、删除元素、插入元素。早在1950年代,第一批哈希表就已出现,尔后科学家们从未罢手磋议,念念弄清这些操作的速率极限。比如,搜索或插入能有多快?这频繁取决于在哈希表中找到空位的时辰,而空位若干又跟表的“满度”干系。满度不错用百分比示意,比如50%或90%,但磋议者常处理险些满载的情况,于是用一个数字“x”来神态离100%满还有多近。x是100时,表满99%;x是1000时,满99.9%。这个筹办让评估操作耗时变得更直不雅。

畴昔的磋议标明,在常见哈希表中,最糟情况下的插入(比如插到临了一个空位)所需时辰与x成正比。Kuszmaul解释:“若是表满99%,你可能得查验100个位置才智找到空位。”1985年,诡计机科学家Andrew Yao在一篇论文中残酷,关于某些特定哈希表,最好搜索神气是立时查验位置,也即是“均匀探伤”。他还断言,在最糟情况下,找到临了一个空位的时辰不成能比x更快。40年来,大多量东谈主齐信了他的猜想。

Krapivin却是个例外,因为他根底不知谈这个猜念念。“我绝对没据说过Yao的表面,”他说。他从袖珍指针发轫,摸索出一种不靠均匀探伤的新哈希表。在这个内外,最糟情况下的搜索和插入时辰与(log x)²成正比,远比x快得多,径直点破了Yao的猜念念。Farach-Colton和Kuszmaul帮他讲明,(log x)²是对Yao磋议的那类热点哈希表的最好极限。Carnegie Mellon的Guy Blelloch称:“这个完了奥妙极了,搞定了一个经典弯曲。”

滑铁卢大学的Sepehr Assadi补充:“他们不仅推翻了猜念念,还找到了最优解。没准咱们还得再等40年才智知谈谜底。”更令东谈主畏俱的是,这篇论文还挑战了Yao的另一个论断。1985年,Yao磋议了总共可能的平均查询时辰,讲明关于某些“盘算”哈希表(新元素必须插到第一个空位),平均时辰不成能优于log x。Krapivin团队酷爱这个死心是否适用于非盘算哈希表。他们给出了反例:一种非盘算哈希表的平均查询时辰远超log x,致使跟x无关。Farach-Colton说:“你取得的是个常数,跟表有多满不要紧。”这种恒定时辰的发现,连作家我方齐没预料。

这些恶果粗略不会坐窝改动践诺诈欺,但Conway以为谈理深刻:“深入剖释这类数据结构很热切。谁知谈呢,也许某天这个发现会解锁实用中的新打破。”从Rutgers的课堂到剑桥的磋议室,Krapivin用酷爱心和创造力,掀起了40年的定论,也让东谈主看到数据科学的无尽可能。

本文译自 Quanta Magazine欧美视频,由BALI剪辑发布。