電腦版
首頁

搜尋 繁體

第495章 幻資料壓縮演算法猜想1

熱門小說推薦

最近更新小說

=資料壓縮演算法=速記演算法=

遞增素數之間,可以使用加法,得出相對小的數,可以用乘法,得出相對大的數,可以用乘方號,得出很大很大的數。

當使用特定長度把一個大資料分割成N個小片段時,就可以進行統計,比如全體相加,然後除以總數得到全域性平均數。

然後使用1KB的平均數,1MB的平均數,1GB的平均數作為比大小基準。

然後還有特定數(比如出現了一次以上的多次數)(比如只出現了一次的一次數)(比如出現的最大值)(比如出現的最小值)。

現在的問題就是,統計能夠獲得資料的被過濾掉了很多資訊的被壓縮後的資料,如何使用統計獲得的資料,來逆推原始資料(包括各種統計的先後順序)(當然,因為資料的缺失,導致必須使用試錯方式來實現)。

在處理大資料時,如何減少解壓縮時試錯次數,就是大資料壓縮專用演算法的重難點。

[示例]

如果有一個二進位制數1010010010011100110001000100010,統計出其二進位制的1總共有12個,二進位制的0總共有19個;轉換為八進位制為12223461042,統計出其八進位制的0總共出現了1次,八進位制的1出現了2次,八進位制的2出現了4次,八進位制的3出現了1次,八進位制的4出現了2次,八進位制的6出現了1次;轉換為十進位制為1380868642,統計出其十進位制的0出現了1次,十進位制的1出現了1次,十進位制的2出現了1次,十進位制的3出現了1次,十進位制的4出現了1次,十進位制的6出現了2次,十進位制的8出現了3次(當然了,為了加速碰撞,一般都是使用素數進位制的方式,而不是使用這種方式,作者用這種方式示例,只是為了方便使用微軟自帶的程式設計師計算器換算進位制,從而進行統計),那麼接下來,就需要透過進位制碰撞的方式,來逆推根據統計得出的原始資料。

Loading...

未載入完,嘗試【重新整理】or【關閉小說模式】or【關閉廣告遮蔽】。

嘗試更換【Firefox瀏覽器】or【Chrome谷歌瀏覽器】開啟多多收藏!

移動流量偶爾打不開,可以切換電信、聯通、Wifi。

收藏網址:www.mobvista.cc

(>人<;)