電腦版
首頁

搜尋 繁體

第239章 幻大資料壓縮研究

熱門小說推薦

最近更新小說

任何一個隨機大資料,都有兩種可能,一種是可以用極少數的算式就能得出,比如1024的1024次方;另一種是可以用極少數的算式就能近似得出,也就是用一個算式,能夠得出重合率達到百分之八十的數值,只需要一些不重合區域的表示式就可以還原。

按照進位制,分為十進位制大資料,十六進位制大資料,二進位制大資料。

資料的進位制可以轉換,而當資料足夠大時,進位制的轉換會導致運算資源佔用,也就需要有對應的進位制的資料壓縮方法。

二進位制無理數專用處理器:生成二進位制的圓周率,生成二進位制的黃金分割率,生成任意正整數的以自身為開方數的數值,階除——也就是1除以2除以3除以4除以5一直到特定中止位置的取小數部分。

隨機重合排列關係專用處理器:在二進位制中,隨機找出一個無理數(資料卡尺)和一個有理數資料(需要被轉化為最短表示式的原始資料)的資料重合部分,把這些重合表達為最短表示式,當然,一個原始資料不可能只採用一個數據卡尺。

發展下去,大資料就需要有專用的資料卡尺伺服器,也就是小的資料卡尺伺服器,可以常備1000多個數據卡尺,而大的資料卡尺伺服器,可以常備千萬億級別的資料卡尺。

資料卡尺越多,越容易生成最短表示式。

資料卡尺的用法:

一元資料卡尺:把原始資料和資料卡尺進行比對,找出其中重合部分,把重合部分記錄為資料卡尺引用段落表示式。

Loading...

未載入完,嘗試【重新整理】or【關閉小說模式】or【關閉廣告遮蔽】。

嘗試更換【Firefox瀏覽器】or【Chrome谷歌瀏覽器】開啟多多收藏!

移動流量偶爾打不開,可以切換電信、聯通、Wifi。

收藏網址:www.mobvista.cc

(>人<;)