=資料卡尺=
如何用統計學的知識,來應用在資料上呢?
-第一步-
要弄明白統計學和資料之間的共性和非共性。
統計學:每一個數據無論其數值是多少,其本身就作為一個數值獨佔的存在體,然而統計學本身就有意和無意的忽略了各個數值的先後排列。
資料:每一個數據無論其數值是多少,其本身就作為一個數值獨佔的存在體,然而資料本身很注重各個數值的先後排列。
比如:ABRACADABRA
用統計學來表示,就是A出現了5次,B出現了2次,C出現了1次,D出現了1次,R出現了2次。
用資料來表示,就是ABRACADABRA。
那麼如何把資料快速的解壓縮出來呢?可以使用分段壓縮方式,比如把一個大檔案,分割成一個個片段,例如:
ABRACADABRATHEFOXJUMP.張三和李四一起去喝酒。
那麼,就可以根據前面的資料,本身就是採用英文的方式,也就是最多是52進位制(區分大小寫),而後面的中文可就麻煩了,畢竟中文字身進位制相當大,那麼就需要進行大進位制處理。
用統計學的方法,就是把資料平均分,然後分割成可以互相對齊的資料個體,然後統計這些資料個體各出現了多少次。
然後進行統計,把統計資料記錄下去。
也就是說,把大英百科全書的純文字內容用統計學的方式記錄下來,就能對應到大小寫英文字母+符號+空格+換行+換頁……
Loading...
未載入完,嘗試【重新整理】or【關閉小說模式】or【關閉廣告遮蔽】。
嘗試更換【Firefox瀏覽器】or【Chrome谷歌瀏覽器】開啟多多收藏!
移動流量偶爾打不開,可以切換電信、聯通、Wifi。
收藏網址:www.mobvista.cc
(>人<;)