標題亂下的XDDDD
按慣例,先下結論,
有好消息,也有已知的壞消息:
新角上昇池, 粗估
新角機率 0.2% (壞消息
非當期四星 0.6% (好消息
內文:
本文重點在利用數據量縮小誤差
統計推斷的數值須為 一段區間
所以剛剛結論這樣寫是蠻忌諱的@@
一。常見的錯誤推斷
a.一款單抽出貨率5趴的遊戲,10次10連完全沒有出貨,50趴的10次方,ㄟ,超級小,偶要吉死關方
b.30%的詛咒卷(舊楓谷!),淦,偶都爆掉,那些+7金武的都肆外掛啦外掛
c.出貨率5趴,這20抽下去一定會出貨的啦嘿嘿
錯誤在哪?
¤只講a 最近很常看到a類型的錯誤
我講下句話大概就能明白
§10次10連,只出一次貨,50趴的10次方乘上10,ㄟ還是超級小阿§
原因就在:
情況有那麼多種,樹末端有那麼多岔,
即使是發生率最高的出貨5次,機率也只有0.09 (注意沒%)
硬要%表示的話這裡是9%
(C100取5乘0.05五方再乘0.95九五方)
二。何去何從
中央極限定理
無論數據X1...Xn從何分佈來
定義p是X1...Xn平均
定義sigma是X1...Xn是離均差的平方和的平均再開根號
(X-p)/σ ~ Normal(0,1)常態分佈
-可以說是所有統計推論的源頭
(中央極限定理是可被證明的,非公設)
三。不廢話了
統計資料
來源: 卡爾覺醒中 Apaya Zsub
11抽次數 歪四 當期四
24 0 0 ...apaya
16 2 1 ...卡爾
20 4 0
16 0 0
16 0 0
16 1 0
16 0 0
8 0 1
6 2 1
6 0 0
16 2 0
16 1 0
3 0 1
16 1 0 ...zsub
N = 195*11
n_歪 = 13
n_new = 4
p_() = n_() / N
σ_() =√[ p_() * [1-p_()] / N]
依常態分佈性質
有68%數據在正負1個標準差內
有95%數據在正負2個標準差內
有99.7%數據在正負3個標準差內
採用信心水準95%
機率_() ∈ [p-2σ, p+2σ] => p±2σ
計算結果:
機率_(歪出4星) = 0.61%± 0.34%
機率_(新角) = 0.19%± 0.20%
四。想再縮小誤差
A.設定誤差目標
歪出四星想在±0.15%內
新角誤差想在±0.05%內
B.工具
2*σ. 近似. 2*√(p/N)
C.解得
歪出四星想在 0.6%±0.15%內
N≥10666 (969次十一抽)
新角誤差想在 0.2%±0.05%內
N≥32000 (2909次十一抽)
D.結論
如果換作我想暗改機率不被發現
我則頂多頂多改0.6%為 0.45%
你看
為了要驗證我 要花1000次11連
1次11連要300塊好了
要花到30萬
有1/3的人配合調查就算不錯了
這個時間內就吸金100萬
五。什麼「情況」下 要幾N抽0彩 問題不是出在非洲
"情況"說明1:*假設* 公式的亂數
來源不是偽隨機
偽隨機例子:有些計算機亂數來源是以毫秒為單位讀現在時間
"情況"說明2: 譬如紀錄擲硬幣,看到紀錄中有一段發生連續十次反面,就說這硬幣怪怪的,"這樣是不對的"
以下採用 檢驗論文數據不自然,發生機率要小於10^-4
P(數據X不在 平均加減四標準差)
=P(∣X-p∣>4σ)
=0.999 936
=30多萬人中出了2個叛徒
假設下一次就中彩票
於是p = 1/ (N+1) 約等於 1/N
σ = √[(1/N)*(1)/ N )] = 1/N
p+4σ = 5/N
譬如真實新角機率0.2%
N > 1÷ 0.2% x 5 = 2500
(250次十連不現實)
譬如4星舊角池3倍上升共3%
N > 1 ÷3% x5 = 166
(非洲總統勳章)
不過啊 30萬分之一的機率
有生之年還是有可能發生啊
(有可能有非洲總統啊)(不過非洲總統2個以上就不對了)
譬如最近玩的美好世界FD
有人說刷了百次首抽沒暗刺
暗刺機率= 0.04/19
首抽有25抽. (必4先不算)
算一算超出四個標準差
結果呢
他刷錯池啦 囧囧Der
再來談談噁心的六標
六個標準差是企業級的檢驗
「慣例」是用六個標準差
數據在六標外的機率為
0.999 999 998
五億人中出一人
當然也可以更噁心七標以上
七標是 四百億中出了1
地球上沒有這麼多人啦
六。關於數據造假的雜談
日本麻醉醫師──藤井善隆,被抓到長期偽造數據
關鍵的原理:
作業不會寫用亂猜的人 是非題不敢連續畫10個O. 總是OOXX交錯才會看起來很隨機
但是 1萬題 是非題中沒有連續10個O 的機率 比10^-4 還小
所以,衝卷連續成功/失敗是很自然的現象,即使撇開偽隨機不談
七。又搞糊塗了
一下子說10次10連沒出貨
機率小於10^-4
說是有可能發生的
又說別人數據造假也是比10^-4小
就說造假
八。釐清
藤井善隆的論文中是有90處犯這種錯誤 如果只有一處是可能發生的
對於結果不是0就是1的試驗
想要一次就咬定不可能發生
要用6個標準差
對於結果不是0就是1的試驗
可以實驗多次再咬定不可能發生
就用3∼4個標準差
對於結果是,譬如電壓=1.50V
那種數值化的試驗 還可以實驗很多次
就用2∼3標準差
對於結果是,像物理,咬定F=ma
就用4個標準差
結。
雖然2個標準差 只代表95%
但是只要下次萬抽
和下下次萬抽 都這樣
就能咬定了
最好的辦法就是在法官面前萬抽給他們看
啊,台灣對於公告機率不實沒立法的樣子
立法的好像是保底 也可能都沒有
按慣例,先下結論,
有好消息,也有已知的壞消息:
新角上昇池, 粗估
新角機率 0.2% (壞消息
非當期四星 0.6% (好消息
內文:
本文重點在利用數據量縮小誤差
統計推斷的數值須為 一段區間
所以剛剛結論這樣寫是蠻忌諱的@@
一。常見的錯誤推斷
a.一款單抽出貨率5趴的遊戲,10次10連完全沒有出貨,50趴的10次方,ㄟ,超級小,偶要吉死關方
b.30%的詛咒卷(舊楓谷!),淦,偶都爆掉,那些+7金武的都肆外掛啦外掛
c.出貨率5趴,這20抽下去一定會出貨的啦嘿嘿
錯誤在哪?
¤只講a 最近很常看到a類型的錯誤
我講下句話大概就能明白
§10次10連,只出一次貨,50趴的10次方乘上10,ㄟ還是超級小阿§
原因就在:
情況有那麼多種,樹末端有那麼多岔,
即使是發生率最高的出貨5次,機率也只有0.09 (注意沒%)
硬要%表示的話這裡是9%
(C100取5乘0.05五方再乘0.95九五方)
二。何去何從
中央極限定理
無論數據X1...Xn從何分佈來
定義p是X1...Xn平均
定義sigma是X1...Xn是離均差的平方和的平均再開根號
(X-p)/σ ~ Normal(0,1)常態分佈
-可以說是所有統計推論的源頭
(中央極限定理是可被證明的,非公設)
三。不廢話了
統計資料
來源: 卡爾覺醒中 Apaya Zsub
11抽次數 歪四 當期四
24 0 0 ...apaya
16 2 1 ...卡爾
20 4 0
16 0 0
16 0 0
16 1 0
16 0 0
8 0 1
6 2 1
6 0 0
16 2 0
16 1 0
3 0 1
16 1 0 ...zsub
N = 195*11
n_歪 = 13
n_new = 4
p_() = n_() / N
σ_() =√[ p_() * [1-p_()] / N]
依常態分佈性質
有68%數據在正負1個標準差內
有95%數據在正負2個標準差內
有99.7%數據在正負3個標準差內
採用信心水準95%
機率_() ∈ [p-2σ, p+2σ] => p±2σ
計算結果:
機率_(歪出4星) = 0.61%± 0.34%
機率_(新角) = 0.19%± 0.20%
四。想再縮小誤差
A.設定誤差目標
歪出四星想在±0.15%內
新角誤差想在±0.05%內
B.工具
2*σ. 近似. 2*√(p/N)
C.解得
歪出四星想在 0.6%±0.15%內
N≥10666 (969次十一抽)
新角誤差想在 0.2%±0.05%內
N≥32000 (2909次十一抽)
D.結論
如果換作我想暗改機率不被發現
我則頂多頂多改0.6%為 0.45%
你看
為了要驗證我 要花1000次11連
1次11連要300塊好了
要花到30萬
有1/3的人配合調查就算不錯了
這個時間內就吸金100萬
五。什麼「情況」下 要幾N抽0彩 問題不是出在非洲
"情況"說明1:*假設* 公式的亂數
來源不是偽隨機
偽隨機例子:有些計算機亂數來源是以毫秒為單位讀現在時間
"情況"說明2: 譬如紀錄擲硬幣,看到紀錄中有一段發生連續十次反面,就說這硬幣怪怪的,"這樣是不對的"
以下採用 檢驗論文數據不自然,發生機率要小於10^-4
P(數據X不在 平均加減四標準差)
=P(∣X-p∣>4σ)
=0.999 936
=30多萬人中出了2個叛徒
假設下一次就中彩票
於是p = 1/ (N+1) 約等於 1/N
σ = √[(1/N)*(1)/ N )] = 1/N
p+4σ = 5/N
譬如真實新角機率0.2%
N > 1÷ 0.2% x 5 = 2500
(250次十連不現實)
譬如4星舊角池3倍上升共3%
N > 1 ÷3% x5 = 166
(非洲總統勳章)
不過啊 30萬分之一的機率
有生之年還是有可能發生啊
(有可能有非洲總統啊)(不過非洲總統2個以上就不對了)
譬如最近玩的美好世界FD
有人說刷了百次首抽沒暗刺
暗刺機率= 0.04/19
首抽有25抽. (必4先不算)
算一算超出四個標準差
結果呢
他刷錯池啦 囧囧Der
再來談談噁心的六標
六個標準差是企業級的檢驗
「慣例」是用六個標準差
數據在六標外的機率為
0.999 999 998
五億人中出一人
當然也可以更噁心七標以上
七標是 四百億中出了1
地球上沒有這麼多人啦
六。關於數據造假的雜談
日本麻醉醫師──藤井善隆,被抓到長期偽造數據
關鍵的原理:
作業不會寫用亂猜的人 是非題不敢連續畫10個O. 總是OOXX交錯才會看起來很隨機
但是 1萬題 是非題中沒有連續10個O 的機率 比10^-4 還小
所以,衝卷連續成功/失敗是很自然的現象,即使撇開偽隨機不談
七。又搞糊塗了
一下子說10次10連沒出貨
機率小於10^-4
說是有可能發生的
又說別人數據造假也是比10^-4小
就說造假
八。釐清
藤井善隆的論文中是有90處犯這種錯誤 如果只有一處是可能發生的
對於結果不是0就是1的試驗
想要一次就咬定不可能發生
要用6個標準差
對於結果不是0就是1的試驗
可以實驗多次再咬定不可能發生
就用3∼4個標準差
對於結果是,譬如電壓=1.50V
那種數值化的試驗 還可以實驗很多次
就用2∼3標準差
對於結果是,像物理,咬定F=ma
就用4個標準差
結。
雖然2個標準差 只代表95%
但是只要下次萬抽
和下下次萬抽 都這樣
就能咬定了
最好的辦法就是在法官面前萬抽給他們看
啊,台灣對於公告機率不實沒立法的樣子
立法的好像是保底 也可能都沒有
有些情況分母是N-1 不是N
不過N既然超過1000 這點懶不會有太多影響
現在打字打得有點暈