其实这种算法确实是认为每次抽取样本是相关的。
从书签考虑,四次买到第一个书签出现是C_4^1,买到第二个就是剩下的三次中的任意一次C_3^1,以此类推,总的是C_4^1*C_3^1*C_2^1*C_1^1。
之后就是最重要的总样本数了。如果采样(买书)的时候有关联,那么几率就是需要考虑N*(N-1)*(N-2)*(N-3)/4!=C_N^4,N是总量,否则就完全不是这样的。
但是我们买书的时候一般不会考虑关联性……当然,买书的时候确实有库存高级的情况……所以也不能说完全没关联……-_-b
库存足够多的时候,结果就应该是0.05760,这点我的两段代码都验证了……上面也有很多人都说了区别了。sei的这个结果有待商榷呢。