stopand吧 关注:20,015贴子:1,584,791
  • 1回复贴,共1

科谱一下抽样调查。

取消只看楼主收藏回复

不懂统计学的还真多,总是有人质疑抽样调查的准确性。
抽样不是大街随便找人。大数据的统计都是二级选样,记住这二个词,二级和选样!
对于一个几百万人的城市,要统计所有人的收入首先就要先抽一个一级的样本,这个样本要足够大,大到符合“大数定律”,一般至少要几十万。 然后再在这个一级样本里进行二级选样。 选样前先剔除异样样本,马化腾,马云这样的全剔除。
然后开始等距排队。从1K到2K,3K。。。9K。。10K。。。15K。。。20K....100K..1000K
全部分组排队,你的收入是一万五千六百的就归到15K那一组,然后每一组按权重选人数。
7K8K9K10K。。。15K,如果这几个组权重如果最多,抽的人就最多,如果7K这个组按权重抽到40个人,这40
个人也是要排队的,7.0,7.1, 7.2 。。。7.9,然后按权重抽人,7.3可能选了8个人,7.9的也许只有2人。
最后只要几百人就可以搞定一个几百万人的城市的统计。这几百人就要把所有的收入支出变化天天填表,一毛不漏。
准不准呢? 全世界对大数据的抽样都是二级选样。 出来的结果完全符合认识
美国总是湾区纽约波士顿DC,LA这些城市,中国总是上海,江南,北京,深广珠三这些城市。
有没有连贯性呢?也就是这次的抽样和上次的抽样偏离度大不大。
每次抽样总有一些城市的名次会有变动,这个是正常的实力变化引起的,但如果这次的抽样排名和上次的抽样排名完全不同, 上次是上海,北京,深圳,广州。。。这次是西安,成都,杭州。。。那就是偏离度大。抽样没有连贯性。


IP属地:上海1楼2021-07-14 12:03回复
    有人说到普查后的人口对抽样的影响。
    一级样本如果是几十万人的样本,总量的变化对抽样影响很小。 也就是说一级样本如果抽了
    40万人,,这40万人要解释500万人总量或600万人的总量精确性差异不大。中美二国人口差三四倍,要做一个普通的收入或民意调查,各抽一万人足够了,中国用不着抽美国 的三倍,因为已经符合大数定律了。 当然如果要做一个精确的调查就要二级选样了,一级样本要有几十万人。
    2) 增加的人口只有发生重大结构性变化才会影响抽样结果。 比如以前增加的移民全是民工,现在以高学历为主,原有的样本就不能精确反映现有的人口结构。但这也是短暂的,因为一级样本选样几年就要调整一次。


    IP属地:上海15楼2021-07-15 12:05
    回复