fatal1ty
2021-03-18T01:41:54+00:00
五十多万条数据一张表,因为是内部保密数据,所以只能描述下特征
经过查重一共七千多个ID
每个id有三种状态,ABC,不特定,每个状态有几条也不特定,也许20条都是A,也许ABC各5条
现在想统计
一、只有状态A的ID数,只有B的ID数,只有C的ID数
二、只有AB没有C的ID数,只有BC没有A的ID数,只有AC没有B的ID数
如何实现
谢谢各位大神
拿学校举例
总信息量为几十万条,每条都是学生的姓名和买书信息,去掉重复项应该有七千多个学生,每个学生都是买语文数学英语书,不一定买哪个,不一定买几次,但每一条都是只有一种书,要么语文,要么数学,要么英语
我只要统计这些学生中,有语文书的多少人,有数学书的多少人,有英语书的多少人,不管有几本,都算有语文书,还有就是组合了,有语文数学没有英语的多少,以此类推
做了个表样
链接:[url]https://pan.baidu.com/s/1oSLi4cUUDs3Aexmz7YQTJQ[/url]
提取码:ku2f
[img]http://img.nga.178.com/attachments/mon_201209/14/-47218_5052bc4cc6331.png[/img]盲猜一个countifs
你这表最大的问题不是你想要的统计,是这个数据量……
加一个或者找一个分区字段吧,最好拆10份,Excel透视表之后再sum
你做个样表吧,我实在看不明白你的描述[s:ac:呆]
A-B-C是一列还是三列没看懂
按楼上说的
数据透视然后计数
或者筛选
提问情况说明还是不到位,没说清楚是要计数,还是总数...
最简单的办法是全选数据直接制作透视表,ID放左边,状态放上面,状态的数值自己按需求改成计数或者汇总。
然后手动筛选A状态非0的,或者A非0且B也非0这样逐一出结果数量。、
哎呀,所有应用问题都是语文题。
我猜楼主是这个意思,
1,表中数据50万,其中的id数量是7k,意思有大量的id是重复数据
2,id的状态分a,b,c
现在需要统计,
状态等于a的id数,这个可能是求和,也可能是都是具体那些id,甚至这个字段。
以此类推,状态等b,c,ab,ac,bc
[quote][pid=503312621,26074407,1]Reply[/pid] Post by [uid=37323782]方溪[/uid] (2021-03-27 09:51):
数据透视表就处理了[/quote]能说下右下角那四个都用什么字段么?
数据量不是问题,现在excel有data model可以用。
[quote][pid=503317670,26074407,1]Reply[/pid] Post by [uid=1347331]死去的青春[/uid] (2021-03-27 10:19):
哎呀,所有应用问题都是语文题。
我猜楼主是这个意思,
1,表中数据50万,其中的id数量是7k,意思有大量的id是重复数据
2,id的状态分a,b,c
现在需要统计,
状态等于a的id数,这个可能是求和,也可能是都是具体那些id,甚至这个字段。
以此类推,状态等b,c,ab,ac,bc[/quote]你说的差不多都对,我再补充描述下
拿学校举例
总信息量为几十万条,每条都是学生的姓名和买书信息,去掉重复项应该有七千多个学生,每个学生都是买语文数学英语书,不一定买哪个,不一定买几次,但每一条都是只有一种书,要么语文,要么数学,要么英语
我只要统计这些学生中,有语文书的多少人,有数学书的多少人,有英语书的多少人,不管有几本,都算有语文书,还有就是组合了,有语文数学没有英语的多少,以此类推
几十万的数据?是我就导到数据库里再操作了[s:ac:茶]
[quote][pid=503312901,26074407,1]Reply[/pid] Post by [uid=5394069]windcrazier[/uid] (2021-03-27 09:53):
你这表最大的问题不是你想要的统计,是这个数据量……[/quote]重新晒了下,23万条,还行,处理速度挺快
[quote][pid=503319359,26074407,1]Reply[/pid] Post by [uid=38327520]在座的各位都是垃圾[/uid] (2021-03-27 10:28):
几十万的数据?是我就导到数据库里再操作了[s:ac:茶][/quote]导到数据库然后怎么操作呢
[quote][pid=503314287,26074407,1]Reply[/pid] Post by [uid=1292122]跪求[/uid] (2021-03-27 10:01):
你做个样表吧,我实在看不明白你的描述[s:ac:呆][/quote]重新描述了一下,应该能明白了
友情提示,非法获取50条财产信息,500条公民个人信息,5000条普通信息构成犯罪