又来问EXCEL问题了

fatal1ty-avatar

fatal1ty

2021-03-18T01:41:54+00:00

五十多万条数据一张表,因为是内部保密数据,所以只能描述下特征
经过查重一共七千多个ID
每个id有三种状态,ABC,不特定,每个状态有几条也不特定,也许20条都是A,也许ABC各5条
现在想统计
一、只有状态A的ID数,只有B的ID数,只有C的ID数
二、只有AB没有C的ID数,只有BC没有A的ID数,只有AC没有B的ID数


如何实现

谢谢各位大神

拿学校举例
总信息量为几十万条,每条都是学生的姓名和买书信息,去掉重复项应该有七千多个学生,每个学生都是买语文数学英语书,不一定买哪个,不一定买几次,但每一条都是只有一种书,要么语文,要么数学,要么英语
我只要统计这些学生中,有语文书的多少人,有数学书的多少人,有英语书的多少人,不管有几本,都算有语文书,还有就是组合了,有语文数学没有英语的多少,以此类推

做了个表样

链接:[url]https://pan.baidu.com/s/1oSLi4cUUDs3Aexmz7YQTJQ[/url]
提取码:ku2f
Jamases-avatar

Jamases

[img]http://img.nga.178.com/attachments/mon_201209/14/-47218_5052bc4cc6331.png[/img]盲猜一个countifs
darkxvpr-avatar

darkxvpr

数据透视表就处理了
Black.Alpina-avatar

Black.Alpina

你这表最大的问题不是你想要的统计,是这个数据量……
GoldenTurdle-avatar

GoldenTurdle

换sql吧
Ref-avatar

Ref

加一个或者找一个分区字段吧,最好拆10份,Excel透视表之后再sum
SomSom-avatar

SomSom

数据透视
XSlenderShadowX-avatar

XSlenderShadowX

你做个样表吧,我实在看不明白你的描述[s:ac:呆]
Spence-avatar

Spence

A-B-C是一列还是三列没看懂
按楼上说的
数据透视然后计数
或者筛选
S1eeper.-avatar

S1eeper.

提问情况说明还是不到位,没说清楚是要计数,还是总数...

最简单的办法是全选数据直接制作透视表,ID放左边,状态放上面,状态的数值自己按需求改成计数或者汇总。
然后手动筛选A状态非0的,或者A非0且B也非0这样逐一出结果数量。、
K0F-avatar

K0F

哎呀,所有应用问题都是语文题。

我猜楼主是这个意思,
1,表中数据50万,其中的id数量是7k,意思有大量的id是重复数据
2,id的状态分a,b,c

现在需要统计,
状态等于a的id数,这个可能是求和,也可能是都是具体那些id,甚至这个字段。
以此类推,状态等b,c,ab,ac,bc
fatal1ty-avatar

fatal1ty

[quote][pid=503312621,26074407,1]Reply[/pid] Post by [uid=37323782]方溪[/uid] (2021-03-27 09:51):

数据透视表就处理了[/quote]能说下右下角那四个都用什么字段么?
夜曲-avatar

夜曲

有个插件叫芳芳格子不知道能不能帮到你
Mbros1725-avatar

Mbros1725

数据量不是问题,现在excel有data model可以用。
fatal1ty-avatar

fatal1ty

[quote][pid=503317670,26074407,1]Reply[/pid] Post by [uid=1347331]死去的青春[/uid] (2021-03-27 10:19):

哎呀,所有应用问题都是语文题。

我猜楼主是这个意思,
1,表中数据50万,其中的id数量是7k,意思有大量的id是重复数据
2,id的状态分a,b,c

现在需要统计,
状态等于a的id数,这个可能是求和,也可能是都是具体那些id,甚至这个字段。
以此类推,状态等b,c,ab,ac,bc[/quote]你说的差不多都对,我再补充描述下
拿学校举例
总信息量为几十万条,每条都是学生的姓名和买书信息,去掉重复项应该有七千多个学生,每个学生都是买语文数学英语书,不一定买哪个,不一定买几次,但每一条都是只有一种书,要么语文,要么数学,要么英语
我只要统计这些学生中,有语文书的多少人,有数学书的多少人,有英语书的多少人,不管有几本,都算有语文书,还有就是组合了,有语文数学没有英语的多少,以此类推
dxvil.drk-avatar

dxvil.drk

几十万的数据?是我就导到数据库里再操作了[s:ac:茶]
fatal1ty-avatar

fatal1ty

[quote][pid=503312901,26074407,1]Reply[/pid] Post by [uid=5394069]windcrazier[/uid] (2021-03-27 09:53):

你这表最大的问题不是你想要的统计,是这个数据量……[/quote]重新晒了下,23万条,还行,处理速度挺快
fatal1ty-avatar

fatal1ty

[quote][pid=503319359,26074407,1]Reply[/pid] Post by [uid=38327520]在座的各位都是垃圾[/uid] (2021-03-27 10:28):

几十万的数据?是我就导到数据库里再操作了[s:ac:茶][/quote]导到数据库然后怎么操作呢
fatal1ty-avatar

fatal1ty

[quote][pid=503314287,26074407,1]Reply[/pid] Post by [uid=1292122]跪求[/uid] (2021-03-27 10:01):

你做个样表吧,我实在看不明白你的描述[s:ac:呆][/quote]重新描述了一下,应该能明白了
steny22-avatar

steny22

友情提示,非法获取50条财产信息,500条公民个人信息,5000条普通信息构成犯罪