[讨论] [水一帖] 小学生来问作业了

bortolinho-avatar

bortolinho

2020-12-17T19:57:19+00:00

有门数据分析的课要交个大作业,数据自己找,要求展示出学到的数据分析手段
翻了翻前些年的高分作业,发现教授喜欢离奇的问题,所以想到了水区老哥
[s:a2:goodjob]水区混了些日子,感觉兄弟们的眼界比小弟开阔太多了,小弟就是个榆木脑袋的做题家,特来问问兄弟们有没有什么感兴趣的问题

问题要求如下:

适用于排序方法或者分类方法(Ordination methods, Classification methods)。这个没办法,到底还是要切合课的内容嘛,不过其实也不用很在意,如果各位不确定是否适用大胆发上来就好了,小弟会判断的。

越离奇越好 主要是角度要新颖吧,说离奇可能有点过了。 举例说明的话,我手上的几分高分作业内容分别是:基于某些物理和化学性质揭示玻璃碎片起源;通过从新闻时报辩论的youtube视频中提取评论来分析观众的反应;通过物理化学性质预测土壤含碳量;找特定类型的啤酒的评论里的常用关键词;通过FB共享的数据验证“五大人格”模型; PS:最好不要是生物类的问题,因为这个教授本职就是搞生物数据的

有两个禁用的数据库:University California Irving Machine Learning Repository 和 Kaggle。 教授:无它,看烦了[s:ac:哭笑]

如果能够提供数据来源或者大概提取数据的思路就更好了,即使不能也没关系,有了问题之后小弟也会自己试着找数据的

个人觉得做图像类的问题稍微有点困难,因为电脑配置不太行,数据也不太好收集。
文本挖掘小弟没有试过,如果有有趣的话题可以一试

小弟穷得叮当响,许诺报酬自然是不可能的,不过如果最后从老哥们提供的问题里挑了问题,我会把最后的结果分享给问题的提供者的![s:ac:goodjob]
先谢过各位老哥啦
N3X-avatar

N3X

推文分析,可以找包括一家公司tag的所有推文然后看看做情感分析,看看这家公司在网络上的评价如何,有技术的话可以自己爬,如果没做过好像网上也有类似的数据可以404一下,比如什么航空公司数据啊之类的

图像处理的话其实不是太推荐,除非你在CNN等算法上有所建树,能把算法优化出个名堂,不然下一大堆训练图片好几十个G也就是调调参数

找数据的话根据你的要求我还是推荐404的好了[s:ac:晕][img]https://img.nga.178.com/attachments/mon_202012/24/-7Q5-i318ZcT1kShs-11j.jpg.medium.jpg[/img]
草草看了一下还是有挺多不错的话题的

对了对了,Tableau有一个viz of the day板块,收集做的最好的visualization,里面都可以直接下载数据集和tableau文件,如果你感兴趣也可以去看看,我记得应该不用梯子
bortolinho-avatar

bortolinho

Reply to [pid=479298089,24793165,1]Reply[/pid] Post by [uid=41230976]evangephp[/uid] (2020-12-24 04:08)
我倒是从来没有直接拿它搜过数据集。。。多谢老哥
不过我还是更关心“问题”而不是数据吧,毕竟好问题比数据还是难找一点,想找一个有意思的话题来分析

才看见Tableau的编辑,这就去瞅瞅[s:ac:goodjob]