赛题在这个pdf文件第三页
分析3千多万条用户点击广告的数据预测1百万用户的性别和年龄段,数据量那么大不知道怎么处理了,想请教下本论坛有没有擅长大数据处理的高手,给出个解题思路,办法
赛题在这个pdf文件第三页
分析3千多万条用户点击广告的数据预测1百万用户的性别和年龄段,数据量那么大不知道怎么处理了,想请教下本论坛有没有擅长大数据处理的高手,给出个解题思路,办法
有机子的话这数据量并不是很大,另外比赛到公开论坛求思路不太好。
深度学习?网络一堆大数据处理的知识,分布式处理。多核多线程。。一堆。。。
公开思路没问题,早已有人公开,问题是公开了还是不知道怎么做才是比较尴尬的
数据全部导入mysql,查询单条sql太慢了,于是多开几个查询一起跑,然后cpu(8核16线程)就爆满了,请求论坛高人,解这个题目,数据库是必须的吗?如果不用数据库mysql之类的是不是也有办法能处理
mysql绝对不是最佳。。。流行:Hadoop,spark,技术都在不断变化。。。。
腾讯真TM黑,弄个好算法不花一分钱,然后这算法还能用来对我们进行广告轰炸。
本来计算机是让人们的生活更便利的,现在很多公司为了赚钱,把普通用户搞得团团转,真是悲哀。幸亏这个世界还有开源和“盗版”
腾讯确实黑,不过这题目拿来学习还是没问题的,题目太难才贴近实际开发环境中遇到的问题,如果能解决也是能力的提升,再遇到此类问题就不怕解决不了了
hadoop不是用来支撑计算机集群运算的么,楼主就一台电脑的话上这些没用的吧