1、海量日志数据,提取出某日访问百度次数最多的那个IP。 2、寻找热门查询,300万个查询字符串中统计最热门的10个查询。 3、上千万或上亿数据(有重复),统计其中出现次数最多的前N个数据。 4、海量数据分布在100台电脑中,想个办法高效统计出这批数据的TOP10。
评论