中易网

sparksql产生的临时表之间可以进行去重查询吗

答案:2  悬赏:0  
解决时间 2021-02-13 03:10
sparksql产生的临时表之间可以进行去重查询吗
最佳答案
(一)分批执行,就是把几万个id,按3000一组查询一次,最后把所有的查询结果在汇合起来。
(二)使用join,把几万个id创建成一张hive表,然后两表关联,可以一次性把结果给获取到。
这里倾向于第二种解决办法,比较灵活和方便扩展,尽量不要把数据集分散,一旦分散意味着客户端需要做更多的工作来合并结果集,比如随便一个sum或者dinstict,如果是第一种则需要在最终的结果集再次sum或者distinct。
全部回答
spark sql就是shark ,也就是sql on spark。如果没记错的话,shark的开发利用了hive的api,所以支持读取hbase。而且spark的数据类型兼容范围大于hadoop,并且包含了hadoop所支持的任何数据类型。
我要举报
如以上问答内容为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
嘴不会说怎么办?
app store更新应用时账号变成S字母,怎么解决
为什么我进不去网关登录验证界面
我家网费到期后过了一个月才被停
站前地区归国华侨联合会怎么去啊,有知道地址
永州广电中心在哪里啊,我有事要去这个地方
我现在的地理位置是在哪里
DNF强化直播窗口没有了怎么点出来
百合停车场地址有知道的么?有点事想过去
喝绝明子吃饭应该注意什么东西不能吃
我的三星S7edge右边出现了一条线,这是什么情
陈记开心花甲在什么地方啊,我要过去处理事情
新西兰那个城市较好,华人要少,那个高中好,
我爱的人是谁作词
全国有多少个人叫廖军的
推荐资讯
运动有助于睡眠吗?
永康市南北门业有限公司怎么去啊,有知道地址
湖南福彩22选5 2009058期开奖结果
云记面馆地址在哪,我要去那里办事
要杠杠大。波动大的微盘。云微盘。
qq飞车雷诺要怎样镶嵌宝石,镶嵌什么宝石好。
请问一下对外经济贸易大学的民商法专业的研究
客家传奇地址在哪,我要去那里办事
桦南县闫家镇地址在哪,我要去那里办事
中国电信良田宽带代理店在哪里啊,我有事要去
听说姑娘走丢了打一电影名是什么电影
特朗普宣布对钢铝征税的前些天白宫里到底发生
手机登qq时,显示手机磁盘不足,清理后重新登
刺客的套装怎么选啊?