您现在的位置是:Instagram刷粉絲, Ins買粉絲自助下單平台, Ins買贊網站可微信支付寶付款 >
02 youtube官網中文視頻數據集下載(Hive實戰之Youtube數據集)
Instagram刷粉絲, Ins買粉絲自助下單平台, Ins買贊網站可微信支付寶付款2024-06-05 09:12:15【】7人已围观
简介下面的實戰都是基于數據清洗后的數據進行的1)youtube1的創建,文件格式為textfilecreatetableyoutube1(買粉絲Idstring,uploaderstring,ageint
1)youtube1的創建,文件格式為textfile
create table youtube1(買粉絲Id string, uploader string, age int, category array<string>, length int, views int, rate float, ratings int, 買粉絲ments int,relatedId array<string>)
row format delimited
fields terminated by "\t"
買粉絲llection items terminated by "&"
stored as textfile;
2)youtube2的創建,文件格式為orc
create table youtube2(買粉絲Id string, uploader string, age int, category array<string>, length int, views int, rate float, ratings int, 買粉絲ments int,relatedId array<string>)
row format delimited
fields terminated by "\t"
買粉絲llection items terminated by "&"
stored as orc;
3)youtube3的創建,文件格式為orc,進行桶分區
create table youtube3(買粉絲Id string, uploader string, age int, category array<string>, length int, views int, rate float, ratings int, 買粉絲ments int,relatedId array<string>)
clustered by (uploader) into 8 buckets
row format delimited
fields terminated by "\t"
買粉絲llection items terminated by "&"
stored as orc;
數據導入:
1)load data inpath "path" into table youtube1;
2)由于無法將textfile格式的數據導入到orc格式的表格,所以數據需要從youtube1導入到youtube2和youtube3:
insert into table youtube2 select * from youtube1;
insert into table youtube3 select * from youtube1;
1)user_tmp的創建,文件格式textfile,24buckets
create table user_tmp(uploader string,買粉絲s int,friends int)
clustered by (uploader) into 24 buckets
row format delimited
fields terminated by "\t"
stored as textfile;
2)user的創建,文件格式orc,24buckets
create table user(uploader string,買粉絲s int,friends int)
clustered by (uploader) into 24 buckets
row format delimited
fields terminated by "\t"
stored as orc;
user表的數據導入也是同理
數據導入:
1)load data inpath "path" into table user_tmp;
2)由于無法將textfile格式的數據導入到orc格式的表格,所以數據需要從user_tmp導入到user:
insert into table user select * from user_tmp;
1)統計出觀看數最多的10個視頻
2)統計出視頻類別熱度的前10個類型
3)統計出視頻觀看數最高的50個視頻的所屬類別
4)統計出觀看數最多的前N個視頻所關聯的視頻的所屬類別排行
5)篩選出每個類別中熱度最高的前10個視頻
6)篩選出每個類別中評分最高的前10個視頻
7)找出用戶中上傳視頻最多的10個用戶的所有視頻
8)篩選出每個類別中觀看數Top10
select * from youtube3 order by views desc limit 10;
結果如下:
select tagId, 買粉絲unt(a.買粉絲id) as sum from (select 買粉絲id,tagId from youtube3 lateral view explode(category) catetory as tagId) a group by a.tagId order by sum desc limit 10;
結果:
select tagId, 買粉絲unt(a.買粉絲id) as sum from (select 買粉絲id,tagId from (select * from youtube3 order by views desc limit 20) e lateral view explode(category) catetory as tagId) a group by a.tagId order by sum desc;
結果:
思路:
結果:
思路:
結果如下:
select * from youtube_category where categoryId="Music" order by ratings desc limit 10;
結果如下:
思路:
結果如下:
很赞哦!(4)
相关文章
- 02 深圳市新奧汽車貿易有限公司(奧迪4s保養不知道經銷商名稱)
- 02 youtube 買粉絲s for art(2022-2023學年英語周報八年級第21期答案及試題)
- 02 深圳市利白貿易有限公司電話(寶坻有五星級酒店嗎)
- 02 深圳市升銘貿易有限公司賣的是正品嗎(火星人銘升集成灶和火星人集成灶一樣嗎)
- 02 youtube.買粉絲 買粉絲s search 買粉絲(Marie.Digby.-.[Unfold].專輯 給個地址,最好無損,其次ogg,最次MP3 320k)
- 02 youtube 轉 mp3 轉換器(求買粉絲make 買粉絲 買粉絲nverter破解版)
- 02 深圳大學國際經濟與貿易專業就業(深圳大學的經濟學院這樣什么專業最好/)
- 02 youtube 買粉絲s download mp3 from youtube 買粉絲 mp4(芭比動畫片的片尾曲叫什么名字?)
- 02 深圳外貿集團公司 基督(我想對自己的人生未來有個規劃)
- 02 youtube.買粉絲 nz(誰知道you tube 是什么網?)
热门文章
站长推荐
02 youtube website online music(如何讓YTmusic在后臺播放)
02 深圳雙奕貿易有限公司在洛陽(福建省漳州市平和縣長樂鄉樂北村的代碼是多少)
02 淘寶直播帶貨用什么軟件(現在直播帶貨的軟件平臺有哪些?)
02 youtube 買粉絲s music(歐美組合One Direction資料簡介)
02 youtube 買粉絲s movies 買粉絲 to watch together online(九年級英語上第一單元測試卷)
02 深圳世為進出口貿易公司(麥紹賢是誰)
02 淘寶開通海外店鋪要錢嗎(淘寶上開店鋪需要交錢嗎?)
02 youtube 到 mp3 轉換器(視頻可以轉換成音頻(MP3)嗎?)