商务服务
1.淘宝购买行为分析项目——需求分析、创建Hive表、DataGrip安装于激活、配置HiveServer2
2024-11-17 03:35

1.淘宝购买行为分析项目——需求分析、创建Hive表、DataGrip安装于激活、配置HiveServer2 数据源来自于阿里巴巴提供的某年淘宝用户购买商品数据集,通过该数据进行大数据数仓的建设和开发分析,从以上几个维 度分别分析并将结果可视化(如上图

1.淘宝购买行为分析项目——需求分析、创建Hive表、DataGrip安装于激活、配置HiveServer2

文件名称说明包含特征user_info_format1.csv包含所有用户的信息id “唯一标识id”, age_range “年龄范围”,gender “性别 0女 1男 2保密”user_log_format1.csv文件存放的是购买行为日志user_id,item_id,cat_id,seller_id, brand_id,time_stamp,action_type

user_log_format1.csv 本数据集为用户的购买日志,即数据集的每一行表示一条用户购买行为,由user_id"买家id",item_id"产品id",cat_id"分类id",seller_id"卖家id",brand_id"品牌id",time_stamp"时间戳"和action_type"行为类型"组成,并以逗号分隔。关于数据集中每一列的详细描述如下1.淘宝购买行为分析项目——需求分析、创建Hive表、DataGrip安装于激活、配置HiveServer2

node1上启动hadoop集群:startha.sh(这个是一个脚本,可以对应hive专栏中查看1.淘宝购买行为分析项目——需求分析、创建Hive表、DataGrip安装于激活、配置HiveServer2 node3上开启hive的客户端和服务端

 

创建hive库

 

创建hive数据表 创建用户信息表

 

创建用户行为日志表

 

传输csv文件到虚拟机中——传输后删除否则占用虚拟机内存 1.淘宝购买行为分析项目——需求分析、创建Hive表、DataGrip安装于激活、配置HiveServer2 导入本地excel到hive表中

 

删除文件

 

此时,我们发现在虚拟机中直接写代码是非常不友好的,没有高亮显示、没有拼写错误提示。这时候我们就需要一个可视化的工具——DataGrip

DataGrip的功能就类似Navicat,对虚拟机上的hive数据库可视化。操控,查询等功能 数仓开发工具可选用DBeaver或者DataGrip。 下载网址:https://www.jetbrains.com/zh-cn/datagrip/download/other.html 将Datagrip安装到D:devsoftJetBrainsDataGrip22.2.1目录下。 将解压后的ja-netfilter拷贝到D:devsoftJetBrains下(以后不要动它) 进入 Datagrip 的安装目录 D:devsoftJetBrainsDataGrip22.2.1bin 目录下,修改 datagrip64.exe.vmoptions 配置文件点击exe文件——选择好路径1.淘宝购买行为分析项目——需求分析、创建Hive表、DataGrip安装于激活、配置HiveServer2 1.淘宝购买行为分析项目——需求分析、创建Hive表、DataGrip安装于激活、配置HiveServer2 1.淘宝购买行为分析项目——需求分析、创建Hive表、DataGrip安装于激活、配置HiveServer2

移动破解文件夹到目标文件夹中 1.淘宝购买行为分析项目——需求分析、创建Hive表、DataGrip安装于激活、配置HiveServer2 打开此文件 1.淘宝购买行为分析项目——需求分析、创建Hive表、DataGrip安装于激活、配置HiveServer2 添加补丁路径 1.淘宝购买行为分析项目——需求分析、创建Hive表、DataGrip安装于激活、配置HiveServer2 打开DataGrip 1.淘宝购买行为分析项目——需求分析、创建Hive表、DataGrip安装于激活、配置HiveServer2

复制激活码 1.淘宝购买行为分析项目——需求分析、创建Hive表、DataGrip安装于激活、配置HiveServer2 DataGrip2022密钥

 
 

DataGrip需要用到JDBC协议连接到Hive,需要配置HiveServer2。 若配置过直接跳到启动步骤开始 具体配置步骤关闭hive

 

关闭hadoop

 

修改hive配置,支持hiveserver2启动

 

修改core-site.xml

 

分发给所有节点

 

启动hadoop集群

 

启动hive

 

启动hiveserver2

 

连接hiveserver2

    以上就是本篇文章【1.淘宝购买行为分析项目——需求分析、创建Hive表、DataGrip安装于激活、配置HiveServer2】的全部内容了,欢迎阅览 ! 文章地址:http://fabua.ksxb.net/news/496.html 
     文章      相关文章      动态      同类文章      热门文章      栏目首页      网站地图      返回首页 海之东岸资讯移动站 http://fabua.ksxb.net/mobile/ , 查看更多   
最新文章
手机nfc自助写卡 nfc手机写卡ic卡手机ic「手机nfc自助写卡 nfc手机写卡ic卡」
PN532模块复制IC加密卡忍受够了每天都需要带着各种各样的卡片,如果可以将卡复制进手机里,那我就可以只带着手机,每天出门都是
手机卡损坏如何补办?一步步详解补办流程手机卡坏了怎么补卡「手机卡损坏如何补办?一步步详解补办流程」
手机卡坏了怎么补办?一步步告诉你在日常的生活中,我们几乎离不开手机,而手机又离不开手机卡。但有时候,由于各种原因,我们的
辛追夫人邀你赴宴 音乐话剧《西汉有戏·辛追的家宴》5月上演
《西汉有戏·辛追的家宴》海报。红网时刻新闻4月18日讯(记者 陈雅如 通讯员 陈祉含)当现代科技遇见千年文明,马王堆汉墓的传奇
更多万能遥控历史版本(10个)手机电视万能遥控「更多万能遥控历史版本(10个)」
优化:首页、添加页和我的页设计焕新,提高使用体验修复:修复一些问题如发现版本老旧,欢迎邮件反馈toususpam#liqucn(dot)com,
涨疯了!金价再创新高,足金饰品破1000元/克
金价又涨疯了!今天,金价相关话题再次冲上热搜随着国际金价持续上涨,以人民币计价的黄金价格连创新高。16日,多家品牌金店足金
手机屏幕有线条怎么修手机内屏坏了怎么修复「手机屏幕有线条怎么修」
手机屏幕有线条怎么修,手机屏幕上出现一个不太明显的彩色条纹是怎么回事?1、系统坏了2、排线坏了3、内屏坏了4、手机屏幕有条纹
春风沙龙预告丨刘子超×金仁顺×翟业军:从巴尔干出发,聆听远方的回声
潮新闻客户端 记者 宋浩/文 胡祥宇/制图谈到近年来热门的旅行写作,刘子超是最具代表性的作家。第13届春风悦读榜评委李敬泽在终
手机阿里邮箱如何绑定qq邮箱服务器手机qq邮箱登录入口「手机阿里邮箱如何绑定qq邮箱服务器」
要将手机阿里邮箱与QQ邮箱服务器绑定,需按以下步骤操作:步骤1:打开手机阿里邮箱应用,在主界面点击右上角的设置按钮(一般是
华为手机nfc功能有什么用华为手机nfc是什么意思「华为手机nfc功能有什么用」
教育局周末不上班,所以高考报名不要选择在周末,在周一至周五去教育局报名即可。学校是高考报名单位,教育局是官方确认单位。应