商务服务
1.淘宝购买行为分析项目——需求分析、创建Hive表、DataGrip安装于激活、配置HiveServer2
2024-11-17 03:35

1.淘宝购买行为分析项目——需求分析、创建Hive表、DataGrip安装于激活、配置HiveServer2 数据源来自于阿里巴巴提供的某年淘宝用户购买商品数据集,通过该数据进行大数据数仓的建设和开发分析,从以上几个维 度分别分析并将结果可视化(如上图

1.淘宝购买行为分析项目——需求分析、创建Hive表、DataGrip安装于激活、配置HiveServer2

文件名称说明包含特征user_info_format1.csv包含所有用户的信息id “唯一标识id”, age_range “年龄范围”,gender “性别 0女 1男 2保密”user_log_format1.csv文件存放的是购买行为日志user_id,item_id,cat_id,seller_id, brand_id,time_stamp,action_type

user_log_format1.csv 本数据集为用户的购买日志,即数据集的每一行表示一条用户购买行为,由user_id"买家id",item_id"产品id",cat_id"分类id",seller_id"卖家id",brand_id"品牌id",time_stamp"时间戳"和action_type"行为类型"组成,并以逗号分隔。关于数据集中每一列的详细描述如下1.淘宝购买行为分析项目——需求分析、创建Hive表、DataGrip安装于激活、配置HiveServer2

node1上启动hadoop集群:startha.sh(这个是一个脚本,可以对应hive专栏中查看1.淘宝购买行为分析项目——需求分析、创建Hive表、DataGrip安装于激活、配置HiveServer2 node3上开启hive的客户端和服务端

 

创建hive库

 

创建hive数据表 创建用户信息表

 

创建用户行为日志表

 

传输csv文件到虚拟机中——传输后删除否则占用虚拟机内存 1.淘宝购买行为分析项目——需求分析、创建Hive表、DataGrip安装于激活、配置HiveServer2 导入本地excel到hive表中

 

删除文件

 

此时,我们发现在虚拟机中直接写代码是非常不友好的,没有高亮显示、没有拼写错误提示。这时候我们就需要一个可视化的工具——DataGrip

DataGrip的功能就类似Navicat,对虚拟机上的hive数据库可视化。操控,查询等功能 数仓开发工具可选用DBeaver或者DataGrip。 下载网址:https://www.jetbrains.com/zh-cn/datagrip/download/other.html 将Datagrip安装到D:devsoftJetBrainsDataGrip22.2.1目录下。 将解压后的ja-netfilter拷贝到D:devsoftJetBrains下(以后不要动它) 进入 Datagrip 的安装目录 D:devsoftJetBrainsDataGrip22.2.1bin 目录下,修改 datagrip64.exe.vmoptions 配置文件点击exe文件——选择好路径1.淘宝购买行为分析项目——需求分析、创建Hive表、DataGrip安装于激活、配置HiveServer2 1.淘宝购买行为分析项目——需求分析、创建Hive表、DataGrip安装于激活、配置HiveServer2 1.淘宝购买行为分析项目——需求分析、创建Hive表、DataGrip安装于激活、配置HiveServer2

移动破解文件夹到目标文件夹中 1.淘宝购买行为分析项目——需求分析、创建Hive表、DataGrip安装于激活、配置HiveServer2 打开此文件 1.淘宝购买行为分析项目——需求分析、创建Hive表、DataGrip安装于激活、配置HiveServer2 添加补丁路径 1.淘宝购买行为分析项目——需求分析、创建Hive表、DataGrip安装于激活、配置HiveServer2 打开DataGrip 1.淘宝购买行为分析项目——需求分析、创建Hive表、DataGrip安装于激活、配置HiveServer2

复制激活码 1.淘宝购买行为分析项目——需求分析、创建Hive表、DataGrip安装于激活、配置HiveServer2 DataGrip2022密钥

 
 

DataGrip需要用到JDBC协议连接到Hive,需要配置HiveServer2。 若配置过直接跳到启动步骤开始 具体配置步骤关闭hive

 

关闭hadoop

 

修改hive配置,支持hiveserver2启动

 

修改core-site.xml

 

分发给所有节点

 

启动hadoop集群

 

启动hive

 

启动hiveserver2

 

连接hiveserver2

    以上就是本篇文章【1.淘宝购买行为分析项目——需求分析、创建Hive表、DataGrip安装于激活、配置HiveServer2】的全部内容了,欢迎阅览 ! 文章地址:http://fabua.ksxb.net/news/496.html 
     文章      相关文章      动态      同类文章      热门文章      栏目首页      网站地图      返回首页 海之东岸资讯移动站 http://fabua.ksxb.net/mobile/ , 查看更多   
最新文章
财经资讯AI速递:昨夜今晨财经热点一览 丨2025年8月18日
  金融市场瞬息万变,投资与经济政策深刻影响全球。我们为您带来昨夜今晨的财经新闻,涵盖股市动态、经济数据、企业财务和政策
3个你必须知道的甘草和茶叶一起泡水的(实测+避坑)
你有没有试过把甘草和茶叶一起泡水喝?是不是觉得这样喝起来有点特别?其实啊这事儿挺常见的但真不是随便一泡就OK的。今天我就来
英媒称乌拟以千亿军购换美安全保障
转自:北京日报客户端当地时间18日,英国《金融时报》援引其看到的一份文件报道称,乌克兰将承诺向美国购买价值1000亿美元的武器
和龙10号钢管厂 20cr钢管厂 热镀锌无缝钢管
山东省聊城市君杰钢管有限公司位于山东聊城经济开发区,常年生产销售无缝钢管,合金钢管,镀锌管,方管,焊管,不锈钢管,球墨铸
真靠谱吗?百度文库GenFlow2.0通用Agent一手实测
【TechWeb】8月19日消息,百度文库联合百度网盘通用Agent GenFlow2.0全端正式上线,不仅在文库web端,在手机端上也可以随时随地
固安这场警民“反诈恳谈会”,专治各种诈骗套路
“以前总觉得诈骗离我们很远,今天听了警官讲的真实案例,才知道骗子手段这么多!”李阿姨在恳谈中说道。这仅仅是社区内热烈讨论
红桥回收羊年茅台酒瓶全国收购各种茅台空瓶
红桥回收羊年茅台酒瓶收购各种茅台空瓶一、1971葵花牌贵州茅台酒1971年年产量:375吨当时市场零售价:4.07元/瓶 价格:103500元/
郴州恒泰领秀城附近卖房的房源信息
郴州恒泰领秀城附近卖房的房源信息作为一个在郴州生活了几年的“过来人”,我经常被朋友问起恒泰领秀城附近的房子,说实话刚着手
潍坊人的童年与惬意,就藏在这个园里!
出则繁华,入则静谧。位于潍坊市奎文区胜利东街以南、潍州路以西的东苑公园,是闹市中的一处净土,亦是喧嚣中的一丝清幽。这里是