1.淘宝购买行为分析项目——需求分析、创建Hive表、DataGrip安装于激活、配置HiveServer2

日期：2024-11-17 作者：caijiyuan caijiyuan 评论：0 移动：http://fabua.ksxb.net/mobile/news/496.html

核心提示：数据源来自于阿里巴巴提供的某年淘宝用户购买商品数据集，通过该数据进行大数据数仓的建设和开发分析，从以上几个维

1.淘宝购买行为分析项目——需求分析、创建Hive表、DataGrip安装于激活、配置HiveServer2 数据源来自于阿里巴巴提供的某年淘宝用户购买商品数据集，通过该数据进行大数据数仓的建设和开发分析，从以上几个维度分别分析并将结果可视化（如上图）

1.淘宝购买行为分析项目——需求分析、创建Hive表、DataGrip安装于激活、配置HiveServer2

文件名称说明包含特征user_info_format1.csv包含所有用户的信息id “唯一标识id”, age_range “年龄范围”,gender “性别 0女 1男 2保密”user_log_format1.csv文件存放的是购买行为日志user_id,item_id,cat_id,seller_id, brand_id,time_stamp,action_type

user_log_format1.csv 本数据集为用户的购买日志，即数据集的每一行表示一条用户购买行为，由user_id"买家id",item_id"产品id",cat_id"分类id",seller_id"卖家id",brand_id"品牌id",time_stamp"时间戳"和action_type"行为类型"组成，并以逗号分隔。关于数据集中每一列的详细描述如下： 1.淘宝购买行为分析项目——需求分析、创建Hive表、DataGrip安装于激活、配置HiveServer2

node1上启动hadoop集群：startha.sh（这个是一个脚本，可以对应hive专栏中查看） 1.淘宝购买行为分析项目——需求分析、创建Hive表、DataGrip安装于激活、配置HiveServer2 node3上开启hive的客户端和服务端

创建hive库

创建hive数据表 创建用户信息表

创建用户行为日志表

传输csv文件到虚拟机中——传输后删除否则占用虚拟机内存 1.淘宝购买行为分析项目——需求分析、创建Hive表、DataGrip安装于激活、配置HiveServer2 导入本地excel到hive表中

删除文件

此时，我们发现在虚拟机中直接写代码是非常不友好的，没有高亮显示、没有拼写错误提示。这时候我们就需要一个可视化的工具——DataGrip

DataGrip的功能就类似Navicat，对虚拟机上的hive数据库可视化。操控，查询等功能 数仓开发工具可选用DBeaver或者DataGrip。下载网址：https://www.jetbrains.com/zh-cn/datagrip/download/other.html 将Datagrip安装到D:devsoftJetBrainsDataGrip22.2.1目录下。将解压后的ja-netfilter拷贝到D:devsoftJetBrains下（以后不要动它）进入 Datagrip 的安装目录 D:devsoftJetBrainsDataGrip22.2.1bin 目录下，修改 datagrip64.exe.vmoptions 配置文件： 点击exe文件——选择好路径 1.淘宝购买行为分析项目——需求分析、创建Hive表、DataGrip安装于激活、配置HiveServer2

移动破解文件夹到目标文件夹中 1.淘宝购买行为分析项目——需求分析、创建Hive表、DataGrip安装于激活、配置HiveServer2 打开此文件添加补丁路径打开DataGrip

复制激活码 1.淘宝购买行为分析项目——需求分析、创建Hive表、DataGrip安装于激活、配置HiveServer2 DataGrip2022密钥：

DataGrip需要用到JDBC协议连接到Hive，需要配置HiveServer2。 若配置过直接跳到启动步骤开始 具体配置步骤： 关闭hive

关闭hadoop

修改hive配置，支持hiveserver2启动

修改core-site.xml

分发给所有节点

启动hadoop集群

启动hive

启动hiveserver2

连接hiveserver2

本文地址：http://fabua.ksxb.net/news/496.html 海之东岸资讯 http://fabua.ksxb.net/ , 查看更多

特别提示：本信息由相关用户自行提供，真实性未证实，仅供参考。请谨慎采用，风险自负。

更多>同类最新资讯

0 条相关评论

文章列表

相关文章

最新动态

推荐图文

最新资讯

点击排行

• 瑞莱智慧朱萌：做AI安全先锋，瑞莱智慧的智慧与	• 郴州地王大厦范围二手房, 解析｜ 2025购房必看
• 日照本地人必吃美食，旅游必打卡篇	• 90亿美元鲸落无声：22万倍收益离场背后的比特币
• 易普力股票三个交易日涨幅偏离值超20%	• 泉州下达补助资金！南安19.05万元
• 屏幕后的秘密！电影频道7.29将播出《玩命直播》	• 庆阳到厦门曾厝埯旅游小吃, 2025必看_小吃攻略
• “京彩绽放益路奔腾”——2025北京体彩“益动	• 西安市民办义务教育学校电脑随机录取结束，剩余

日照本地人必吃美食，	固安这场警民“反诈恳
2025必看！欠招商15万	中医养生健康相伴之
徐克与《蝶变》，武侠	普洱茶中端有哪些牌子
兼顾纤薄、耐用与可持	京东养车因不正当竞争
邯郸曲周县回收茅台酒	蚊子有偏爱的血型？近
伊维德｜高罗佩与《	又一款中国互联网产品
区应急管理局：深入开