信息谷 - ICITU

标题: 大数据BI工具Tableau安装与使用 [打印本页]

作者: sxadmin    时间: 2021-10-25 10:27
标题: 大数据BI工具Tableau安装与使用
BI工具Tableau安装与使用
第1章 Tableau简介
1.1 Tableau概述
Tableau是一款数据可视化BI工具,简单易用,没有编程基础就可以用起来,可以使用Tableau的拖放界面可视化任何数据,探索不同的视图。
可以轻松地将多个数据库组合在一起,基本涵盖所有数据库、仓库,还可以与基本的文本文件、表格文件连接。

1.2 Tableau功能
快速分析: 在数分钟内完成数据连接和可视化。Tableau 比现有的其他解决方案快 10 到 100 倍。
简单易用: 任何人都可以使用直观明了的拖放产品分析数据。无需编程即可深入分析。
大数据、任何数据: 无论是电子表格、数据库还是 Hadoop 和云服务,任何数据都可以轻松探索。
体系结构无关:Tableau适用于数据流动的各种设备。因此,用户不必担心使用Tableau的特定硬件或软件要求。
实时协作:Tableau可以即时过滤,排序和讨论数据,并在门户网站(如SharePoint网站或Salesforce)中嵌入实时仪表板。您可以保存数据视图,并允许同事订阅交互式仪表板,以便只需刷新其Web浏览器即可查看最新的数据。
集中数据:Tableau Server提供了一个集中式位置,用于管理组织的所有已发布数据源。您可以在一个方便的位置删除,更改权限,添加标签和管理日程表。很容易安排提取刷新并在数据服务器中管理它们。管理员可以集中定义服务器上提取的计划,用于增量刷新和完全刷新。

第2章 Tableau快速开始
2.1 Tableau安装部署
2.1.1 Windos安装TableauDesktop
官网地址:https://www.tableau.com/zh-cn/trial/tableau-software
可以先试用,也可以购买使用。

2.1.2 自定义安装目录





2.2 演示自带数据源-超市
2.2.1 选择超市数据源


2.2.2 选择一个订单表,准备与销售表进行关联


2.2.3拖拽销售人员表,与订单表进行关联


2.2.4 查看关联后得数据


2.2.5 拖拽指定行和列,图示结果


2.3 对接RapidsDB数据源
RapidsDB-是一款全内存的分布式大数据分析处理数据库,特点就是基于内存的处理速度快、稳定。不过下面的操作也可以使用Mysql代替。

2.3.1 在客户端找到其他数据库JDBC


2.3.2 填写数据库JDBC信息
把RapidsDB3.5的JDBC驱动程序rapids-jdbc-2.5.jar包拷贝到C:\Program Files\Tableau\Drivers目录下。

填写数据库的连接配置:
URL: jdbc:rdp://192.168.20.1:4333/connector=xxxxx
Username: RAPIDS
Password: rapids



2.3.3 选择数据库


2.3.4 选择表


这样就成功连接到RapidsDB的表数据了,接下来可以根据超市案例进行扩展分析了

2.4 添加MapR Hadoop Hive的数据源
2.4.1 Windos安装MapR Hadoop Hive的ODBC


2.4.2 同意服务条款




2.4.3 自动义安装目录
2.4.4 选择数据源MapR Hadoop Hive
1)连接数据源,前提需要开启Hadoop集群,并启动hiveserver2服务

// An highlighted block
[root@hadoop102 ~]$ /opt/module/hadoop-2.7.2/sbin/start-dfs.sh
[root@hadoop103 ~]$ /opt/module/hadoop-2.7.2/sbin/start-yarn.sh
[root@hadoop102 ~]$ /opt/module/hive/bin/hiveserver2

1
2
3
4
5


2)连接成功如下:


2.4.5 选择数据库和表


2.4.6 选择维度和度量并分析结果如下图:







欢迎光临 信息谷 - ICITU (https://icitu.com/) Powered by Discuz! X3.4