雄风静谧
  • ABOUT
  • UidGenerator
  • 00-环境
    • 00-MySQL安装
    • 01-Hadoop安装
    • 02-Hadoop编译源码
    • 03-Zookeeper安装
    • 04-Hive
    • 05-Flume安装
    • 06-HBase安装
    • 99-Ubuntu16.04 安装opencv(C++版本)
    • 99-安装ffmpeg
  • 01-数据结构
    • 数据结构01-大纲
    • 数据结构02-复杂度分析(上)
    • 数据结构03-复杂度分析(下)
    • 数据结构04-数组
    • 数据结构05-链表
    • 数据结构06-栈
    • 数据结构07-队列
    • 数据结构08-递归
    • 数据结构09-排序之冒泡&插入&选择
    • 数据结构10-排序之归并&快排
    • 数据结构11-排序之线性排序(桶排序、计数排序、基数排序)
    • 数据结构12-排序之优化
    • 数据结构13-二分查找
    • 数据结构14-跳表
    • 数据结构15-散列表
    • 数据结构16-哈希算法的应用
    • 数据结构17-二叉树基础
    • 数据结构18-红黑树
    • 数据结构19-递归树
    • 数据结构20-堆和堆排序
    • 数据结构21-图的表示
    • 数据结构22-深度和广度优先搜索
    • 数据结构23-字符串匹配
    • 数据结构24-Trie树
    • 数据结构25-AC自动机
    • 数据结构26-贪心算法
    • 数据结构27-分治算法
    • 数据结构28-回溯算法
    • 数据结构29-动态规划理论
    • 数据结构30-动态规划入门案例
    • 数据结构31-动态规划实战
    • 数据结构32-拓扑排序 - 副本 (2)
    • 数据结构32-拓扑排序 - 副本
    • 数据结构32-拓扑排序
    • 数据结构32-拓扑排序 - 副本 (3)
  • 02-Java
    • Java00--时间计划
    • Java00-IDEA配置
    • Java01-概述
    • Java02-关键字&标识符
    • Java03-运算符
    • Java04-流程控制
    • Java05-数组
    • Java06-面向对象01三大特性
    • Java06-面向对象02抽象类接口
    • Java07-异常
    • Java08-多线程
    • Java09-常用类
    • Java10-枚举类与注解
    • Java11-集合
    • Java12-泛型
    • Java13-IO流
    • Java14-网络编程
    • Java15-反射
    • Java16-Java8 新特性
  • 03-MySQL
    • MySQL00-安装
    • MySQL01-概述
    • MySQL02-DQL
    • MySQL03-DML
    • MySQL04-DDL
    • MySQL05-TCL
    • MySQL06-视图&存储过程&流程控制
  • 04-JDBC
    • JDBC-01 概览&连接数据库方式
    • JDBC-02 CRUD
    • JDBC-03 数据库事务&DAO
    • JDBC-04 数据库连接池&DBUtils
  • 05-Hadoop
    • Hadoop01-概述、运行模式&源码编译
    • Hadoop02-HDFS概述、shell&客户端操作
    • Hadoop03-HDFS读写流程&NN和2NN
    • Hadoop04-HDFS-DataNode
    • Hadoop05-HDFS2.X新特性和高可用(HA)
    • Hadoop06-MapReduce概述&序列化
    • Hadoop07-MapReduce框架原理
    • Hadoop08-Hadoop数据压缩
    • Hadoop09-Yarn资源调度
    • Hadoop10-生产调优手册
    • Hadoop11-源码解析
  • 06-Zookeeper
    • Zookeeper00-安装
    • Zookeeper01-概述
    • Zookeeper02-内部原理
    • Zookeeper03-Shell操作
    • Zookeeper04-实战
  • 07-Hive
    • Hive01-概述
    • Hive02-安装
    • Hive03-数据类型
    • Hive04-DDL
    • Hive05-DML
    • Hive06-查询
    • Hive07-函数
    • Hive08-压缩和存储
    • Hive09-企业级调优
    • Hive10-实战
  • 08-Flume
    • flume00-安装
    • flume01-概述
    • flume02-案例
    • flume03-原理
    • flume04-面试题
  • 09-Kafka
    • Kafka00-安装
    • Kafka01-概述&shell操作
    • Kafka02-架构原理
    • Kafka03-API
    • Kafka04-监控
    • Kafka05-Flume对接Kafka
    • Kafka06-面试题
  • 10-HBase
    • HBase00-安装
    • HBase01-概述
    • HBase02-HBase-shell操作
    • HBase03-HBase进阶
    • HBase04-HBase-API
    • HBase05-HBase-MR
    • HBase06-与Hive集成
    • HBase07-HBase优化
    • HBase08-扩展
  • 11-Spark
    • Spark00-安装
    • Spark01-概述
    • Spark02-RDD
    • Spark03-累加器&广播变量
    • Spark04-SparkSql
    • Spark05-SparkStreaming
    • Spark06-Spark内核
    • Spark07-Spark优化

HBase00-安装

启动Zookeeper 启动Hadoop:hdfs和yarn HBase的解压 tar -zxvf HBase-1.3.1-bin.tar.gz -C /opt/module 修改HBase的配置文件 HBase-env.sh export JAVA_HOME=/opt/module/ ...
2020-08-12 HBase

HBase01-概述

NoSQL简介关系型数据库的查询瓶颈: 当用户表的数据达到几千万甚至几亿级别的时候,对单条数据的检索将花费数秒甚至达到分钟级别。实际情况更复杂,查询的操作速度将会受到以下两个因素的影响: ①高并发的更新(插入、修改、删除)操作。大中型网站的并发操作一般能达到几十乃至几百并发,此时单条数据查询的延时 ...
2020-08-12 HBase

HBase02-HBase-shell操作

使用hbase shell可以进入一个shell命令行界面:bin/HBase shell 集群的操作'查看集群状态' 使用status可以查看集群状态,默认为summary,可以选择‘simple’和‘detailed’来查看详情 hbase(main):011:0> sta ...
2020-08-12 HBase

HBase03-HBase进阶

RegionServer 架构 StoreFile 保存实际数据的物理文件,StoreFile以Hfile的形式存储在HDFS上。每个Store会有一个或多个StoreFile(HFile),数据在每个StoreFile中都是有序的。 MemStore 写缓存,由于HFile中的数据要求是 ...
2020-08-12 HBase

HBase06-与Hive集成

HBase与Hive的对比1.Hive 数据仓库:Hive的本质其实就相当于将HDFS中已经存储的文件在Mysql中做了一个双射关系,以方便使用HQL去管理查询。 用于数据分析、清洗:Hive适用于离线的数据分析和清洗,延迟较高。 基于HDFS、MapReduce:Hive存储的数据依旧在Data ...
2020-08-12 HBase

HBase04-HBase-API

pom.xml中添加依赖<dependency> <groupId>org.apache.hbase</groupId> <artifactId>hbase-server</artifactId> <versi ...
2020-08-12 HBase

HBase07-HBase优化

高可用在HBase中Hmaster负责监控RegionServer的生命周期,均衡RegionServer的负载,如果Hmaster挂掉了,那么整个HBase集群将陷入不健康的状态,并且此时的工作状态并不会维持太久。所以HBase支持对Hmaster的高可用配置。 关闭HBase集群: bin/s ...
2020-08-12 HBase

HBase05-HBase-MR

MapReduce统计的需要:我们知道HBase的数据都是分布式存储在RegionServer上的,所以对于类似传统关系型数据库的group by操作,扫描器是无能为力的,只有当所有结果都返回到客户端的时候,才能进行统计。这样做一是慢,二是会产生很大的网络开销,所以使用MapReduce在服务器端就 ...
2020-08-12 HBase

HBase08-扩展

布隆过滤器在日常生活中,包括在设计计算机软件时,我们经常要判断一个元素是否在一个集合中。比如在字处理软件中,需要检查一个英语单词是否拼写正确(也就是要判断它是否在已知的字典中);在 FBI,一个嫌疑人的名字是否已经在嫌疑名单上;在网络爬虫里,一个网址是否被访问过等等。最直接的方法就是将集合中全部的元 ...
2020-08-12 HBase

©2019- NiuMT | pv | uv
Theme Tree by WuJun Powered by Hexo