雄风静谧
ABOUT
UidGenerator
00-环境
00-MySQL安装
01-Hadoop安装
02-Hadoop编译源码
03-Zookeeper安装
04-Hive
05-Flume安装
06-HBase安装
99-Ubuntu16.04 安装opencv(C++版本)
99-安装ffmpeg
01-数据结构
数据结构01-大纲
数据结构02-复杂度分析(上)
数据结构03-复杂度分析(下)
数据结构04-数组
数据结构05-链表
数据结构06-栈
数据结构07-队列
数据结构08-递归
数据结构09-排序之冒泡&插入&选择
数据结构10-排序之归并&快排
数据结构11-排序之线性排序(桶排序、计数排序、基数排序)
数据结构12-排序之优化
数据结构13-二分查找
数据结构14-跳表
数据结构15-散列表
数据结构16-哈希算法的应用
数据结构17-二叉树基础
数据结构18-红黑树
数据结构19-递归树
数据结构20-堆和堆排序
数据结构21-图的表示
数据结构22-深度和广度优先搜索
数据结构23-字符串匹配
数据结构24-Trie树
数据结构25-AC自动机
数据结构26-贪心算法
数据结构27-分治算法
数据结构28-回溯算法
数据结构29-动态规划理论
数据结构30-动态规划入门案例
数据结构31-动态规划实战
数据结构32-拓扑排序 - 副本 (2)
数据结构32-拓扑排序 - 副本
数据结构32-拓扑排序
数据结构32-拓扑排序 - 副本 (3)
02-Java
Java00--时间计划
Java00-IDEA配置
Java01-概述
Java02-关键字&标识符
Java03-运算符
Java04-流程控制
Java05-数组
Java06-面向对象01三大特性
Java06-面向对象02抽象类接口
Java07-异常
Java08-多线程
Java09-常用类
Java10-枚举类与注解
Java11-集合
Java12-泛型
Java13-IO流
Java14-网络编程
Java15-反射
Java16-Java8 新特性
03-MySQL
MySQL00-安装
MySQL01-概述
MySQL02-DQL
MySQL03-DML
MySQL04-DDL
MySQL05-TCL
MySQL06-视图&存储过程&流程控制
04-JDBC
JDBC-01 概览&连接数据库方式
JDBC-02 CRUD
JDBC-03 数据库事务&DAO
JDBC-04 数据库连接池&DBUtils
05-Hadoop
Hadoop01-概述、运行模式&源码编译
Hadoop02-HDFS概述、shell&客户端操作
Hadoop03-HDFS读写流程&NN和2NN
Hadoop04-HDFS-DataNode
Hadoop05-HDFS2.X新特性和高可用(HA)
Hadoop06-MapReduce概述&序列化
Hadoop07-MapReduce框架原理
Hadoop08-Hadoop数据压缩
Hadoop09-Yarn资源调度
Hadoop10-生产调优手册
Hadoop11-源码解析
06-Zookeeper
Zookeeper00-安装
Zookeeper01-概述
Zookeeper02-内部原理
Zookeeper03-Shell操作
Zookeeper04-实战
07-Hive
Hive01-概述
Hive02-安装
Hive03-数据类型
Hive04-DDL
Hive05-DML
Hive06-查询
Hive07-函数
Hive08-压缩和存储
Hive09-企业级调优
Hive10-实战
08-Flume
flume00-安装
flume01-概述
flume02-案例
flume03-原理
flume04-面试题
09-Kafka
Kafka00-安装
Kafka01-概述&shell操作
Kafka02-架构原理
Kafka03-API
Kafka04-监控
Kafka05-Flume对接Kafka
Kafka06-面试题
10-HBase
HBase00-安装
HBase01-概述
HBase02-HBase-shell操作
HBase03-HBase进阶
HBase04-HBase-API
HBase05-HBase-MR
HBase06-与Hive集成
HBase07-HBase优化
HBase08-扩展
11-Spark
Spark00-安装
Spark01-概述
Spark02-RDD
Spark03-累加器&广播变量
Spark04-SparkSql
Spark05-SparkStreaming
Spark06-Spark内核
Spark07-Spark优化
Spark07-Spark优化
...
2021-05-22
Spark
Spark06-Spark内核
Spark内核概述Spark内核泛指 Spark的核心运行机制,包括 Spark核心组件的运行机制、 Spark任务调度机制、 Spark内存管理机制、 Spark核心功能的运行原理等,熟练掌握 Spark内核原理,能够帮助我们更好地完成 Spark代码设计,并能够帮助我们准确锁定项目运行过程中出现 ...
2021-05-22
Spark
Spark05-SparkStreaming
SparkStreaming概述Spark Streaming用于流式数据的处理。 Spark Streaming支持的数据输入源很多,例如: Kafka、Flume、 Twitter、 ZeroMQ和简单的 TCP套接字等等。数据输入后可以用 Spark的高度抽象原语如: map、 reduce、 ...
2021-05-22
Spark
Spark02-RDD
三大数据结构Spark计算框架为了能够进行高并发和高吞吐的数据处理,封装了三大数据结构,用于处理不同的应用场景。三大数据结构分别是: RDD : 弹性分布式数据集 累加器:分布式共享只写变量 广播变量:分布式共享只读变量 RDD 介绍RDD(Resilient Distributed Datas ...
2021-05-21
Spark
Spark01-概述
Spark与HadoopSpark是一种基于内存的快速、通用、可扩展的大数据分析计算引擎。Spark出现的时间相对较晚,并且主要功能主要是用于数据计算,所以其实Spark一直被认为是Hadoop 框架的升级版。 Hadoop特点: Hadoop是由java语言编写的,在分布式服务器集群上存储海量数 ...
2021-05-21
Spark
Spark03-累加器&广播变量
累加器累加器用来把Executor端变量信息聚合到Driver端。在Driver程序中定义的变量,在Executor端的每个Task都会得到这个变量的一份新的副本,每个task更新这些副本的值后,传回Driver端进行merge。 系统累加器val rdd = sc.makeRDD(List(1,2 ...
2021-05-21
Spark
Spark04-SparkSql
SparkSql 概述Spark SQL是Spark用于结构化数据(structured data)处理的Spark模块。 Hive and SparkSQLSparkSQL的前身是Shark,给熟悉RDBMS但又不理解MapReduce的技术人员提供快速上手的工具。 Hive是早期唯一运行在Had ...
2021-05-21
Spark
Spark00-安装
Spark作为一个数据处理框架和计算引擎,被设计在所有常见的集群环境中运行, 在国内工作中主流的环境为Yarn,不过逐渐容器式环境也慢慢流行起来。接下来,我们就分别看看不同环境下Spark的运行. Local 模式Local模式,就是不需要其他任何节点资源就可以在本地执行Spark代码的环境,一般用 ...
2021-05-21
Spark