sparkSql高级

Mehr lesen

sparkSQL

一 概述

1 数据分析的方式

数据分析的方式大致上可以划分为 SQL 和 命令式两种

Mehr lesen

spark原理分析2

一 原理

1 spark部署情况

Spark 部分的底层执行逻辑开始之前, 还是要先认识一下 Spark 的部署情况, 根据部署情况, 从而理解如何调度.

Mehr lesen

spark原理分析

一spark特性

1 rdd的分区和shuffle

分区的作用

Mehr lesen

SparkRDD

一 深入RDDS

先来个小demo

Mehr lesen

Spark入门

#一 Spark 概述

Mehr lesen

shell

Shell

一简介

Shell 是一个用 C 语言编写的程序, 通过 Shell 用户可以访问操作系统内核服务。它类似于 DOS 下的 command 和后来的 cmd.exe。Shell 既是一种命令语言,又是一种程序设计语言。

Mehr lesen

Scala高级

Scala高级

一 高阶函数

scala 混合了面向对象和函数式的特性,在函数式编程语言中,函数是“头等公民”,它和Int、String、Class等其他类型处于同等的地位,可以像其他类型的变量一样被传递和操作。

Mehr lesen

Yarn-资源调度

Yarn资源调度详解

1.yarn的介绍:

yarn是hadoop集群当中的资源管理系统模块,从hadoop2.0开始引入yarn模块,yarn可为各类计算框架提供资源的管理和调度,主要用于管理集群当中的资源(主要是服务器的各种硬件资源,包括CPU,内存,磁盘,网络IO等)以及调度运行在yarn上面的各种任务。

Mehr lesen

Scala进阶2

一 样例类

Mehr lesen