Apache Kafka是如何运作的?为什么Kafka这么快?
Databricks 第三季度路线图:第2到第4周
PySpark:面试题(编码题)— 第一部分
Kafka 已死,Kafka 万岁
大数据03-整合 Flume 和 Kafka 收集日志
Filebeat、Logstash、Kafka 三步曲
Spark Streaming
Spark SQL / Catalyst 内部原理 与 RBO
Spark-Streaming KafkaClient 异常解决
大数据02-Kafka最新版的基本开发
大数据01-Flume 日志收集
一篇文章搞懂DataSet、DataFrame、RDD-《每日五分钟搞
Spark Struct Streaming执行过程
RDD的转化与行为
RDD基础
端到端exactly-once(翻译官方)
Kyuubi High Availability Guide
Spark SQL 性能优化再进一步 CBO 基于代价的优化
flume 入门系列