Skip to content

Latest commit

 

History

History
1502 lines (1428 loc) · 175 KB

apache.md

File metadata and controls

1502 lines (1428 loc) · 175 KB

Apache

Airflow

Ambari

Apex

Arrow

Atlas

Beam

BookKeeper

Brooklyn

Camel

Commons

Cordova

Crunch

Doris

Drill

Druid

Eagle

Falcon

Flink

Flume

Geode

Goblin

HAWQ - advanced enterprise SQL-on-Hadoop query engine and analytic database

Hivemall

Hop

Hudi

Iceberg

Ignite

Impala

Jena

Kafka

Kafka Library

Kafka Client library

Kafka Installation & Management

Kafka Monitoring

Kafka Platform

  • Aiven - Data infrastructure made simple
    • 아파치 카프카를 포함한 많은 데이터 플랫폼을 위한 매니지드 솔루션 제공
    • 스키마 레지스트리와 REST 프록시 역할을 수행하는 카라스페이스(Karapace) 개발
      • 두 컨플루언트 솔루션의 API와 호환되지만 아파치 2.0 라이선스를 따르기 때문에 제한되는 활용 사례 같은 것은 없음
    • 3개 주요 클라우드 제공자 외에도 디지털오션(DigitalOcean)과 업클라우드(UpCloud) 지원
  • Amazon MSK 완전관리형 Apache Kafka – Amazon MSK – Amazon Web Services
    • REST 프록시는 직접적으로 지원되지 않지만, 스키마 지원은 AWS Glue와의 통합을 통해 제공
    • 크루즈 컨트롤, 버로우, 컨플루언트 REST 프록시와 같은 커뮤니티 툴 사용을 권장
      • 하지만, 직접 지원은 없으므로 다른 것들에 비해 통합성은 약간 떨어지지만 여전히 코어 카프카 클러스터는 지원
  • Azure HDInsight - Hadoop, Spark, and Kafka | Microsoft Azure
    • HDInsight 안에 하둡, 스파크, 다른 빅데이터 컴포넌트들과 함께 매니지드 카프카 플랫폼 제공
    • MSK와 비슷하게, HDInsight는 코어 카프카 클러스터에 초점
      • 스키마 레지스트리와 REST 프록시를 포함한 다른 컴포넌트들은 사용자의 선택
    • 몇몇 서드 파티들이 이러한 시스템들을 설치할 수 있도록 해 주는 템플릿을 제공하지만 마이크로소프트 지원은 없음
  • Cloudera Apache Kafka supported by Cloudera Enterprise
    • 클라우데라는 아파치 카프카 초기부터 카프카 커뮤니티의 일원
    • 클라우데라 데이터 플랫폼(Cloudera Data Platform, CDP) 제품의 스트림 데이터 컴포넌트로서 매니지드 카프카 제공
    • CDP는 단순한 카프카 이상의 것에 초점을 맞추지만, 프라이빗 옵션은 물론이고 퍼블릭 클라우드 환경에서도 동작
  • CloudKarafka - Apache Kafka Message streaming as a Service
    • 데이터독(DataDog)이나 스플렁크(Splunk)와 같이 널리 쓰이는 인프라스트럭처 서비스와의 통합과 함께, 매니지드 카프카 솔루션을 제공하는 데 초점
    • 컨플루언트의 스키마 레지스트리와 REST 프록시 역시 사용할 수 있도록 지원
      • 컨플루언트 측의 라이선스 변경으로 인해 5.0 버전까지만 지원
    • AWS와 구글 클라우드 플랫폼에서 사용 가능
  • Confluent Cloud: Fully Managed Kafka as a Cloud-Native Service
    • 여러 필수 툴들(스키마 관리, 클라이언트, REST 인터페이스, 모니터링)과 함께 제공
    • 3개 주요 클라우드 플랫폼(AWS, Microsoft Azure, Google Cloud Platform) 모두에서 사용 가능
    • 컨플루언트에서 일하고 있는 상당수의 아파치 카프카 코어 개발자들에 의한 지원 제공
    • 스키마 레지스트리와 REST 프록시와 같이 플랫폼에 포함되어 있는 많은 컴포넌트들은 몇몇 활용 사례를 제한하는 컨플루언트 커뮤니티 라이선스 하에 단독으로 사용 가능

Kafka Stream

Karaf

Kudu

Kylin

Kyuubi

Mesos

Metron

  • Metron 보안에 포커스를 둔 분석 시스템

Nifi

Nutch

Oozie

Ozone

Parquet

Phoenix

Pig

Pinot

PredictionIO

Pulsar

Ranger

River

Samza

SeaTunnel

ShardingSphere

SINGA

  • SINGA a general distributed deep learning platform for training big deep learning models over large datasets

Slider

Solr

Spot

  • Spot 네트워크 데이터를 분석하여 infosec 위협을 탐지하는데 사용
  • Apache Spot (incubating) and Cloudera on AWS in 60 Minutes
    • Apache Kafka(처리용), Apache Spark(처리 및 ML 분석용), Apache Hadoop(처리 및 저장용) 등을 기반으로 한 Apache Spot의 아키텍처 소개
    • Spot은 파일 시스템의 변경 사항을 감지하고 이벤트를 발생시키는 Python Watchdog 라이브러리를 사용

Sqoop

Storm

Superset

SystemML

Tajo

Thrift

Tika

Toree

Traffic Server

UIMA

WEEX

  • WEEX A framework for building Mobile cross-platform UIs

Zookeeper