Posted inUbuntu/Debian 開発環境
Ubuntu 20.04にApache Hadoopをインストールと設定する方法
Apache Hadoopは、クラスター化されたシステムで実行されているさまざまなビッグデータアプリケーションのデータを管理、保存、処理するために使用されるオープンソースフレームワークです。 Javaで書かれており、Cのネイティブコードとシェルスクリプトが含まれています。分散ファイルシステム(HDFS)を使用し、単一サーバーから数千のマシンにスケールアップします。 Apache Hadoopは、次の4つの主要コンポーネントに基づいています。 Hadoop Common:他のHadoopモジュールが必要とするユーティリティとライブラリのコレクションです。 HDFS: Hadoop Distributed File Systemとも呼ばれ、複数のノードに分散されます。 MapReduce:これは、大量のデータを処理するアプリケーションを作成するために使用されるフレームワークです。 Hadoop YARN:別名Another…