Apache Drill を Google Compute Engine 上で構築してみる

LINEで送る
Pocket

この記事は Apache Drill Advent Calendar 9日目の記事です。

今回は Google Compute Engine (以下GCE)に Apache Drill + MapR をインストールしてみます。事前にGCE の管理ツール “gcutil client” のインストールをしておいてください。

まずはMapR が提供している GCE デプロイ用スクリプトをダウンロードします。
https://github.com/mapr/gce
必要なファイルは下記の3つです。

  • launch-mapr-cluster.sh
  • prepare-mapr-image.sh
  • configure-mapr-instance.sh

さらに、ノード毎の役割を決める設定ファイル”myrolesfile.txt”を作成します。
このファイルにサービスを記載しておけばこの後の作業で自動的にMapR のサービスがインストールされます。

# cat myrolesfile.txt
node0:zookeeper,cldb,fileserver,nodemanager,nfs,webserver,drill
node1:fileserver,nodemanager,drill
node2:fileserver,nodemanager,resourcemanager,drill

どのノードにどんなサービスを配置すれば良いかは下記のドキュメントが参考になるので合わせて確認してください。
http://doc.mapr.com/display/MapR/Planning+the+Cluster

ファイルの作成終わったら早速インストール作業に入りましょう。
[CLUSTER NAME] の部分はご自身のクラスタ名を指定してください。
インストール作業は MapR のパッケージインストールを含め10−15分程度で完了します。

./launch-mapr-cluster.sh --cluster [CLUSTER NAME] --mapr-version 5.0.0 --config-file myrolesfile.txt --node-name mapr --image centos-6 --machine-type n1-highmem-2 --persistent-disks 4x200 --zone asia-east1-a

より詳細なオプションは下記に記載があるので参考にしてください。
https://www.mapr.com/resources/launching-mapr-cluster-google-compute-engine

確認のため MCS にログインしてみましょう。
デフォルトの設定では MCS 用のポート 8443 が塞がれているのでGCEのネットワーキング設定で 8443 のポートを開けてください。
そしてブラウザで下記のURLにアクセスします。

https://<IP ADDRESS>:8443

認証画面が立ち上げるので、mapr ユーザでログインしましょう。
mapr ユーザのデフォルトパスワードは “MapR” です。

これで MapR と Apache Drill のインストールは完了です。
とても簡単ですね。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です