RでH2Oが更新されないときの対策手順

研究等で機械学習をする際に、私はAzure Machine Learning StudioとRを使っています。通常はAzure、データ処理がいろいろある場合にはR(Windows)といった感じで使い分けています。

機械学習にはH2Oがとても便利なのですが、ふと気づくと

H2O cluster version:
H2O cluster version age:

がとても古いまま(2年以上前)となっています。パッケージの更新をしても変わりません。

なんでだろう、としばらく前から思っていましたが、本腰を入れて?解決したので以下はそのメモです。

公式サイトには更新は以下のようにする、と書いてあります。

if (“package:h2o” %in% search()) { detach(“package:h2o”, unload=TRUE) }
if (“h2o” %in% rownames(installed.packages())) { remove.packages(“h2o”) }

pkgs <- c(“RCurl”,”jsonlite”)
for (pkg in pkgs) {
if (! (pkg %in% rownames(installed.packages()))) { install.packages(pkg) }
}

install.packages(“h2o”, type=”source”, repos=(c(“http://h2o-release.s3.amazonaws.com/h2o/latest_stable_R”)))

ここで少し混乱しがちな点はh2oパッケージとそれに伴ってインストールされるh2o本体の2つの更新が必要だ、ということです。

結論から言うとそれだけではなく、デフォルトのR(Windows)のCRANミラーサイトの指定が問題です。以下のような手順で行えば更新可能です。

  1. パッケージ→CRANミラーサイトの設定
  2. 「Japan(Tokyo)」などを選ぶ
  3. 上の公式サイトの手順で更新
  4. パッケージ→ パッケージのインストールから「h2o」をインストール

このCRAN指定の問題はH2O以外のパッケージでも同じ影響があります。なにか私が設定等で思い違いしているような気がするのですが…。

タグ: ,

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

*