はじめに
こんにちは、鍛治です。
今回は、標準的なスペックのPCでも動かすことができる「機械学習プラットフォーム」についてご紹介させていただきます。ちょっとしたデータなら十分動きますし、操作もすべてWeb画面でできるためプログミングも不要です。
機械学習プラットフォームとは
「機械学習」と聞くとPythonやRなどでプログラミングすると思いがちですが、最近は “DataRobot” や “H2O.ai” といった海外のスタートアップが、データサイエンティストがいない企業でも機械学習が行えるプラットフォームを提供しています。
今回は H20.ai社の “H2O” を紹介しますが、これはOSSで提供されています。また、有償版に “Driverless AI” というプラットフォームも提供されており、これはH20.ai社が用意した数百のアルゴリズムを全自動で回し、最適なアルゴリズムや影響を与える項目(群)を教えてくれるので便利です。
では早速、H2Oをインストールしてみましょう。
H2Oのインストール
まずは下記URLにアクセスして下さい。
https://h2o-release.s3.amazonaws.com/h2o/master/4275/index.html
記載されているようにインストールは「3ステップ」です。
また、今回実際に試したPCの環境は下記になります。
OS:Windows 10 Professional (1803)
Java:Java SE Runtime Environment 1.8.0_191 (JRE)
ブラウザ:Internet Expoler 11
ターミナル:Windows PowerShell
では早速、環境を構築してみましょう!
ステップ1:ダウンロード
ページにある「ダウンロードボタン」をクリックし、ダウンロードしましょう。
保存先は「ダウンロード」フォルダで。
ステップ2:zipファイルの解凍と起動
ダウンロードしたzipファイルを解凍し、Javaで起動します。
ターミナルはWindows PowerShellを使います。(コマンドプロンプトをお使いの方は読み替えてください)
cd ~/Downloads Expand-Archive -Path .\h2o-3.19.0.4275.zip -DestinationPath . cd h2o-3.19.0.4275 java -jar h2o.jar
ステップ3:ブラウザ表示
下記URLにアクセスすると画面が表示されます。(表示されない方は手順に問題があったと思われるので、もう一度ステップ1から実行してください)
上記画面が表示されればインストールと起動は成功です。
サンプルのご紹介
H2Oにはサンプルがありますので、実際に操作してみたい方は下記手順を試してみてください。
まずは画面右下にある「Browser install packs…」をクリック。
次に「examples」をクリック。
いくつかサンプルがありますので、試してください。
最後に
ちょっとしたデータなら標準スペックのPCでもデータ分析できる環境ができることがわかったと思います。
有償版であれば似たような製品は日本でも提供されていますが、なかなかOSS製品に出くわすことはありません。H2Oに関してはOSSなので、お手軽に活用できるのではないかと思います。