OSS X Users Meeting #29「AI/Deep Learning」

2020年11月11日「OSS X Users Meeting #29」が開催され、260名以上の参加者にお集まりいただきました。
当イベントは2012年にSCSK R&Dセンターが中心となり「OSSユーザーのための勉強会」として発足し、2019年から「OSSユーザーのための勉強会運営コミュニティ」として国立情報学研究所吉岡様・法政大学坂本様・スタイルズ矢野様のご協力を得て運営しております。

第29回目となった今回のセミナーは「OSS×AI／Deep Learning」に見識の深いキーマンにご登壇頂き、技術トレンドや注目技術について講演を行っていただきました。
昨今のコロナ禍の状況も踏まえ、初のオンライン開催として、全国各地の皆さまからのご参加いただく事ができました。以下に、イベントの概要をお知らせします。

開会にあたり

開会にあたり、SCSK　R&Dセンターセンター長杉坂浩一より、ご挨拶をさせて頂きました。

「イベント名の「OSS X Users Meeting」の“X”にはcrossingやmultipleといった意味を含ませております。オープンソースの理念でもある「技術を共有し、文化に触れ、知見を高めていただく機会」として、本イベントを約10年にわたり運営を行って参りました。SCSKとしても、お客様の課題解決においてOSSを活用しその恩恵を受けており、“得たものに対する恩返しをしてゆく”事も意識し、本イベントがその一つになればと考えております。」（杉坂）

BERTによる自動テキスト要約

株式会社クラスキャット
代表取締役社長
佐々木規行氏

オープニングセッションでは「BERTによる自動テキスト要約」をテーマに、株式会社クラスキャット代表取締役社長佐々木規行氏にご講演頂きました。

佐々木氏からは、自然言語処理（NLP）の近年での活用分野としての「対話、質問応答、機械翻訳、文章要約、文章分類」、伝統的なアプローチとしての「単語分割、品詞タグ付け、語義曖昧抽出、構文解析、述語項構造認識」、またDNNを用いたNLPの歴史について、解説して頂きました。

「BERTを始めとする現在のモデルではTransformerがベースとして用いられており、このTransformerは現在のNLP技術を支える基礎的なニューラルネットアーキテクチャとなっています。BERTは2018年11月にオープンソースとしてGoogle社より公開され、Transformerのエンコーダをニューラルネットアーキテクチャとして採用した多くの優れた特徴を持ちます。その一つとして、BERTでは事前訓練モデルが提供されており、様々なタスクで再調整することで、容易にモデルやアーキテクチャを作成することが可能です。また、BERTの関連モデルとしてALBERTやDistilBERTなどが存在しますが、いずれにしてもBERTは大量のパラメータを持つため、高性能を維持したままパラメータ数を減らすことが改良の主眼になっています。」（佐々木氏）

講演の中で、佐々木氏はTransformerやBERTを手軽に利用できるOSSとして、Hugging TransformersやAllenNLP、Flairなどを紹介されました。Hugging Transformersは20種類以上のアーキテクチャをもち、数千以上の事前訓練モデルがコミュニティから提供されているとのことです。
最後に、クラスキャット社で提供している多言語対応のテキスト要約、翻訳サービスである「Text Summarizer Multilingual Edition v1.0」を紹介しセッションを締めくくられました。

BERTによる自動テキスト要約：セッション資料　

TensorFlow 2:Keras入門＆最新ライブラリー紹介

Google Cloud
Solutions Architect
中井悦司氏

続いて「TensorFlow 2 : Keras 入門＆最新ライブラリー」と題して、Google Cloud, Solutions Architect 中井悦司氏が登壇され、TensorFlow 2について、TensorFlow1.xからの変更点やKerasとの関係について解説いただきました。

TensorFlow２の変更点の一つとして、「TensorFlow 1ではif文などの制御構造（条件分岐）のコードが直感的ではない面がありましたが、TensorFlow 2ではEager Executionがデフォルトの実行モードになり、制御構造を持つコードが書きやすくなった点が挙げられます。ただし、Kerasを利用した場合には、これらの制御構造を含む処理は、事前にモジュールとして用意されている為、モジュールを一から作成する場合を除いては、それほど違いを意識することはないかもしれません。」（中井氏）

また、TensorFlowとKerasの関係性について解説して頂きました。

「Kerasは、元々は、TensorFlowとは独立に開発されたライブラリーでしたが、現在はニューラルネットワークモデルを定義するためのAPI（言語仕様）と位置付けられており、特定の実装を指すものではありません。TensorFlow 2ではTensorFlow用のKerasが同梱されており、Sequential API（入力から出力まで一直線のシンプルなモデル）　、Functional API（複数の入出力層を持つモデルや、複数のモデルを組み合わせる際に使用する）、 Subclassing（LayerクラスやModelクラスのサブクラスを定義して振る舞いを直接記述する）などの使い方があります。」（中井氏）

次に、TensorFlow Probabilityについて解説して頂きました。

「TensorFlow Probabilityは確率分布そのものを計算対象とするライブラリーであり、これを利用することで、特定の予測値ではなく、その背後にある確率分布そのものを予測するモデルを構築でき、例えば、ガウス過程による欠損値の推定などを扱う事も可能になります。」（中井氏）

セッションの最後には、Quantum TensorFlowの紹介をしていただきました。

「Quantum TensorFlowは量子古典ハイブリット機械学習のためのライブラリーであり、提供する機能は、TensorFlowの機械学習モデルによる計算処理とCirqによる量子計算処理を組み合わせて実行するというものです。量子回路に含まれるパラメータ値を、機械学習モデルで最適化するといった使い方も可能になります。」（中井氏）

TensorFlow 2:Keras入門＆最新ライブラリー紹介：セッション資料　

機械学習モデルの解釈可能性について

日本マイクロソフト株式会社
カスタマーサクセス事業本部
Cloud Solution Architect
女部田啓太氏

３番目のセッションでは日本マイクロソフト株式会社カスタマーサクセス事業本部Cloud Solution Architect 女部田啓太氏が登壇され、「機械学習モデルの解釈可能性」をテーマにお話し頂きました。

まずは、導入として「責任のあるAI」についてご説明頂きました。

「１０ヶ国以上で経営者に行った調査によると８０～９０％の以上の経営者がAIの倫理的な課題に直面しているといいます。今回のセッションでは「責任あるAI」を実現するためにマイクロソフトの掲げる６つの基本原則の中から「Transparency (透明性)」に関わる部分について解説いたします。今日では高精度の機械学習モデルを実現するために、深層学習などの複雑な機械学習アルゴリズムが数多く存在している一方で、それに起因する問題も散見されます。それは、「構築された機械学習モデルが妥当なものかわからない」「予測値の理由を説明できない」「モデルの改善方法が不明」などであり、これらの問題を解決する上でも、機械学習モデルの解釈可能性が重要性であると考えます。」（女部田氏）

次に、機械学習モデルの解釈可能性のフレームワークであるInterpretMLから、解釈可能なGlassboxモデルとBlackboxなモデルの解釈性を提供する「Interpret」、表形式データへのアプローチを行う「Interpret-community」、そして自然言語処理モデルの解釈可能性を提供する「Interpret-text」について解説して頂きました。

セッション後半では、ダッシュボード機能についてご説明頂きました。

「ダッシュボード機能を使用することでモデル精度の算出やデータ探索機能、グローバルな解釈、ローカルな解釈をGUIで利用することが可能となります。またWhat-if分析機能を利用することでパラメータの値を変更した際に、予測値がどのように変化するのか確認することもできます。」（女部田氏）

時間の都合上、「Interpret-text」の解説は概略のみとなりましたが、有益な参考情報を最後にご紹介いただき、セッションを締めくくられました。

機械学習モデルの解釈可能性について：セッション資料　

機械学習応用システムの開発技術（機械学習工学）の現状と今後の展望

国立情報学研究所
吉岡信和氏

最後のセッションは、国立情報学研究所の吉岡信和氏にご登壇いただき、「機械学習応用システムの開発技術（機械学習工学）の現状と今後の展望」と題して、AIが製品への活用され始めた現代において注目すべき点についてご講演頂きました。

冒頭では、特定条件下で自動運転機能に運転を任せる製品を例にとり、画像認識のデモ映像を交えながら識別率や安全性について解説頂きました。

「自動運転に用いられる画像認識では、夜間や悪天候の状況下での識別も考慮しなければなりません。また、DNNの作成する複雑なルールを人間ではレビューできないという本質的な課題など、製品化する上では様々な障害があるといえます。また、人の命にかかわる製品でもあり、安全性の保障が非常に重要であるものの、現状の開発方法では安全性の担保は難しい」（吉岡氏）

こうした現状を打開するといった思いも込め、2018年に機械学習工学研究会が発足され、吉岡氏も運営としてご活躍されています。

また、トレンドとして、

「近年、世界中で「品質」をキーワードとした論文が増えてきており、ML関連の研究では、セキュリティ・ロバストネス・フェアネスの観点での妥当性検証が多くなってきています。例えば、「歩行者とはどういうものか」を定義する上で、人間が無意識に行っている判断をソフトウェアでモデル化し、そのモデルと現実とのギャップを明らかにしする事で、保証範囲を明確化するような研究がなされています。」

と吉岡氏は語ります。

また最後に、「ニューラルネットワークを利用する製品は品質の担保が難しいため、機械学習工学を用いてどのようにして機械学習による複雑な関数と意味世界の折り合いをつけるかが今後の重要なポイントとなります。」と述べ、セッションを締めくくられました。

機械学習応用システムの開発技術（機械学習工学）の現状と今後の展望：セッション資料　

閉会のご挨拶

イベントの最後に、運営にご協力頂いている株式会社スタイルズ矢野哲朗氏より閉会のご挨拶をいただきました。

「これまで本セミナーはオンラインではなく会場に足を運んでいただいておりましたが、今回初めてオンラインでの開催となり、これだけの多くの方からご参加いただき非常に嬉しく思います。日本語でこれだけ深い話を聞ける場は貴重ですので、参加者の方々が今回の内容を活かしてご活躍されることを期待しております。また、興味深いお話をして頂いた登壇者の方々へ感謝申し上げます。」（矢野氏）

29回目の開催となった「OSS X Users Meeting」は、全国各地からたくさんの方にご参加頂く事ができました。
次回イベントも企画しておりますので、皆様の参加を心よりお待ちしております。