|
【本講座で取得できる知識】
・マテリアルズ・インフォマティクスの概要
・データ均質化のための予測モデル設計
・スペクトルデータの低次元化や分類方法
・スペクトルデータの物理モデリング方法
・研究データ蓄積の基礎
【講座主旨】
データ科学によって研究データの利活用を促進し、研究・開発を加速することを目指すマテリアルズ・インフォマティクスやプロセス・インフィマティクスが高い注目を集めています。特に、研究・開発ではスペクトルデータを多数取り扱いますが、エネルギーの基準がずれてしまっていたり、チャネル数がずれていたりと、研究・開発の現場でこれまでに蓄積されたデータの利活用には課題が多くあります。これらをうまくモデル化することで比較可能なものにし、データを統一的に扱うことができます。本講演では、不揃いなスペクトルデータ解析を行う上での課題に注目をし、取得したスペクトルデータからの情報抽出のための機械学習活用について、「回帰」「分類」「低次元化」「ピーク検知」といった視点から、機械学習の数理的な側面も交えながら基礎的な内容を紹介します。
【講座内容】
1.物質・材料データに対する機械学習の基礎
1)機械学習の基礎
2)機械学習応用の流れと課題設定の重要性
3)代表的な機械学習応用事例の紹介
4)化学プロセスデータの特徴と注意点
5)情報科学市民権
6)材料科学の立場として忘れてはいけないこと
2.予測モデルによる均質化とモデル選択
1)予測・モデル選択の応用例
2)モデル推定の種類(最尤法, MAP推定, ベイズ推定)
3)確率論的にみた回帰と正則化
4)非線形モデリングの困難
a)マルコフ連鎖モンテカルロ法によるパラメータ最適化
b)情報量基準によるモデル選択
c)解析事例
3.スペクトルデータの低次元化とクラスター解析
1)高次元データとしてのスペクトルと低次元化の重要性
2)分類:教師あり学習と教師なし学習
3)特徴空間と類似度
4)特徴空間の解釈性と表現性
5)主成分解析によるスペクトルの低次元化
6)k-means法によるスペクトルの分類
7)階層的クラスタリングによるスペクトルの分類
4.スペクトル解析のためのEMアルゴリズムによるピーク検知
1)ピーク検知のための処理フロー
2)非線形最小二乗法の困難
3)回帰と分布推定の違い
4)ガウス分布の最尤推定
5)EMアルゴリズムによる最尤推定
6)スペクトル解析のための改良EMアルゴリズム
7)解析事例
5. 研究データ蓄積を行う上で必要なこと
1) データベース構築の3つの目的
2) データベースの種類
3) フラットファイルフォーマット
4) ツリー構造を利用した実験データ蓄積
5) 電子ラボノートの事例
【質疑応答】
◆◆講師プロフィール◆◆◆
専門分野:計算物質科学, 表面・界面科学, マテリアルズ・インフォマティクス
学位:博士(理学)
略歴:
2003年04月 東京大学教養学部理科一類 入学.
2012年03月 東京大学 大学院理学系研究科 物理学専攻博士後期課程修了. 博士(理学).
2012年04月〜2013年04月 国立研究開発法人 産業技術研究所 産総研特別研究員.
2013年05月〜2016年03月 東京大学大学院 工学系研究科マテリアル工学専攻 助教.
2016年04月〜2018年09月 国立研究開発法人 産業技術総合研究所 研究員.
2018年10月〜2024年03月 同所 主任研究員.
2022年07月 早稲田大学 先進理工学部 客員准教授
2024年04月〜2024年09月 東京工業大学 科学技術創成研究院 化学生命科学研究所 准教授
2024年10月 東京科学大学 総合研究院 化学生命科学研究所 准教授(現職)
学協会役員:
2015年04月 公益財団法人 新世代研究所 界面ナノ科学研究会 会員(現職)
2017年04月 日本表面真空学会 データ駆動表面科学部会 幹事
(2019.04 より副部会長, 2021.04 より部会長)
2018年01月ドイツ フリッツ・ハーバー研究所 客員研究員(2018.07 任期満了)
2018年10月 Sci. Tech. Adv. Mater. 分野別編集委員(2024.03
任期満了)
2021年01月 Sci. Tech. Adv. Mater. Meth. 編集委員(現職)
|