MIのための実験データ統合,データベース構築と活用例　セミナー

生成AIによる業務効率化と活用事例集

少ないデータによるAI・機械学習の進め方と精度向上,説明可能なAIの開発

＜セミナー　Ｎｏ.605225＞

【Live配信のみ】　アーカイブ配信はありません

★実験データの収集・加工など効果的なデータ活用事例を化学企業での実事例から徹底解説します！

マテリアルズインフォマティクスのための
実験データ統合,データベース構築と活用例

■　講師

１．	(株)ダイセル　研究開発本部生技研開横断DXセンター　設計開発推進グループ　首席技師　博士（理学）　兼子祐氏
２．	東レ(株)　先端材料研究所　真利大地氏東レ(株)　先端材料研究所　菊辻卓真氏
３．	東北大学　学際科学フロンティア研究所　特任准教授　橋本佑介氏

■　開催要領

日　時	：	２０２６年５月２１日(木)　１０：３０～１６：００
会　場	：	Zoomを利用したLive配信　※会場での講義は行いません Live配信セミナーの接続確認・受講手順は「こちら」をご確認下さい。
聴講料	：	1名につき６０,５００円（消費税込、資料付）〔１社２名以上同時申込の場合のみ１名につき５５,０００円〕〔大学、公的機関、医療機関の方には割引制度があります。詳しくは上部の「アカデミック価格」をご覧下さい〕

■　プログラム

【10:30-12:00】

１．計算科学・社外実験データベースを活用したマテリアルズインフォマティクス基礎検討　　

(株)ダイセル　研究開発本部生技研開横断DXセンター　設計開発推進グループ　首席技師　博士（理学）　兼子祐氏

【講座趣旨】
　　本講演は、計算科学および社外実験データベースを活用したマテリアルズインフォマティクス（MI）の基礎検討について、株式会社ダイセルの取り組みと事例を中心に紹介するものです。特に、データベース・シミュレーション・機械学習を組み合わせた材料開発の効率化、合成可能性を考慮した新規材料提案、社内外データの活用、そしてバイオマスやセルロースなど持続可能な素材への応用事例を通じて、MIの現状と課題、今後の展望について議論します。

１．自己紹介・会社紹介
　　1.1　発表者略歴
　　1.2　ダイセルの概要・沿革・事業内容

２．マテリアルズインフォマティクス（MI）の基礎
　　2.1　MIの使い道とワークフロー
　　2.2　実験・シミュレーション・MIの連携
　　2.3　社内外データベースの活用

３．社内・社外データを用いたMI事例
　　3.1　反応速度・電気特性・化学反応性などの予測モデル
　　3.2　量子化学計算・分子動力学計算データの活用
　　3.3　少数データと外部データのブレンドによる予測

４．分子シミュレーションとデータベースの連携
　　4.1　RadonPyコンソーシアムの利用
　　4.2　低分子・高分子材料設計への応用
　　4.3　クラスター分析・物性相関の評価

５．PoLyInfoデータベースの活用
　　5.1　データ抽出・マッピング事例
　　5.2　物性データベースの今後

６．社内事例紹介
　　6.1　溶媒探索・変異原性予測・ガラス転移温度予測
　　6.2　熱硬化性オリゴマー物性予測

７．セルロース溶剤探索の共同研究事例
　　7.1　分子シミュレーション×機械学習による溶解性予測
　　7.2　実験・計算の相関、溶解メカニズムの解明

８．有機半導体材料探索の共同研究事例
　　8.1　第一原理計算×機械学習による有機分子結晶構造形成予測
　　8.2　分子構造探索、結晶構造の予測

９．合成可能性を考慮した高分子データベース構築の共同研究事例
　　9.1　SMiPolyによる仮想高分子ライブラリ生成
　　9.2　既存高分子との比較・新規性評価
　　9.3　合成可能性・逆解析の課題と提案

１０．まとめ・謝辞

【質疑応答】

【12:50-14:20】

２．マテリアルズインフォマティクスを用いた高分子材料開発の取り組み

東レ(株)　先端材料研究所　真利大地氏
東レ(株)　先端材料研究所　菊辻卓真氏

　
【講演ポイント】
　材料開発の高度化・効率化が求められる昨今、シミュレーションやインフォマティクスといったデジタル技術の活用が不可欠となっており、東レにおいてもデジタル技術と各事業のドメイン知識を融合した独自の材料開発を進めています。
　本セミナーでは、高分子材料開発へのデジタル技術活用について、当社の戦略と実践例をご紹介します。まず、当社の研究体制とデジタル技術活用の全体像を概説し、シミュレーションやマテリアルズインフォマティクスなどデジタル技術の概要と課題を述べます。さらに具体的な事例として、マルチスケールシミュレーションによる樹脂粘弾性予測、高分子分離膜設計へのシミュレーションとインフォマティクスの適用、データベースや電子実験ノートに収録されているデータのインフォマティクスによる統合的な活用などについてお話しします。

１．はじめに
　1.1 自己紹介・会社紹介
　1.2 東レの研究体制およびデジタル技術活用の概要
　1.3 DXテーマ選定・テーマ推進体制・他部署連携についての考え方
　1.4 デジタル技術の社内普及への取り組み

２．シミュレーションとインフォマティクスを活用した高分子材料・プロセス設計
　2.1 シミュレーション・インフォマティクスの概要
　　(1)高分子材料設計に用いるシミュレーション
　　(2)マテリアルズインフォマティクス（MI）、プロセスインフォマティクス(PI)
　2.2 高分子材料・プロセス設計におけるデジタル技術活用の課題
　　(1) シミュレーションの課題
　　(2) インフォマティクスの課題

３．開発・適用事例
　3.1 マルチスケールシミュレーションによる樹脂粘弾性予測
　3.2 MIによる少数データを用いた樹脂材料設計
　3.3 高分子分離膜の設計
　　(1)分子シミュレーションによる膜表面設計
　　(2)マルチスケール相分離シミュレーションによる多孔構造設計
　　(3)PI・シミュレーションによる紡糸プロセス安定化
　3.4 データベース・電子実験ノートにおける収録データの統合的な活用

４．まとめ

【質疑応答】

【14:30-16:00】

３．機械学習を活用した実験データと計算データを統合した材料特性予測モデルの開発

東北大学　学際科学フロンティア研究所　特任准教授　橋本佑介氏

【習得できる知識】
　実験データベース（StarryData2等）と第一原理計算データベース（Materials Project等）を統合するためのデータ前処理・整合手法、グラフニューラルネットワーク（MPNN）による結晶構造からの材料特徴表現（埋め込み）の取得方法、次元削減（t-SNE等）を用いた材料マップの構築と解釈手法、および統合データに基づく材料特性予測モデル構築のエンドツーエンドワークフロー。熱電材料を具体的な応用事例として、データ統合型の材料探索・発見プロセスの実践的知見を習得できる。

【講座趣旨】
　材料開発の効率化にあたり、実験データと計算データの統合的活用は重要な課題である。しかし、両データは測定条件・精度・カバレッジ等が大きく異なり、単純な結合では有効な予測モデルを構築できない。本講座では、講師の研究成果（APL Machine Learning 3, 036104, 2025）に基づき、グラフベース機械学習（Message Passing Neural Network）を用いて実験・計算データを統合し、材料特性マップを構築する手法を体系的に解説する。StarryData2（実験データベース）とMaterials Project（計算データベース）からのデータ取得・前処理から、GNNによる結晶構造の特徴表現学習、次元削減による材料マップの可視化、そして予測モデルの構築・解釈まで、エンドツーエンドのワークフローを具体例とともに紹介する。熱電材料を主な応用対象とし、統合マップから得られる材料設計指針や新材料探索への展開についても述べる。

１．材料インフォマティクスにおけるデータ統合の背景と課題
　1-1 実験データと計算データの特徴の違い（精度、カバレッジ、バイアス）
　1-2 既存の材料データベース概観（Materials Project, AFLOW, StarryData2, NIMS等）
　1-3 データ統合が材料探索を加速する理由と従来手法の限界

２．実験データベースからのデータ取得と前処理
　2-1 StarryData2の構造と熱電材料データの取得方法
　2-2 実験データに固有の課題（測定条件の不均一性、欠損値、外れ値処理）
　2-3 データクリーニングと品質管理のワークフロー

３．計算データベースからのデータ取得と前処理
　3-1 Materials Project APIを用いた結晶構造・物性データの取得
　3-2 第一原理計算データの特性
　3-3 実験データとの整合のためのデータ変換手法

４．グラフニューラルネットワーク（GNN）による材料の表現学習
　4-1 結晶構造のグラフ表現
　4-2 Message Passing Neural Network（MPNN）の原理と定式化
　4-3 CGCNN・MEGNet・SchNetとの関係と手法選択の指針

５．実験・計算統合データに対するGNNモデルの構築
　5-1 異なるデータソースに対するグラフデータセットの統合構築
　5-2 データソース間のドメイン適応と転移学習の考え方
　5-3 学習パイプライン（データ分割、評価指標）

６．GNN埋め込みを用いた材料マップの構築
　6-1 学習済みGNNからの埋め込みベクトルの抽出方法
　6-2 次元削減手法の選択（PCA、t-SNE、UMAPの比較と使い分け）
　6-3 統合材料マップの可視化と実験・計算データの空間的関係の解釈

７．材料マップからの知識抽出と材料設計への応用
　7-1 クラスタリング分析による材料グループの発見と物理的意味づけ
　7-2 熱電材料への適用事例
　7-3 材料マップに基づく未探索領域の特定と新材料候補の提案

８．実践ワークフローの全体像と今後の展望
　8-1 データ収集からモデル構築・材料探索までのエンドツーエンドパイプライン
　8-2 マルチエージェントAIとの連携による効率的データ分析と知識基盤構築
　8-3 自動実験・ロボティクスとの統合に向けた展望

【質疑応答】

マテリアルズインフォマティクスのための 実験データ統合,データベース構築と活用例

■ 開催要領

１．計算科学・社外実験データベースを活用した マテリアルズインフォマティクス基礎検討

２． マテリアルズインフォマティクスを用いた高分子材料開発の取り組み

３．機械学習を活用した実験データと計算データを統合した材料特性予測モデルの開発

マテリアルズインフォマティクスのための
実験データ統合,データベース構築と活用例

■　開催要領

１．計算科学・社外実験データベースを活用したマテリアルズインフォマティクス基礎検討　　

２．マテリアルズインフォマティクスを用いた高分子材料開発の取り組み