データエンジニア育成研修(基礎・基本・応用編)

製造部門向け

概要

 デジタル技術が世の中の社会構造や産業構造を劇的に変化させる時代、DX(デジタルトランスフォーメーション)が求められる時代に必須なことはなんでしょうか?多数考えられると思いますが、何を実施するにしろ、デジタル技術を活用するスキルやDXを牽引する企業の担当者の育成が基礎になります。この人材育成を実施しないで、DXを推進しようとしている企業は最終的に競争力が無くなり淘汰されてしまうでしょう。
 それでは、このDX時代に求められる人材はどのようなスキルをもった担当者でしょうか?「データサイエンティスト」「データサイエンティスト」でしょうか?違います。「データサイエンティスト」は、世の中の変革を牽引する立場としては確かに重要ですが、「データサイエンティスト」はAI(人工知能)などを駆使するひと握りのエンジニアです。企業の競争力の源泉になるのは、上記の企業の変革を現場レベルで実現する全ての担当者です。この全ての担当者が従来の専門分野にプラスしてデータエンジニアリングのスキルを身につけるダブルメジャーの考え方が重要になってきています。また、従来の専門分野にプラスしてデータエンジニアリングのスキルを身につけた技術者を「データエンジニア」と呼んでいます。データエンジニアは、データをみて、ものごとの本質を見抜くことが重要になります。表面的なところに捕らわれず、なぜそのような結果になったのかを洞察し、そこをさらにデータによって確認していくというような深い思考が重要になります。また、変化を読み取り、その変化から何が起きるのかを想像することにより、先手の対応が可能になります。さらに言うと、色々なものに疑問を持ち、なぜだろう?という常に考えること、特に昔から実施していることに対して否定すること、が必要だと思います。
 そこで、日本能率協会では体系立て、「データエンジニア」の育成できる研修プログラムを開発しました。DX推進する際に必要不可な自社のデジタル人材不足が急務の課題だと思いますので、是非、本研修プログラムをご活用ください。

受講条件

【基礎編】

  • 業務などでパソコンを日常利用している方
  • エクセルの表計算や合計/平均などを計算する関数を使用した経験がある方
  • データ分析やプログラム経験があまり無い方、Pythonの経験が無い方

基本編

  • 基礎編を受講している方 又は Pythonの基本的文法は理解している方
  • Pythonでの構造化(定型)データの分析実施経験が無い方

応用編

  • 基本編を受講している方 Pythonを使ったデータ分析経験がある方、基本的なクラウド操作経験がある方
  • Pythonでの非構造化(非定型)データの分析実施経験が無い方

パソコンスペックなど

【基礎・基本編】
*自前PCの場合、推奨するPCスペックは下記の通りです。
WINDOWS10以上 / CPU 64bit 2.4GHz以上 / メモリー8GByte / ストレージ空き容量 32GByte

  • マイクロソフト エクセルがイントストールされているもの
  • Pythonは、GoogleClab(クラウド環境)で実施予定です。また、基本編では、クラウド環境である「Google Data Studio」「IBM Watson」を利用予定です。
    (予め、研修前にお送りする手順書により、動作確認を実施していただきます)

【応用編】

  • Pythonは、基礎編、基本編と同じく、GoogleClab(クラウド環境)で実施予定です。また、クラウド環境である「IBM Watson」などを利用予定です。
    (予め、研修前にお送りする手順書により、動作確認を実施していただきます)
  • RPAは、マイクロソフト社の「PowerAutomate Desktop」を使用予定です。無料版を使用するためには、OSが、Windows10 又は Windows11である必要があります(Windows11では標準搭載ですが、Windows10の場合は、予め、研修前にお送りする手順書によりインストールをしていただきます)

    基礎編プログラム

    • 第6回 前半:2022年 5月17日(火)~18日(水)  /  後半:2022年 5月30日(月)~31日(火)
    • 第7回 前半:2022年 9月 1日(木)~ 2日(金)  /  後半:2022年 9月 8日(木)~ 9日(金)
    • 第8回 前半:2022年12月 8日(木)~ 9日(金)  /  後半:2022年12月15日(木)~16日(金)
    1日目【前半】
      時間 プログラム
      10:00

      17:00
      1. データ収集と分析をする為のIoT技術とAI技術
        • 製造現場のOT(Operational Technology)データとは?
        • OTとITの融合を実現するCPS(Cyber-Physical System)
        • DX時代のOTデータの変化
        • AIの手法:教師有り/教師無し/強化学習、ディープラーニング
        • データ収集と前処理
        • 分析の流れ
        • DEのための仮説立案方法
        • AIの落とし穴
        • 「AIのモデル開発は誰が実施し、どの手法 /ツールを活用すべきか?」
      2. スマート工場化にするための要素技術
        • センサー技術とセンサー機器
        • 通信とPAネットワーク
        • DB(データベース)
        • VR(仮想現実)
        • AR(拡張現実)
        • ドローン技術
        • クラウド
        • セキュリティ
          注)各要素技術の説明では、工場やプラントでの活用 方法が含まれます。
      2日目【前半】
      時間 プログラム
      10:00

      17:00
      1. 【演習 Excel】統計学の基礎力習得

        (1)統計基礎・偏差
        (変数、尺度、分布、分散など)

        • 確率(条件付き確率、期待値など)
        • 推定(点推定、区間推定)
        • 検定(仮説検定、z検定、t検定、カイ二乗 検定など)
        • 相関(相関係数)/回帰(決定係数、過学習)

        (2)統計による製造業の品質管理

        • QC7つ道具の活用/工程能力指数
        • 実験計画法/信頼性工学/統計プロセス管理
        • 品質機能展開(QFD)/シックスシグマ 手法

        (3)ビッグデータ解析/機械学習へつな がる統計

        • 相関関係と因果関係
        • 外れ値検出/統計ツール/ベイズ統計学
      3日目【後半】
      時間 プログラム
      10:00

      17:00
      1. 【演習 Python】Pythonの文法とライブラリー
        • 環境構築
        • 文法
        • 機械学習
        • ライブラリーの活用
          (numpy、matplotlib 他)
      2. 【演習 Excel、Python】データの見える化
        • グラフ化(箱ひげ図、2次元、3次元)
        • QC7つ道具
          (ヒストグラム、散布図、管理図他)
        • 時系列データの見える化
        • フーリエ変換(音声の見える化)
        • ピボットテーブル
        • ダッシュボード/ドリルスルー/ドリルダウン/ドリルアップ
      4日目【後半】
      時間 プログラム
      10:00

      17:00
      1. 【演習 Python】機械学習のための数学基礎
        • ベクトル
        • 行列(逆行列、転置、写像)
        • 内積
        • 微分
        • 指数/対数
        • 解析解(厳密解)と数値解
        • 虚数/複素数
        • 活性化関数(シグモイド関数 他)
      2. 機械学習によるデータ分析
        • 検証方法(ホールドアウト検証、クロスバリデーション)
        • 損失関数
        • 過学習とは
        • モデルの評価方法(混同行列 他)
        • ハードウェア(GPU、TPU他)

      基礎編プログラム

      • 第2回 前半:2022年 6月22日(水)~24日(金)  /  後半:2022年 6月29日(水)~7月1日(金)
      • 第3回 前半:2022年10月17日(月)~19日(水)  / 後半:2022年10月24日(月)~ 26日(水)
      • 第4回 前半:2023年 1月11日(水)~13日(金)  /  後半:2023年 1月25日(水)~ 27日(金)
      1日目【前半】
      時間 プログラム
      10:00

      17:00
      1. データの収集と前処理(クレンジングなど)
        • データ収集のポイント
        • 前処理の重要性
          (構造化 データと非構造化データの 違い)
        • 正規化/標準化/白色化
        • データ拡張/ラベル設定
      2. 【演習 Python】機械学習の手法
        • 線形回帰/ブースティング/SVM 他
        • TensorFlow(Googleのオープンソース)とKeras 他
      2日目【前半】
      時間 プログラム
      10:00

      17:00
      1. 【演習 Python】クラスタリング
        • 教師無し学習のクラスタリングをk-means法を使用して理解する
      2. 【演習 Python】予測:回帰分析(単回帰/重回帰)
        • 回帰分析についてPythonを動作させながら理解する
        • 平均二乗誤差、線形基底関数モデル、評価方法(ホールドアウト検証 他)
      3日目【前半】
      時間 プログラム
      10:00

      17:00
      1. 【演習 Python】分類(クラス分類)
        • ロジスティック回帰/決定木(ランダムフォレスト)、SVM(サポートベクターマ シン)、ランダムフォレスト  他
        • ハイパーパラメータのチューニング
      2. 【演習 Python】ニューラルネットワーク
        • ニューラルネットワークの基本概念をPythonを動作させながら理解する
      4日目【後半】
      時間 プログラム
      10:00

      17:00
      1. 【演習 Python TensorFlow/Keras】ディープラーニング
        • ディープラーニングの基本概念をPythonを動作させながら理解する
      2. 【演習 Python TensorFlow/Keras】学習精度向上のノウハウ
        • 活性化関数/過学習の防止
        • 回転機械の異常検知
      5日目【後半】
      時間 プログラム
      10:00

      17:00
      1. 【演習 Google Data Studioフリー】データの見える化:B I(ビジネス・インテリジェンス)ツールの活用
        • 体系的に見える化するツールであるBIの各種機能を確認する
      2. 【演習 IBM Watson(ライトアカウント)】クラウドの活用(AWS、Azure、Google、Watsonなど)
      6日目【後半】
      時間 プログラム
      10:00

      17:00
      1. 【演習 IBM Watson(ライトアカウント)】クラウドの活用(続き)
      2. 【演習 パソコン/Python】セキュリティ(暗号化、認証、攻撃対策、監視/運用)
        • セキュリティの基本技術について理解する
        • 暗号処理をPythonで実現

      応用編プログラム

      • 第1回 前半:2022年 7月 6日(水)~8日(金) / 後半:2022年 7月13日(水)~15日(金)
      • 第2回 前半:2023年 2月 1日(水)~3日(金) / 後半:2023年 2月 8日(水)~10日(金)
      1日目【前半】
      時間 プログラム
      10:00

      17:00
      1. デジタルシステムの要件定義と課題解決
        • スマート工場/スマートプラントの要件定義
        • DEのための要件定義書の書き方
      2. 非構造化(非定型)データの分析
        • 製造現場のOT(Operational Technolog)データの大半が非構造化(非定型)データ(画像、音声、自然言語、時系列センサーデータなど)
        • アナログーデジタル変換のポイント
        • 非構造化(非定型)データの前処理
        • ディープラーニング(オープンフレームワーク:Keras、Tensorflow)による分析
        • 時系列データの処理:RNN(Recurrent Neural Network)再帰型ニューラルネットワーク
        • 非構造化(非定型)データ分析の応用範囲
          (異常判断、品質予測、作業改善など)
      2日目【前半】
      時間 プログラム
      10:00

      17:00
      1. 【演習 Python】自然言語の分析
        • 自然言語データ処理
        • 日本語認識の難解さ
        • 分かち書き/形態素解析(Janome)
        • テキスト分類
        • 文書分析ツール
        • 文章分析による付加価値創出
      2. 【演習 Python】画像認識の概要
        • OpenCV(Open Source Computer Vision Library)の利用方法
        • 文字認識の手法:CNN(Convolutional Neural Network:畳み込みニューラルネットワーク) の活用(パディング、プーリング)
        • ディープラーニングの構造の決定
        • 活性化関数変更
        • ハイパーパラメータの調整
        • 過学習の防止
        • Early Stopping
      3日目【前半】
      時間 プログラム
      10:00

      17:00
      1. 【演習 Python】音声分析の基本
        • 純音の作成/出力
        • 音の足し算/引き算
        • 音のみえる化
        • フーリエ変換
      2. 非構造化(非定型)データの分析ツール
        • AI-OCR(Optical Character Recognition/Reader)
        • アクションの利用方法
        • RPAによるデータ分析の自動化
        • DEのためのRPAツールの選定方法
      3. 【演習 Power Automate Desktop】RPA(Robotic Process Automation)
        • ノーコードによる開発
        • アクションの利用方法
        • RPAによるデータ分析の自動化
        • DEのためのRPAツールの選定方法
      4日目【後半】
      時間 プログラム
      10:00

      17:00
      1. 【講師デモ】音声分類
        • AWS SageMakerの利用
        • エンジン音、飛行機音、ヘリコプター音、チェーンソー音、ガラス破壊音などの分類
        • 音声データの前処理
        • CNN(畳み込みニューラルネットワーク)の活用
      2. 【演習 Python】時系列データの分析
        • RNN(Recurrent Neural Network)
          再帰型ニューラルネットワーク
        • LSTM(Long Short-Term Memory)の活用
        • データの正規化(Mini-Max)による精度向上
        • センサーデータ分析の方法
      5日目【後半】
      時間 プログラム
      10:00

      17:00
      1. 【演習 Python】異常検知

        ①機器の温度・圧力等のセンサーのデータによる異常検知(OneClassSVMの使用)

        • データの標準化による精度向上
        • ハイパーパラメータの探索
        • 実行結果の評価と活用

        ②振動データの異常検知(心電図を模した振動データ)

        • AutoEncoder(自己符号化器)による異常検知
        • 分析対象データの描画みえる化)
        • 異常度スコアの描画(みえる化)
        • ハイパーパラメータの調整
      6日目【後半】
      時間 プログラム
      10:00

      17:00
      1. 【演習 Python】画像による合否判定
        • データの前処理(OpenCV:Open Source Computer Vision Library)
        • データ拡張(Kerasによるデータ拡張)
        • 画像判定の方法
        • 画像外観検査への応用
        • 画像認識の利用例(講師デモのみ)
        • カメラ調整(講師デモのみ)
        • 画像外観検査の性能向上方法
      2. 【演習 クラウドツール】非構造データ分析ツール
        • クラウドツール(IBM Watson)
        • AWS、Azure、Google(講師デモ)