コンテンツへスキップ

AI・データ分析

DA事業部からのお知らせ
・FDUA活動
・Kaggle活動
・その他AI開発、データ分析関連

【岡山大学】データ解析入門ハンズオンセミナー

岡山大学にて、実践的なデータ分析・AI・DX推進に関する講義を行いました。

データ解析の入門セミナーということで、Kaggleのコンペティション「Predict Future Sales」に参加し、データ分析モデルを作成する過程を経験していただきました。

★「Predict Future Sales」について
概要:ロシアのとある会社から提供された日々の売上データを扱うコンペティション
目標:翌月(2015/11)の各店舗、各商品の総売上高を予測すること

ワークショップ①「データサイエンス基礎」
データを操作する・可視化する
 ・Pandasによるデータ操作(グループ分け、欠損値処理、整形)
 ・Seabornを活用したデータ可視化(散布図、回帰グラフ、ヒストグラム、箱ひげ図)
データの特徴について考察する

ワークショップ②「データサイエンス実践」
分析モデルを作成する
分析モデルの精度をあげる
 ・追加特徴量の検討と作成を通じたデータ理解
 ・XGBoost等を用いた分析モデルの作成と精度向上(RMSE低減を目的)

参加いただいた学生にはアンケートを回答していただき、以下のような結果となりました。(回答率91%)

参加者36名の内訳として工学部や情報工学部の方が多かったですが、一方で文系の方も数名の参加がありました。

参加学生については、学部も学年も様々だったこともあり、個々のスキルや予備知識に差があったようです。そんな中、4時間にもわたる長時間のセミナーでしたが、必死についてきてくれた学生がいてくれたのも嬉しいですし、少し難易度を高いカリキュラムを選んだので、3割の学生にとって難しかったというアンケート回答をもらいましたが、別の感想の欄では、「データサイエンスにおける分析」のイメージを持って頂いたようでしたので、今回のセミナーを機にさらに興味を持ち、自分で改めて難題に取り組んでいく足掛かりになっていくことを願っています。

また、新しい気づきを得ることができた学生の皆さまにとっても、さらなるスキルアップを目指す契機となりましたら幸いです!

【社長が挑戦】DATA Saber 認定制度①

DATA Saber とは?

データにまつわる包括的な知識と技術力【データのその先の世界を見通す技術力】、ならびにデータドリブン文化を広める力【データドリブン文化を伝え、人々を導く力】の双方を高いレベルで兼ね備えている者をいいます。

  • データのその先の世界を見通す技術力
    データを理解するための基本から上級のスキルを迷いなく引き出せるほどにまで身につけ、いつでもスムーズに使用することができる。「データが何を言っているかわかる」ようになる。
  • データドリブン文化を伝え、人々を導く力
    データを理解することでビジネスを変革できると確信し、それを会社内や社会に広める活動を行う。

DATA Saber 認定制度

DATA Saberには4つの階級があり、認定制度を通過した者がDATA Saberと呼ばれます。

  1. Apprentice of DATA Saber:認定制度の試練を受けている者
  2. Knight of DATA Saber:DATA Saber認定制度を通過した者。一般にDATA Saberと呼ばれる。
  3. Master of DATA Saber:10名以上の弟子を持つ者。省略してMasterと呼ばれることも多い。
  4. Grand Master of DATA Saber:100名以上の弟子を持つ者​

「Apprentice」は3ヶ月の間に【データのその先の世界を見通す技術力】と【データドリブン文化を伝え、人々を導く力】を有していることを証明することで、DATA Saberとなることができます。
当社代表自らが挑戦中です!

  • 技術力に関する10の試験すべてで満点を取ることで、【データのその先の世界を見通す技術力】を証明します。
  • コミュニティ活動で50pt以上を獲得することで、【データドリブン文化を伝え、人々を導く力】を持つことを証明します。

ドコモgaccoに導入事例として紹介されました!

ドコモgaccoでは、課題設定力と課題解決力を両軸に、VUCA時代に活躍するビジネスパーソンを育成する法人向け人材育成サービスを提供しており、その中から当社はDX人材育成プログラムに若手社員が取り組みました。

目的としては、当社として近年、AI、データサイエンス案件を受注する機会が増えており、SE職としてはもちろん、「AIやデータサイエンス職にも取り組める人材育成」という1つの課題がきっかけでした。SE職の方は(例:IPAのITSSで定義しているように)業界での長年の積み重ねで、ある程度確立した方法論が存在するものの、AIやデータサイエンスなどの領域を含めた、いわゆるDX人材育成の方法論は、まだ試行錯誤の域にあります。

例えば、Udemyにも大量にコンテンツがあり、当社としても社員に自己啓発の機会を提供しているのですが、さらに、初学者向けのAIやデータサイエンスのコンテンツに力を入れながら、Udemyに対抗した「短期間集中のオンライン学習」をコンセプトにしているgaccoに興味を持ち、今回導入に至りました。

導入事例として、当社の取り組みが紹介されています!ぜひご覧ください。

株式会社アイティーシー様gacco導入事例|生成AI導入研修による若手人材育成に向けた基礎理解と実務応用力の強化

オープンイノベーション Match Up

1月24日、OI-Startノートルダム清心女子大学が主催するイベント「オープンイノベーション Match Up」に参加してきました!

今回のイベントは、企業の課題解決や新規事業創出を加速させることを目的としています。
企業、研究者、学生、自治体が集結し、共創の場を提供します。
先進的なデジタル技術や産学官連携の事例から学びにつながり、企業のイノベーション創出を後押しする機会となりました。

当社は産学連携に関する取り組みをご紹介させていただきました。

OI-Startなどのサイトにも詳しく掲載されています。

2025/1/24(金)産学官連携で地域課題の解決を目指す「オープンイノベーション Match Up 」イベントを開催しました。

https://www.ndsu.ac.jp/blog/article/index.php?c=blog_view&pk=17379536244e500df3793304c090f1228c2b7b62b8

https://prtimes.jp/main/html/rd/p/000002918.000072793.html

Kaggle活動記録-10

こんにちは。アイティーシーの東村です。
今回の記事では、学習コンテンツ「Learn」のひとつ、「Machine Learning Explainability」についてご紹介いたします。

機械学習って、基本的にはデータを投入して学習させて予測結果が出て…という流れだと思いますが、ただ学習して結果を出力しただけでは「どの特徴量が予測に大きく影響したのか?」がわかりません。
ブラックボックス状態になってしまうというわけですね。
ですが、どの特徴量がどれくらい予測に影響しているかを可視化することで、ブラックボックスモデルを解釈することができます。
今回は「Machine Learning Explainability」を使って、この手法を学んでいきたいと思います。

■今回学んだ手法
1.Permutation Importance(PI)
→特定の特徴量の重要度を評価する手法です。
数ある特徴量のうち1つをランダムにシャッフルして、学習済みモデルで予測を行い、シャッフル前のスコア(精度や損失)とシャッフル後のスコアの差分を計算します。
これが大きいほどシャッフルした特徴量の重要度が高いことが推測できます。
「eli5」というライブラリを用いて簡単に実装できます。

2.Partial Dependence Plot(PDP)
→特定の特徴量の影響度を評価する手法です。
数ある特徴量のうち1つをピックアップして値を変えながら予測を行います。(その他の特徴量は固定します)
横軸にピックアップした特徴量、縦軸に予測結果をプロットすると、ピックアップした1つの特徴量だけを変えていったときに予測結果がどのように変化するかを可視化できます。
プロット結果が振動していれば、その特徴量は予測結果に影響していることが推測できます。
2つの特徴量をピックアップして同様に予測を行い、予測結果をヒートマップでプロットすれば、2次元のPDPを作成することもできます。
「sklearn」というライブラリを用いて実装可能です。

3.SHapley Additive exPlanations(SHAP)
→各特徴量が予測にどれほど貢献しているかを、Shaplay値を用いて評価する手法です。
ただし、特徴量n個に対してShaplay値を求めようとすると計算量がn!になるため、近似的に算出したSHAP値を用います。
Shaplay値については以下サイトの説明がわかりやすいと思います。
https://qiita.com/KotaYoneda/items/01aa1beeb6bb654219c9
「shap」というライブラリを用いて実装できます。

■所感
予測に影響する特徴量を可視化する手法を3つ学ぶことができました。
とくにPIを計算して各特徴量の重要度を計る手法はシンプルでわかりやすく、コンペにすぐ活かせそうだと感じました。
SHAPはまだまだ奥深そうです…。使いこなせるように研鑽を積みたいと思います。

最後まで読んでいただき、ありがとうございました。
次回もどうぞよろしくお願いいたします。

Kaggle活動記録-9

こんにちは。アイティーシーの藤原です。
前回の更新からかなり日が空いてしまいましたが、今回はKaggleの「Learn」というコンテンツについてご紹介です。

【「Learn」について】
「Learn」とは、Kaggle内にある機械学習やそれに関連した分野を学習できるコンテンツになります。
機械学習やAIの初学者やコンペティションの参加はハードルが高いと感じている方を対象とされています。

ポイントは、ただの読み物コンテンツではなく、手を動かして学習できる点にあります。
それぞれのLessonは、「Tutorial」と「Exercise」の2つで構成されています。
「Tutorial」ではその章で取り扱う内容の説明やコード例が記載されています。
「Exercise」では「Tutorial」で説明された内容についての演習が用意されており、自身でコードを記述・実行することができます。
コースによっては学習した内容を活用できるコンペティションが用意されている場合もあります。

ボリュームも十分に用意されており、Pythonのプログラミング言語の学習からディープラーニングの学習まで幅広く取り扱われています。
今回はその中でも「Intermediate Machinne Learning」についてご紹介いたします。

【Intermediate Machine Learning】
こちらは機械学習のモデル精度を高める上で必要な学習データの前準備や検証時に必要な知識・技術について学習できるコースです。
具体的には欠損値や交差検証、データリーケージについて学ぶことができます。

章構成は以下の通りです。
1Introduction
2Missing Values
3Categoical Variables
4Pipelines
5Cross-Validation
6XGBoost
7Data Leakage

【所感】
モデル精度を高めるためには避けては通れない欠損値やカテゴリ変数について学ぶことができたのは大変良かったです。
データリーケージについては、感覚的に理解できるようになったものの中々に難しい内容でした。
このあたりは経験を積み上げて理解を深める必要性を感じています。

今回このコースを完了し、機械学習の基礎はできるようになっているはずなので、次回の記事では実際にKaggleのコンペ参加した報告ができればと思います。
最後までご精読ありがとうございました。

岡山大学よりDXSUNパートナーズとして登録されました

当社が「DXSUNプロジェクトリーダー 岡山大学 研究・イノベーション共創機構 産学官連携本部」の
審査会において厳正に審査した結果として、令和6年11月29日にDXSUNパートナーズとして登録されたことを報告致します。

当社はDXSUNパートナーズとして、岡山県内の中小企業向けにデジタル化・DX支援を行い、DX化に貢献して参ります。

特に企業のデータ利活用およびAI導入の取り組み推進をサポートし、当該推進を岡山の学生や企業若手人材とともに行います。これにより学生や若手人材各自のスキルアップが達成され、ひいては岡山全体のデータ利活用・AIに関する「活用文化」を醸成することとなると考えています。
長期的には、岡山県の人口増加、地元企業への就職定着化、IT先進県としてのイメージアップを実現し、グローバルでDA事業に関するニアショア案件が集まると共に、人とAIが当たり前に共生する社会を実現した「生産性が一番高い県」に岡山をしていきたい、と考えております。

DXSUN(DXサンライズおかやま)とは?

DXSUNロゴ

DXSUNは、岡山県内中小企業のDXを強力に後押しするため、 DXに向けたビジョン構築支援やデジタル人材の育成を目的として、岡山県内企業および支援機関等11社により令和5年7月に発足しました。
DXSUNでは、参画メンバーである各社・各支援機関等がそれぞれの強みを持ちより、ビジョン駆動の「新たな価値創造」に重点を置いた伴走支援を行います。
また、企業の実態に即したリスキリングの仕組みを岡山大学等で整備することにより、デジタル人材の育成も同時に行います。これらの活動により、県内中小企業のDXを面的にサポートし、業種横断的な価値創造を目指します。

引用:DXサンライズおかやま(DXSUN) | 岡山大学 研究・イノベーション共創機構

 

令和5年度産学共創促進チャレンジ事業発表

岡山大学研究協力会主催の「産学共創促進チャレンジ事業」は、当社のような岡山大学研究協力会に在籍する会員と、岡山大学所属の研究者との新たな連携機会の探索、または将来的な共同研究等を見据えた取り組みに対する助成を目的としています。
当社は連携機会の探索を目的としてこの取り組みに参加し、発表を行いました。

今回発表した取り組みを今後も更に推進し、岡山へのAI開発ニアショア案件を積み上げ、
岡山県の長期的な発展に貢献していきたいと考えています。

【「岡山でのAI/データ活用推進」機会の探索】

【当社代表取締役 三宅の登壇】

登壇