コンテンツへスキップ

【岡山大学】データ解析入門ハンズオンセミナー

岡山大学にて、実践的なデータ分析・AI・DX推進に関する講義を行いました。

データ解析の入門セミナーということで、Kaggleのコンペティション「Predict Future Sales」に参加し、データ分析モデルを作成する過程を経験していただきました。

★「Predict Future Sales」について
概要:ロシアのとある会社から提供された日々の売上データを扱うコンペティション
目標:翌月(2015/11)の各店舗、各商品の総売上高を予測すること

ワークショップ①「データサイエンス基礎」
データを操作する・可視化する
 ・Pandasによるデータ操作(グループ分け、欠損値処理、整形)
 ・Seabornを活用したデータ可視化(散布図、回帰グラフ、ヒストグラム、箱ひげ図)
データの特徴について考察する

ワークショップ②「データサイエンス実践」
分析モデルを作成する
分析モデルの精度をあげる
 ・追加特徴量の検討と作成を通じたデータ理解
 ・XGBoost等を用いた分析モデルの作成と精度向上(RMSE低減を目的)

参加いただいた学生にはアンケートを回答していただき、以下のような結果となりました。(回答率91%)

参加者36名の内訳として工学部や情報工学部の方が多かったですが、一方で文系の方も数名の参加がありました。

参加学生については、学部も学年も様々だったこともあり、個々のスキルや予備知識に差があったようです。そんな中、4時間にもわたる長時間のセミナーでしたが、必死についてきてくれた学生がいてくれたのも嬉しいですし、少し難易度を高いカリキュラムを選んだので、3割の学生にとって難しかったというアンケート回答をもらいましたが、別の感想の欄では、「データサイエンスにおける分析」のイメージを持って頂いたようでしたので、今回のセミナーを機にさらに興味を持ち、自分で改めて難題に取り組んでいく足掛かりになっていくことを願っています。

また、新しい気づきを得ることができた学生の皆さまにとっても、さらなるスキルアップを目指す契機となりましたら幸いです!