コンテンツへスキップ

システム

2020年度新入社員研修 ー 文系出身 従来型ITからAIまで奮戦記

所属:総務部人事課
人文社会科学部 人文社会科学科/Y.C
2020年4月入社

当社にご入社される方の参考になればと思い、限られた紙面の中ですが、私が当社の研修で学んできた概要を書いてみました。

■4月~5月  研修と実践
1.研修の内容

社会人マナー研修 電話対応、メールマナー、名刺交換のマナー など
PG/SE基礎研修 プロジェクトの流れ、システムについて、仮想環境構築 など
ウェブサイト構築研修 HTML、CSS、JavaScriptを実際に書く など

2.HTML、CSS、JavaScriptを使ってお客様のホームページを作成

3.私の感想
自分にとって未知の分野であったため、新しく聞く言葉も多く、入り込みにくさから難しいと感じる部分もありましが、基礎からしっかりと指導していただきました。
ホームページを作成する際、HTMLやCSSに最初のうちは慣れずに煩わしさを感じることもありました。慣れれば色々と試してみたくなり、イメージ通りに仕上がれば達成感がありました。

私の配属先は人事課でした。
人事課では人事から契約書の作成までいろいろな仕事がありますが、これら庶務の仕事と並行して、AIに関する研修も受けました。
特に人事に関して当社の業務を知る必要があるため、実践を兼ねて自然言語処理にも取り組みました。

■6月から8月  研修と実践
AI テキストマイニング(形態素解析・構文解析)

1.取り組み
(1)Python3の研修について
主として、書籍を通して学習しました。Pythonの特徴として、プログラムの読みやすさがあげられ、一番はじめに学ぶのに最もよい言語とも云われています。

(2)開発環境構築について
Anacondaを利用
Anaconda:科学計算のためのPython及びR言語の無料のオープンソースディストリビューション(色々な便利ツールをひとまとめにしたもの)です。
Anacondaには、Python本体だけでなく機械学習や科学計算でよく使うライブラリがまとめられています。

(3)ライブラリについて
使い方と適用一例

NumPy 配列やベクトルなど、数値計算を行う為のライブラリ
SciPy 科学計算の為のライブラリ
Matplotlib グラフを描画する際に使うライブラリ
Pandas データ解析の為のライブラリ
scikit-learn 機械学習用のライブラリ

(4)データの処理について
データ分析・AIは課題に応じてデータ収集、データ前処理、、モデルの構築、入力・分析、検証、学習という工程をたどります。これは、テキストマイニングもデータマイニングと同じです。

(5)実際の開発について
国語の自動採点を目標とし、自然言語処理に挑戦しました。

プログラミング言語に対して、人間が扱う言語を自然言語といいます。その自然言語を機械で処理することを自然言語処理といいます。
自然言語処理は、形態素解析→構文解析→意味解析→文脈解析の流れがあります。

形態素解析とは、文法や単語の品詞情報をもとに、文章を形態素(意味を持つ最小単位)に分けることです。単に単語を切り出すだけではなく、その語の品詞や活用・語尾変化、語幹、終止形などの情報を得ることができます。
また、英語のように、言葉の区切りに空白を入れる書き方を分かち書きといいます。

日本語形態素解析ツールMeCabを用いています。
Windows版に含まれている、コンパイル済みのIPA辞書を使用しました。
得られる品詞情報は以下の通りです。
品詞, 品詞細分類1, 品詞細分類2, 品詞細分類3, 活用型, 活用形, 原形, 読み, 発音
例:日本 名詞,固有名詞,地域,国,*,*,日本,ニッポン,ニッポン

構文解析は、主語と述語の関係や目的語と述語の関係などの文法的な構造を分析します。係り受け解析とも呼ばれ、単語間の関係性についての解析を行います。
使用したツールは、日本語係り受け解析器CaboChaです。

意味解析以降は、高次な分野であり非常に難しい問題を含んでいます。単語の意味は一意には決まらないところがあります。複数の意味から、他の単語間のつながりなどを考慮して適切な一つを選ぶ必要があるなど難しいところが多くあります。

多くの文章(生徒別の解答)が与えられたとき、文章をいくつかのカテゴリに分類し、さらに、文章の中にある単語に分解して単語の出現頻度のみに着目して、文章をいくつかのカテゴリに分類する方法に潜在意味解析( Latent Semantic Analysis:LSA)があります。
最初、クラスタリングや主成分分析を使いましたが上手くいきませんでした。

潜在意味解析の問題点を解決する方法として、トピックモデルが注目を集めています。
潜在意味解析(LSA)に実装されている gensim を使いました。
gensimはトピック分析を可能にするPython3に実装されているライブラリです。
トピックとは文章の中にある主題で、文によって陳述される中心的対象をいいます。

分析結果は完璧ではありませんが、各々の生徒が提出した解答に対しておおよその評価点がつけられており成果を上げられました。

2.私の感想
私は文系学部の出身で人事課の配属でしたが、人事は庶務と同時に人に関わるお仕事をするため、当社の業務内容、特に開発についてより詳しく知る必要があったため、人事のお仕事と並行して、AIの研修に入りました。自分がプログラミングを学ぶことになったときは不安を覚えました。しかしながら数ヶ月間携わってみると、拙いながらも、何とか自分でもプログラムを書くことができるようになりました。
今後は学んだことをしっかりと自分のものにしていきたいと思っています。

会社説明会のご案内 - 2021年3月度予定

終了しました。

3月の会社説明会開催予定
開催日時:

時間
2020年3月23日(月) 16時~17時30分     満 室
2020年3月28日(土) 10時~11時30分     満 室

募集職種
先端IT領域:データ分析・AI(人工知能)
従来型IT領域:システム(ソフトウェア)開発

募集対象
2021年3月に卒業予定の方または2021年4月1日までに入社可能な方
データ分析・AIまたはシステム開発の仕事にご興味のある方

募集学科
理系・文系、学部学科・専攻は問いません。

会社説明会では、弊社の魅力・強み・面白さと第4次産業革命への取り組みなどお伝えします。
皆様の不安や疑問を解消できるよう、ざっくばらんにお話しさせていただきますのでお気軽にお越しください。
お会いできる日を楽しみにしています!

▼会社説明会プログラム

1.会社紹介
・当社の事業紹介
・仕事に必要なスキルとは何か?如何にしてスキルを身につけるか?
・第4次産業革命における取り組みとデータ分析・AIの開発最前線
2.福利厚生&教育研修(弊社の技術研修の強み(有効性))
3.社員の素顔とひと言、社風と文化
4.質疑応答

■持ち物
筆記用具

■服 装
会社説明会のため自由な服装でお越しください。

— 新型コロナウィルス 対応についてのお願い! —
咳・くしゃみ、体温が37.5度以上ある方、さらに、風邪のような症状がある方についても会社説明会へのご参加を遠慮くださいますようお願い申し上げます。
会場の出入り口には消毒液をご用意していますので出入りされる場合には必ずご使用ください。
————————————————

会社説明会は予約制です。
下記サイトから事前にお申し込みください。

マイナビ(2020年3月1日から) マイナビ2021
当社お問合せから

よくあるご質問
どの程度のプログラミングスキルが必要ですか? と
よく問われますが、入社前時点でのプログラミングスキルはなくても問題はありません。
また、学生時代にプログラミングを学んでいなくても結構です。
なぜなら、プログラミングはアルゴリズムを書くことができれば言語に置き換えることで書けます。
人間は普段意識しないでアルゴリズムを考えていることもよくあります。
言語には言語の特徴があるのでそれをつかまえれば大丈夫です。
そのような理由から情報系科目を専攻されていなくても全く問題はありません。

データ分析・AI分野およびシステム開発分野で必要な素養は
特に分析・AIでは「理解力」と「論理的思考力」です。表現を変えると「読解力」と「数学力」です。
数学といっても教養課程で学んだ線形代数や解析、統計などの基礎数学です。
基礎的な知識があれば機械学習などは入社後に吸収していくことができます。
システム開発も「理解力」と「論理的思考力」ですが、システム開発の場合は数学力というよりは「論理的思考」そのものです。
その他にもいろいろありますが、それらは入社後に身につけていけばよいものばかりです。

所在地および連絡先 〒700-0901 岡山市北区本町3番13号 イトーピア岡山本町ビル
事業内容 システムコンサルティング
データ分析(ビッグデータ)・人工知能の製品開発
ソフトウェア開発
自社製品の製造販売
・・勤怠管理システム(クラウド、オンプレミス)