Department of Data Science
■学科案内 |
公式な案内とは違ってQ&A形式で特に高校生のために学科の解説をします。
「データサイエンス学科」はデータサイエンスを勉強する学科ですが、 データサイエンスとは何でしょうか? 広い意味ではビッグデータについての文理融合型のデータ科学の領域を指すことがありますが、狭い意味では数理技術を中心とした領域を指します。
南山大学理工学部のデータサイエンス学科は理系に特化していますので、狭い意味に近いものとなります。 もちろん、応用として文系の学問領域に展開することもありますが、 あとで述べるデータサイエンティストの領域は広すぎるので理系の部分にしっかり取り組むことを目指しています。 一般入試では数IIIも課していますので、理系の勉強をしっかり進めてきてください。
データサイエンスに関わる用語として データサイエンティスト、機械学習についてはあとで説明していきます。
情報化社会とよく言われますが、それは具体的にどのような社会だと思っていますか? 端的に言うと「情報がたくさんあって、その情報を上手に活用して成り立っている社会」といったところでしょうか。
まず前半の「たくさんの情報の入手」について考えてみましょう。
みなさんもインターネットに接続してたくさんの情報に接することがあるでしょう。
情報の入手に関しては誰でも手軽に行えるようになってきています。
だからといってみなさんがインターネットの仕組みやコンピュータの仕組みを理解しているわけではないでしょう。
情報化社会の根幹をなす情報ネットワークの整備は普通の人には難しい様々な技術を含んでいます。
同じ学部内の「ソフトウェア工学科」ではそこに関わる勉強をするわけです。
また、モノづくりにおいて入手できる情報も広がっています。
自動計測が普及し絶え間なく多くの情報を入手することが可能になっています。
同じ学部内の「電子情報工学科」や「機械システム工学科」ではそこに関わっています。
こういった情報がデータという形で世の中にあふれかえっています。
いわゆるビッグデータですね。
一方、後半の「情報の上手な活用」というのはどういうことでしょうか? データはただ眺めているだけで分かることも色々ありますが、普通は何らかの分析を行わないとそこに意味を見いだすのは困難です。 特にビッグデータと呼ばれる膨大なデータになるとデータを眺めるだけでも困難となります。 データサイエンス学科はコンピュータと数学を駆使してデータの分析を行い、 現実と理論をつなぐ数理技術の方法を勉強をするところです。 データサイエンス学科は3つの分野 「OR(オペレーションズ・リサーチ)」「統計学」「情報数学」から成り立っています。
また、現実のモノづくりでは、分析結果に基づき工学的・物理的なアプローチも必要です。 それを行うのが同じ学部内の電子情報工学科、機械システム工学科や ソフトウェア工学科の応用技術です。
データサイエンス学科は数学、ソフトウェア工学科はコンピュータ、電子情報工学科や機械システム工学科は物理の中のそれぞれの分野を勉強するところと分けて考える人がいます。 しかし、上で説明したように4つの学科は密接に関連しています。そのため学部の共通科目として 数学とコンピュータと物理を習い、その上でそれぞれの学科の科目を学習する構成になっています。 さらに、それぞれの学科に進んでからでもオーバーラップする部分はあります。 研究室によってはデータサイエンス学科でプログラミングをすることもありますし、 ソフトウェア工学科や機械システム工学科で確率的なモデルを用いて分析することもあります。
前の理工学部では学科別入試のため独立している感じが強かったですが、 新しい理工学部では副専攻も学ぶことになったため、 より他の学科との結びつきが強くなりました。 共通科目をよく学んだ上で自分の学科や副専攻に進んでもらいたいです。 コンピュータや機械にしか興味がないという人でも分析する方の魅力に気づくことがあると思いますし、 もちろんその逆もありえます。 学科の垣根を越えて広く知識を得ることは 卒業した後社会人になって大きな意味を持ってくるでしょう。
新しい理工学部では先に述べたように自分の学科以外に副専攻と呼ばれる他学科の分野を 指定された単位数修得することになっています。 副専攻は2年生に上がるときに決定しますが、副専攻としての他学科の説明を行います。
ソフトウェア工学は文字通りプログラミング技術を学ぶ所ですが、 新しい理工学部では機械学習などデータサイエンス学科でも 学ぶことをソフトウェア工学の視点から学ぶことができるようです。 また、世の中のあらゆるものにコンピュータが搭載されるのが普通になっており、 そういった組み込みシステムでのプログラムについても学ぶことができるでしょう。
電子情報工学はインターネットを代表とする情報インフラとしての 側面や、純粋に電子回路などの物理的側面があります。 昨今、IoTなど企業の電子情報に対する関心は高まっており、その基盤技術を学ぶことは重要です。 また、データサイエンス学科で得られる分析結果を活用するカーナビなどの情報機器への応用にも発展します。
機械システム工学は機械を上手に働かせるシステムについて研究する学問であり、その制御には数学が関わっているのでデータサイエンス学科で学ぶことが役立つ場面も多いでしょう。 数学は単独では世の中の役に立っているか分からない分野ですが、機械の制御を通して自律的産業ロボットや自動車の自動運転など身近な役立つ世界に広がります。
以上のように3つの副専攻はどれもデータサイエンス学科とのかかわりが深く、1年生のうちにそれぞれの分野に触れてみて自分に合ったものを選べばよいでしょう。
情報数学は理論としての根幹をなすもので純粋数学とその周辺を扱います。 残りの2つの分野はこれを中心としてそれぞれが得意とする分析対象に関わって広がっています。 数学そのものに興味を持った学生はそれを卒業研究とすることが もちろんできますし、ファイナンスへの応用など実際的な問題もあります。 進路としては、数学の教員を目指す人もいます。
OR(オペレーションズ・リサーチ)は世の中のシステムをいかに効率よくするか ということに関わっています。たとえば、高速道路の料金所の窓口はいくつ開けておくのが渋滞もなく人件費を節約できるのか、 救急車の受け持ち範囲はどのように区切れば一番長く待たせることになる人の時間を短縮できるかといった具体的な 応用がたくさんあります。企業でもこういった効率化をうまく取り入れたところほど効率的な経営ができるでしょう。
統計学はデータの中から意味のあることを探し出すのに大いに役立ちます。 メーカーでは新製品を開発する際に初めから希望したとおりの製品ができるわけではありません。 製品を検査してたくさんのデータが得られたとしても不良品がなぜ起こったのかという理由が 分からなければ意味がありません。ただ実験を繰り返すだけで製品を仕上げていくのは とても非効率です。データ解析が上手に行えることがメーカーの必要条件になってきています。 さらに、機械学習を通して分析することも多くなってきています。
3つの分野の具体的な内容は「背景画像って何?」でも紹介されています。
「データサイエンティスト」や「データアナリスト」は最近ニュースで聞かれるようになった言葉ですね。 ビッグデータの解析といった流れで耳にすると思います。 データサイエンス学科というとデータサイエンティストを目指すところと思われるでしょうから、それについて知っておくことは重要です。
まずデータアナリストですが、本学科で養成しようとしている能力の一つであるデータ分析力を持つ人材です。 統計学やOR(オペレーションズ・リサーチ)を駆使できる力を身に付けた人と言えるでしょう。 特に数学理論だけでなく実際のデータに対してアプローチできる人です。 本学科では実習の授業を通してそれらのことを学びます。 また、機械学習に関してもプログラミング技術とともにしっかり学びます。
次にデータサイエンティストですが、これはデータアナリストとしてのデータ分析力(データサイエンス力)だけでなく他に2つの能力を身につけた人と定義されています。
その2つとはIT力(データエンジニアリング力)とビジネス力です。
IT力に関しては理工学部の授業でプログラミングから培っていきますし、
特にデータ分析に関わるデータベースの扱いなどが必要とされていますが、
それも他学科の専門科目を受講すれば身につきます。
ビジネス力は直接的に理工学部の授業で学ぶことはできませんが、
情報倫理などいくつかのことは学びます。
他に興味のある人は経営学部などの授業を取りに行くことになるでしょう。
この3つの能力を備えた人材はそんなにいないので、現在はそれぞれの分野に長けた人がチームを組んで仕事をするのが普通となっています。 そのため、本学科の学生はまずデータ分析力を高めてそれが一流になるように務めて下さい。 特に本学科ではOR(オペレーションズ・リサーチ)にも力を入れていますが、 3つ能力を極めようとすると機械学習に力点が置かれ、ORが省かれることが多いので、ORに力を入れることは他とは違うデータ分析ができる強みとなります。 その上でできるだけIT力を付けていくとよいでしょう。 ビジネス力は無理して付ける必要はないと思います。 ただし、実物への応用という点では副専攻によって学ぶ部分が多いでしょう。
データサイエンスというと重要な方法論として「機械学習」という 言葉が耳に付くと思います。 そもそも機械学習とは何でしょうか?
機械学習という言葉を一般の人にも轟かせたのはご存じのように2016年にGoogleが囲碁のソフトで 世界的な棋士を打ち負かせたことでしょう。 そのソフトアルファ碁が用いたのは機械学習の中でも特に 優秀とされる深層学習(ディープラーニング)です。
機械学習とは元々人工知能(AI)を研究する中で生まれたもので、 ビッグデータから学習することで思考に近いものを生み出そうとした方法論であり、 数理技術の重要な手法です。 機械学習を簡単に述べると、 通常は教師データと呼ばれる原因と結果が合わさったデータを用いて学習し、 その分析を元に原因だけから結果を予測する方法です。 (どのように学習するのかとかどのように予測するのかで多種多様な方法が提案されているわけですが、ここでは置いておきます。) 深層学習(ディープラーニング)では、さらに教師データがなくても 自ら学習して強くなる仕組みを備えているため、人が思いつかないような結果でも生み出せるようになりました。
注意してもらいたいのは機械学習が得意とするのは白黒のはっきりした問題であって 万能ではないということです。 人の力がもう要らないということはありません。ただ簡単なものごとはコンピュータに任せた方がよいという時代は来るでしょう。 データサイエンティストの仕事はコンピュータを上手に使うことではなく、 人にしかできないアプローチを見いだして道を作っていくことです。 そういったなくてはならない人材を目指してください。