Aコース データサイエンス 『基礎コース』
データサイエンス
『基礎コース』アイコン

データサイエンティストが必要とされる知識・スキルを習得するためのコース。データを価値に変換する際に必要な5つのプロセスである「課題設定力」「データサイエンス全体俯瞰能力向上」「データ収集・統合」「データ分析」「データ解釈」を、Eラーニングや大学講義を通じて学ぶことができます。

修了要件

Aコース科目(単位互換協定科目、e-Learning科目)から5単位を取得した受講生には、「基礎コース修了証」を発行します。 ※詳細についてはお知らせの「Aコース修了要件について」をご確認下さい。

構成科目

科目分類
科目名
開講大学
単位数
開講区分
統計学
確率的グラフィカルモデルと因果推論受付中
大阪大学
2
e-Learning
開講時期
2022年10月1日 ~ 2023年3月31日
概要
機械学習の分野のひとつ、確率的グラフィカルモデルと因果推論について学ぶ。 (1) 機械学習に必要な数学的ロジックを構築する (2) 機械学習の処理をスクラッチから、プログラミングできるようにする 1. イントロダクション、応用事例 2. 条件付き独立性, 確率的グラフィカルモデル 3. データ圧縮 4. 相互情報量の推定 5. データから森を構築する 6. データからベイジアンネットワークを構築する 7. 変数が離散の場合 8. パタメータの事前分布 9. 変数が連続の場合 10. PCアルゴリズム 11. LINGAM 12. chodalグラフ 13. 確率推論のNP完全性 14. 推論アルゴリズムと統計物理 15. グラフィカルLasso
プログラミング
機械学習の数理 with R/Python受付中
大阪大学
2
講義
開講時期
2022年10月1日 ~ 2023年3月31日
概要
機械学習は、1990年代後半から統計学の手法と結びつき、現在は統計的機械学習として、人工知能の中心的な技術として開花している。本講義では、(統計的)機械学習の基本概念を、正しく理解することが目的である。実際、入力と出力の間の関係を原理のレベルから理解しないと、分析結果の意味を正確に把握することは難しい。本講義では、whatを漠然と学習するのではなく、項目を最低限のものにしぼり、whyを数学的に解決しながら、最も理路整然とした状態の機械学習を脳裏に形成していく。無論、理論だけで終わるものではなく、同時に受講する演習科目で具体的に手を動かしていき、最後に実データに関する分析のプレゼンテーションを行う。 学習目標/Learning Goals (1) 機械学習の方法のそれぞれについて、なぜそうしないといけないのかを理解する。 (2) 証明を見るまでは納得しない、という粘り強さを身につける。 履修条件・受講条件/Requirement / Prerequisite 演習科目である「情報数理B」を履修すること。本講義では、理論的な説明をメインに行い、プログラミング演習等は、主として情報数理Bで行う。 授業計画/Class Plan 1. 線形回帰(1) 2. 線形回帰(2) 3. 線形回帰(3) 4. 分類 5. リサンプリング 6. 情報量基準(1) 7. 情報量基準(2) 8. 正則化 9. 非線形(1) 10. 非線形(2)  11. 決定木 12. サポートベクトルマシン 13. 教師なし学習 14. 最近の話題 15. 最終のプレゼンテーション
統計学
多変量解析受付中
大阪大学
2
講義
開講時期
2022年10月1日 ~ 2023年3月31日
概要
多変量解析は互いに関連した複数個の観測項目のデータ(多変量データ) から,項目間の因果関係を検討したり,内部構造を解明したりするための統計的方法論である.本講義では,まず,多変量解析の各種手法が理解できるための数理的基礎を固める.  つづいて,多くの統計分析手法の基礎となる回帰分析を講述する.実際例と注意すべき点,変数選択や数理的基礎を紹介する.次に,任意の統計モデルにおいて生じる欠測値問題を講述する. 学習目標/Learning Goals 多変量解析の分析技法は多岐にわたり,講義内で学ぶものは限られる.そこで本講では,まず,数理的に共通な事柄を集中的に学習することにより,多くの必要な分析技法を自習できるようになる.いくつかの実データの解析事例を通して,受講生が適切に統計分析できるようになる. 履修条件・受講条件/Requirement / Prerequisite 初等統計学,線形代数学と初等解析学の知識があることが望ましい.
統計学
データ科学のための数理受付中
大阪大学
2
講義
開講時期
2022年10月1日 ~ 2023年3月31日
概要
社会のデジタル化が進むにつれて、日常生活・産業構造・ビジネスモデルが劇的に変わろうとしています。その駆動力の中核がビッグデータや人工知能です。これからの社会では、その基盤となる数理・データサイエンス・人工知能の知識・思考法を身に付けることが求められます。本講義では、データサイエンス、データエンジニアリング、AIに関する広い基礎知識・技術を身に付けることを目標とします。 学習目標/Learning Goals データ駆動型社会においてデータサイエンスを学ぶことの意義を理解する。 データを収集・処理・蓄積するための技術の概要を理解する。 AIの変遷と機械学習の方法論を理解する。
統計学
データ科学と意思決定受付中
大阪大学
2
講義
開講時期
2022年10月1日 ~ 2023年3月31日
概要
我々の日常の営みは意思決定の連続です.また,医療診断,株式投資,企業判断そして政策立案など様々な社会活動において,適切な意思決定のあり方が問題とされます.本講義では,データ科学の理論的な枠組みから意思決定プロセスをモデル化する方法,および脳認知科学の知見を踏まえたヒトの意思決定の特性を講述し,よりよい意思決定を導くための方略について議論します. 学習目標/Learning Goals 意思決定をデータ科学の観点から説明できるようになる.ヒトの意思決定における合理的規範からの逸脱について説明できるようになる.そして,状況に応じた最適な意思決定方略のモデルを構築できるようになる.
数理モデル
工学への数値シミュレーション受付中
大阪大学
2
講義
開講時期
2022年10月1日 ~ 2023年3月31日
概要
有限要素法は理工学分野で広く使われている数値計算手法です.前期【総合】「数値シミュレーションの基礎」では,その基本的な数学背景と無償のソフトウェアFreefem++を用いたプログラミング及び数値シミュレーションを行いました.本講義では,主に数値シミュレーション結果に対して,数理・データサイエンス・AIの技術を駆使して解析を試みます. 学習目標/Learning Goals 有限要素法を用いて,流体力学の基礎方程式であるNavier-Stokes方程式の数値計算結果に対して,数理・データサイエンス・AIの技術を駆使して解析を試みます.受講生の達成具合を見ながら,線形安定性解析,Snapshot POD,DMD,レザバーコンピューティング等を体験します.
機械学習
機械学習の実践受付中
大阪大学
2
講義
開講時期
2022年10月1日 ~ 2023年3月31日
概要
確率論と情報理論に基づいた機械学習の理論を学ぶ。画像解析、時系列解析、教師なし学習などに用いられる深層学習(ディープラーニング)のモデルについて学ぶ。 学習目標/Learning Goals 確率モデルと機械学習の関わりについて理解し、説明できる。ディープラーニングの応用を概説できる。
機械学習
スパース推定の数理と機械学習への応用受付中
大阪大学
2
e-Learning
開講時期
2022年10月1日 ~ 2023年3月31日
概要
機械学習の一分野、スパース推定を学ぶことによって、データサイエンスおよびRやPythonのプログラミングを習得し、ロジックを固める。線形回帰、一般化線形回帰、グループLasso、Fused Lasso、グラフィカルモデル、行列分解、多変量解析 1) 技術者として必要な、数学的ロジックを構築する (2) 種々の概念を抽象的(数学的)にも、具体的(プログラミング的)にもとらえられるようにする ノートパソコンを持参のこと。R言語を習得している場合はR言語、R言語Pythonをともに習得していない場合はPythonを https://utokyo-ipp.github.io/index.html などで独習する。 1. RおよびPythonの環境、線形回帰 2. LassoとRidge 3. elastic net、lambdaの値の設定 4. ロジスティック回帰 5. 多値のロジスティック回帰、ポアッソン回帰、生存時間解析 6. グループ数が1の場合、近接勾配法 7. 一般のグループLasso 8. Fused Lasso 9. LarsとLassoの双対問題 10. グラフィカルモデルとグラフィカルLasso 11. グラフィカルLassoの拡張、特異値分解 12. 行列分解 13. 主成分分析 14. クラスタリング 15. 最近の動向
情報学基礎
社会情報学終了
大阪公立大学
2
講義
開講時期
2022年9月26日 ~
概要
本授業は遠隔授業として実施します。各回の授業形態をよく確認して受講してください。 近年、社会現象を計算機で解析する手法の重要性が高まっている。特に、経済、政策、感染症等予測が困難な社会的事象を解析するためには、数理モデル化および計算機シミュレーションが必要となる。本講義では、社会における問題状況を数理モデルやプログラムで定式化するために、数理計画法や確率モデルとその解法を概説し、ゲーム理論やエージェントベースドシミュレーションにより解析する技法について学習する。
機械学習
深層学習終了
大阪公立大学
2
講義
開講時期
2022年9月26日 ~
概要
本授業は遠隔授業として実施します。各回の授業形態をよく確認して受講してください。 深層学習は深い階層構造を持つニューラルネットワークに関する学問領域である。まず、基礎となるニューラルネットワークの基本構造、学習アルゴリズム、目的関数、活性化関数、初期化方法、学習正則化などを学ぶ。続いて、言語、画像、音声、制御等の各種応用に特化した構造について学び、あわせて、実装のための各種ライブラリ、ハードウエア環境、構造を最適するための可視化、アテンションなどについても学習する。
機械学習
データサイエンス特論1終了
神戸大学
1
講義
開講時期
2022年11月22日 ~ 2022年11月25日
概要
第4次産業革命において、IoT、AI(人工知能)、ビッグデータの利用が鍵となり、データサイエンスが新しい学問分野として注目されている。 この講義では、データサイエンスの基礎である人工知能・機械学習の技術的側面について学ぶ。 下記の日程で行う予定である(各日のトピックについては変更の可能性あり)。予定変更の折には通知する。 2022年11月22日(火) 3限目:イントロ:機械学習とは何か?      自然言語処理 4限目:予測分析 5限目:処方分析、最適化 2022年11月24日(木) 3限目:異常検出 4限目:音声認識 2022年11月25日(金) 3限目: 画像認識 4限目:AI間交渉、まとめ 5限目:授業振り返り、予備 日本電気株式会社 データサイエンス研究所 上席主席研究員 森永聡(神戸大学数理・データサイエンスセンター客員教授)を中心として、同社の研究者による講義を行う。
情報学基礎
データサイエンス特論終了
大阪公立大学
2
講義
開講時期
2022年4月7日 ~
概要
本授業は遠隔授業として実施します。各回の授業形態をよく確認して受講してください。データ分析の実践に必要となる前処理、モデル選択と評価、機械学習について、その知識とアイディアを学習する。さらに、機械学習の代表的な枠組みであるベイズ学習、カーネル法、アンサンブル学習について詳しく学修する。
機械学習
機械学習特論終了
大阪公立大学
2
講義
開講時期
2022年4月7日 ~ 2022年8月31日
概要
本授業は遠隔授業として実施します。各回の授業形態をよく確認して受講してください。本授業では、機械学習の基礎理論を理解し、データ解析ツールとして正しく活用するための知識を養うことを目的とする。機械学習における教師あり学習、教師無し学習、強化学習に関して理解し、計算機上に実装する方法を解説する。また、機械学習手法の性能を評価するための指標についても解説する。
情報学基礎
データマイニング終了
大阪公立大学
2
講義
開講時期
2022年4月7日 ~ 2022年8月31日
概要
本授業は遠隔授業として実施します。各回の授業形態をよく確認して受講してください。データマイニングは、様々なデータ集合からヒトの意思決定に有益な情報を抽出する技術体系を総称している。本講義では、基盤となるいくつかのデータ解析法を講述し、実応用での課題解決における実践的発展の手段としての改良アプローチを計算機に実現するための種々の関連事項について学ぶ。
機械学習
スパース推定の数理と機械学習への応用終了
大阪大学
2
e-Learning
開講時期
2022年4月5日 ~
概要
機械学習の一分野、スパース推定を学ぶことによって、データサイエンスおよびRやPythonのプログラミングを習得し、ロジックを固める。線形回帰、一般化線形回帰、グループLasso、Fused Lasso、グラフィカルモデル、行列分解、多変量解析 1) 技術者として必要な、数学的ロジックを構築する (2) 種々の概念を抽象的(数学的)にも、具体的(プログラミング的)にもとらえられるようにする ノートパソコンを持参のこと。R言語を習得している場合はR言語、R言語Pythonをともに習得していない場合はPythonを https://utokyo-ipp.github.io/index.html などで独習する。 1. RおよびPythonの環境、線形回帰 2. LassoとRidge 3. elastic net、lambdaの値の設定 4. ロジスティック回帰 5. 多値のロジスティック回帰、ポアッソン回帰、生存時間解析 6. グループ数が1の場合、近接勾配法 7. 一般のグループLasso 8. Fused Lasso 9. LarsとLassoの双対問題 10. グラフィカルモデルとグラフィカルLasso 11. グラフィカルLassoの拡張、特異値分解 12. 行列分解 13. 主成分分析 14. クラスタリング 15. 最近の動向
統計学
情報幾何入門終了
大阪大学
2
講義
開講時期
2022年4月5日 ~
概要
情報幾何学は,確率分布の集まりが内包する自然な幾何構造の研究を源流とする比較的新しい研究分野である.情報幾何学は当初,統計学において輝かしい成功をおさめたが,物理学・情報理論・システム理論・神経回路網・数理生物学等の様々な分野においても確率分布族は中心的役割を果たすため,その適用分野は近年大きな広がりを見せている.本講義では,Mathematica を用いた実験数学的アプローチを併用することにより,情報幾何学への新たな入門を試みる. 実験数学2レベルの Mathematica の知識があることが望ましいが,必須ではない. 1. 情報幾何学とは? 2. Euclid平面の幾何(1)曲線座標系 3. Euclid平面の幾何(2)ベクトル場の共変微分 4. 多様体の基礎 5. 多様体のアファイン接続(1)共変微分と平行移動 6. 多様体のアファイン接続(2)曲率・捩率と平坦性 7. 双対アファイン接続 8. 双対平坦多様体 9. 確率分布空間の幾何構造 10.【Mathematica 演習】確率単体と独立分布多様体 11.【Mathematica 演習】e-, m-測地線と一般化Pythagorasの定理 12.【Mathematica 演習】機械学習の情報幾何(1):多層パーセプトロンの学習 13.【Mathematica 演習】機械学習の情報幾何(2):Boltzmann machineの学習 14. まとめと総合演習(1) 15. まとめと総合演習(2)
統計学
数理統計入門終了
大阪大学
2
講義
開講時期
2022年4月5日 ~
概要
統計解析の基礎となる統計的推定論及び統計的検定論を測度論を用いて解説する。 さらに統計的漸近理論について概説する。 測度論および確率・統計の基礎知識があること。 【講義内容】 1. 統計モデル 2. 不偏推定量と一様最小分散不偏推定量 3. フィッシャー情報量 4. クラーメル・ラオの不等式 I 5. クラーメル・ラオの不等式 II 6. 完備十分統計量I 7. 完備十分統計量II 8. モーメント法と最尤法 9. 統計的仮説検定 I 10. 統計的仮説検定 II 11. 検定における2種類に誤り 12. ネイマン・ピアソンの基本補題 13. 統計的漸近理論 I 14. 統計的漸近理論 II 15. 統計的漸近理論 III
統計学
確率的グラフィカルモデルと因果推論終了
大阪大学
2
e-Learning
開講時期
2022年4月5日 ~
概要
機械学習の分野のひとつ、確率的グラフィカルモデルと因果推論について学ぶ。 (1) 機械学習に必要な数学的ロジックを構築する (2) 機械学習の処理をスクラッチから、プログラミングできるようにする 1. イントロダクション、応用事例 2. 条件付き独立性, 確率的グラフィカルモデル 3. データ圧縮 4. 相互情報量の推定 5. データから森を構築する 6. データからベイジアンネットワークを構築する 7. 変数が離散の場合 8. パタメータの事前分布 9. 変数が連続の場合 10. PCアルゴリズム 11. LINGAM 12. chodalグラフ 13. 確率推論のNP完全性 14. 推論アルゴリズムと統計物理 15. グラフィカルLasso
機械学習
カーネルの機械学習への応用終了
大阪大学
2
e-Learning
開講時期
2022年4月5日 ~
概要
機械学習のためのカーネルの数理について学び、最後に深層学習への応用を議論する。最初に、カーネルの理解に必要な数学(関数解析)を理解し、カーネル回帰、サポートベクトルマシン、スプライン、主成分分析、独立性検定、因果推論などの応用事例をプログラムで実行させて理解する。 (1) 技術者として必要な、数学的ロジックを構築する (2) 種々の概念を抽象的(数学的)にも、具体的(プログラミング的)にもとらえられるようにする 1. 正定値カーネル 2. Bochnerの定理 3. Hilbert空間 4. 線形作用素 5. コンパクト作用素 6. 再生核ヒルベルト空間 7. Mercerの定理 8. カーネル計算の実際 9. 計算量の低減 10. MMD 11. HSIC 12. 特性カーネル、普遍カーネル、経験過程 13. 深層学習の表現 14. 深層学習における汎化 15. 深層学習における最適化
統計学
ビッグデータ解析終了
大阪大学
2
講義
開講時期
2022年4月5日 ~
概要
データマイニング技術を構成する多次元データ分析,相関ルールマイニング,クラスタリング,グラフマイニング,分類,推薦,異常検知に関するアルゴリズム,および分散環境におけるビッグデータ処理技術に関して学ぶ. アルゴリズムとデータ構造に関する基本的な知識およびプログラミングに関する一般的な知識は必要. 第1回目 ビッグデータ技術の最新動向と適用事例1 第2回目 ビッグデータ技術の最新動向と適用事例2 第3回目 多次元データ分析(OLAP分析) 第4回目 相関ルールマイニング1 第5回目 相関ルールマイニング2 第6回目 クラスタリング1 第7回目 クラスタリング2 第8回目 分類1 第9回目 分類2 第10回目 分類3 第11回目 グラフ分析1 第12回目 グラフ分析2 第13回目 グラフ分析3 第14回目 異常検知 第15回目 推薦技術

注意事項