本記事ではデータサイエンスのCoursera講座を紹介します。
オススメの基準としてレビュー数が多く、評価が高いもののみに厳選しております。
Udemyの講座は個人によって開講されているものが多いですがCourseraの講座はスタンフォード大学やMeta、IBMなどの有名大学、企業によって開講されているため質の高いものが多いです。本格的にデータサイエンスを学びたいのであれば是非オススメです。
【IBM】データサイエンス、AI、開発のためのPython【★4.6】

内容の評価
- Pythonの基本文法
- 式
- 変数
- 文字列操作
- Pythonデータ構造
- リスト
- タプル
- 辞書
- セット
- Pythonプログラミングの基礎
- 条件分岐
- ループ
- 関数
- 例外
- クラスとオブジェクト
- Pythonでデータを扱う
- ファイル
- Pandas
- Numpy
- APIやデータ収集
- APIやHTTPの概説
- ウェブスクレイピング
5つのモジュールのうちの最初の3つはPythonの基礎文法を学びます。内容は他のPython入門と比較して容易な作りになっているようです。おそらくデータサイエンスを学ぶための最低限の知識に留めているのでしょう。
データ分析や統計解を始めたいのに、その前のプログラミングの基礎文法で挫折してしまわないつくりになっている点は評価できます。
そのあと、データ処理のライブラリで有名なPandasとNumpyを使用します。
最後、APIやHTTPの簡単な解説があったのちにウェブスクレイピングの解説があります。
ウェブスクレイピングとはWebサイトからデータを収集する技術です。ウェブスクレイピングを行うための前提としてAPIやHTTPなどWebアクセスへの理解が必須のためここで簡単に概要を学びます。
受講者のレビュー内容
プラス部分として
という声が挙げられています。無駄なく基礎を学べる点が評価されています。挫折したくない人にはオススメできるようです。
マイナス部分としては
という声があります。IBMが提供している講座なのでIBMクラウド上で課題を行う際にひと手間かかるようです。また、入門者向けなためタスクが単純過ぎるという意見もあります。もっと専門的に学びたい人は別のコースがオススメです。
まとめ
好みの問題ですがIBMクラウドをあまり使いたくないのであれば避けるべきです。またもっと専門性の高い講座を求める人も対象外ではないでしょう。
プログラミングをほとんど始めたばかり、かつ、データサイエンスの学習を始めたい方にとってはオススメの講座です。
【Stanford】教師あり機械学習回帰と分類【★4.9】

内容の評価
- 機械学習入門
- 機械学習とは
- 教師あり学習
- 教師なし学習
- 線形回帰
- コスト関数
- 勾配降下
- 線形回帰
- ベクトル化
- 特徴量のスケーリング
- 勾配降下の収束チェック
- 学習率の選択
- 特徴量工学
- 多項回帰
- 分類
- ロジスティック回帰
- ロジスティック回帰のコスト関数
- 過学習
- 正則化
アメリカの名門スタンフォード大学が開講しているコースです。講師はグーグル・ブレインやCourseraの創業者であるアンドリュー・ング先生です。
まず、機械学習の概要から始まりコスト関数や勾配降下など主要な概念を学びます。
教師あり学習で中心的な二つのテーマである、回帰と分類について学びます。
回帰は連続値を予測する際の手法、分類は0,1の値を予測する際の手法です。
次に線形回帰の手法として特徴量のスケーリング(正規化、標準化)、収束チェック、学習率の選択など線形回帰モデルのテクニックを学びます。これは線形回帰だけでなくディープラーニングや決定木などの他の機械学習の分野でも活かせる必須のテクニックです。
最後に、分類の手法を学びます。分類にはロジスティック回帰を用います。その中で過学習やその対策として正則化の方法について学習します。
受講者のレビュー内容
プラス評価としては
という声がありました。評価値も4.9と非常に高く受講者に好評です。
マイナス部分としては
という声がありました。Pythonプログラミングの内容は講座には含まれないので事前に別途履修する必要があります。
また、機械学習の掘り下げをもっとすべきとの意見もごく一部見られました。ただ、内容を見ると初学者にしては十分な内容が含まれているように思えます。この内容を物足りなく感じるのは非常に優秀な人のみで大抵の人は満足できる内容であるはずです。
まとめ
機械学習の入門として間違いなく最高のコースで、本格的にデータサイエンスを学びたいのであれば非常にオススメです。Pythonの基礎文法を学び終えたら是非受講してみてはいかがでしょうか。