書籍『Pythonでゼロからはじめる視覚化 ~Google Colabですぐに簡単に~』 で使用するNotebookと関連資料をアップしています。
- PairPlot の実行エラーを回避する方法:20230307追加
scikit-learn の Ver.up により、実行時にエラーが出ることがわかりました。scikit-learn をVer.指定してインストールすれば、エラーは回避できます。
- 以下のコードをNotebookのセルに追加して実行してください。(コード追加の位置やエラー内容は以下を参照下さい)
- ※ scikit-learnを追加インストールするタイミングにより、挙動が異なるようです。Notebookメニューの[ランタイム] → セッションの管理 → アクティブなセッションをすべて終了(ゴミ箱マーククリック)→ 「1. インストール」のセルに「!pip install scikit-learn==1.1.3」を追加 → 最初のセルから順に起動 してください。
!pip install scikit-learn==1.1.3
エラー内容
ImportError Traceback (most recent call last)
in
2
3
----> 4 from seaborn_analyzer import CustomPairPlot
5
6 cp = CustomPairPlot()
1 frames
/usr/local/lib/python3.8/dist-packages/seaborn_analyzer/custom_class_plot.py in
5 import pandas as pd
6 from scipy import stats
----> 7 from sklearn.metrics import auc, plot_roc_curve, roc_curve, RocCurveDisplay
8 from sklearn.model_selection import KFold, LeaveOneOut, GroupKFold, LeaveOneGroupOut
9 from sklearn.preprocessing import label_binarize
ImportError: cannot import name 'plot_roc_curve' from 'sklearn.metrics' (/usr/local/lib/python3.8/dist-packages/sklearn/metrics/init.py)
上記のコード追加したNotebookのLink
下の▶ をクリックすると、CHAPTER 01 掲載の ローズダイヤグラム(COLUMN DIAGRAM OF THE CAUSES OF MORTALITY)が確認できます。
ローズダイヤグラム(Wikipediaより)
CHAPTER 02 で、最初に使用する Notebook は、次の通りです。
Notebook(クリックで起動) | 使用データセット | データ内容 |
---|---|---|
Pythonで視覚化①.ipynb | Occupancy_detection :binary | 部屋の温湿度やCO2と人の存在の時系列データ |
下の▶ をクリックすると、上記データセットで描いたpairplot が確認できます。
CHAPTER 02 で、2番目に使用する Notebook は、次の通りです。
Notebook(クリックで起動) | 使用データセット | データ内容 |
---|---|---|
Pythonで視覚化②.ipynb | wine :classification | イタリアの同じ地域で栽培された3種類の異なるワインの化学分析の結果に関するデータ |
下の▶ をクリックすると、上記データセットで描いたpairplot が確認できます。
CHAPTER 02 で、3番目に使用する Notebook は、次の通りです。
Notebook(クリックで起動) | 使用データセット | データ内容 |
---|---|---|
Pythonで視覚化③.ipynb | Titanic(seaborn) :binary | タイタニック号の乗客の生死に関する二値分類データ |
下の▶ をクリックすると、上記データセットで描いたpairplot が確認できます。
下の▶ をクリックすると、COLUMN掲載の Pythonで描いたローズダイヤグラムが確認できます。
CHAPTER 04 で、最初に使用する Notebook は、次の通りです。
Notebook(クリックで起動) | 使用データセット | データ内容 |
---|---|---|
Pythonで視覚化[Multi編].ipynb | Boston_housing: regression | 1970年代後半におけるアメリカのボストンにおけるある区画の住宅価格に関するデータ |
下の▶ をクリックすると、CHAPTER 04掲載の 変数とグラフとライブラリの組み合わせ表 が確認できます。
下の▶ をクリックすると、上記データセットで描いたpairplot が確認できます。
CHAPTER 04 で、2番目に使用する Notebook は、次の通りです。
Notebook(クリックで起動) | 使用データセット | データ内容 |
---|---|---|
Pythonで視覚化[Dataprep編].ipynb | Loan_prediction :binary | 住宅ローンを取り扱う会社が管理する「ローン申請者の情報」と「ローン承認の是非」に関するデータ |
CHAPTER 05 で使用する Notebook は、次の通りです。
Notebook(クリックで起動) | 使用データセット | データ内容 |
---|---|---|
Pythonで視覚化[Preparation編].ipynb | Titanic(seaborn) :binary | タイタニック号の乗客生死に関する二値データ |
下の▶ をクリックすると、CHAPTER 05 掲載の 決定木画像 が確認できます。
下の▶ をクリックすると、CHAPTER 06 掲載の 決定木画像 が確認できます。
APPENDIX 記載内容を実行する Notebook は、次の通りです。
Notebook(クリックで起動) | 内容 |
---|---|
Google_Colab_Forms_適用例.ipynb | 正規分布確率を算出するプログラム に Google Colab の Forms機能 を適用した例です。 |