Skip to content

書籍『Pythonでゼロからはじめる視覚化』のレポジトリ

Notifications You must be signed in to change notification settings

hima2b4/Python_visuallization_lesson

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

58 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Python_visuallization_lesson

書籍『Pythonでゼロからはじめる視覚化 ~Google Colabですぐに簡単に~』 で使用するNotebookと関連資料をアップしています。

image

株式会社C&R研究所 書籍紹介ページ


FAQ

  • PairPlot の実行エラーを回避する方法:20230307追加

 scikit-learn の Ver.up により、実行時にエラーが出ることがわかりました。scikit-learn をVer.指定してインストールすれば、エラーは回避できます。

  • 以下のコードをNotebookのセルに追加して実行してください。(コード追加の位置やエラー内容は以下を参照下さい)
  • ※ scikit-learnを追加インストールするタイミングにより、挙動が異なるようです。Notebookメニューの[ランタイム] → セッションの管理 → アクティブなセッションをすべて終了(ゴミ箱マーククリック)→ 「1. インストール」のセルに「!pip install scikit-learn==1.1.3」を追加 → 最初のセルから順に起動 してください。
!pip install scikit-learn==1.1.3
コード追加の位置(画像キャプチャ)

combine_images (1).jpg

  • 以下のように [RESTART RUNTIME]ボタン が表示された時は、ボタンを押して、データの読込みも再度実行してください。 image
エラー内容
ImportError Traceback (most recent call last) in 2 3 ----> 4 from seaborn_analyzer import CustomPairPlot 5 6 cp = CustomPairPlot()
1 frames
/usr/local/lib/python3.8/dist-packages/seaborn_analyzer/custom_class_plot.py in
5 import pandas as pd
6 from scipy import stats
----> 7 from sklearn.metrics import auc, plot_roc_curve, roc_curve, RocCurveDisplay
8 from sklearn.model_selection import KFold, LeaveOneOut, GroupKFold, LeaveOneGroupOut
9 from sklearn.preprocessing import label_binarize

ImportError: cannot import name 'plot_roc_curve' from 'sklearn.metrics' (/usr/local/lib/python3.8/dist-packages/sklearn/metrics/init.py)
上記のコード追加したNotebookのLink
内訳     Link(クリックで起動)
Pythonで視覚化①.ipynb (scikit-learn 1.1.3 追加Ver) Open In Colab
Pythonで視覚化②.ipynb (scikit-learn 1.1.3 追加Ver) Open In Colab
Pythonで視覚化③.ipynb (scikit-learn 1.1.3 追加Ver) Open In Colab
Pythonで視覚化[Multi編].ipynb (scikit-learn 1.1.3 追加Ver) Open In Colab

■CHAPTER 01 Pythonによる視覚化

 下の▶ をクリックすると、CHAPTER 01 掲載の ローズダイヤグラム(COLUMN DIAGRAM OF THE CAUSES OF MORTALITY)が確認できます。

ローズダイヤグラム(Wikipediaより)

■CHAPTER 02 ノーコードではじめるグラフ描画

 CHAPTER 02 で、最初に使用する Notebook は、次の通りです。

Notebook(クリックで起動)     使用データセット データ内容
Pythonで視覚化①.ipynb Occupancy_detection :binary 部屋の温湿度やCO2と人の存在の時系列データ
下の▶ をクリックすると、上記データセットで描いたpairplot が確認できます。 
Occupancy_detection データセットで描いたpairplot

image.png


 CHAPTER 02 で、2番目に使用する Notebook は、次の通りです。

Notebook(クリックで起動)          使用データセット    データ内容
Pythonで視覚化②.ipynb wine :classification イタリアの同じ地域で栽培された3種類の異なるワインの化学分析の結果に関するデータ
下の▶ をクリックすると、上記データセットで描いたpairplot が確認できます。 
wine データセットで描いたpairplot

image.png


 CHAPTER 02 で、3番目に使用する Notebook は、次の通りです。

Notebook(クリックで起動)   使用データセット データ内容
Pythonで視覚化③.ipynb Titanic(seaborn) :binary タイタニック号の乗客の生死に関する二値分類データ
下の▶ をクリックすると、上記データセットで描いたpairplot が確認できます。
Titanicデータセットで描いたpairplot

image.png


■CHAPTER 03 Pythonでグラフを描くプログラム

下の▶ をクリックすると、COLUMN掲載の Pythonで描いたローズダイヤグラムが確認できます。
Pythonで描いた COLUMN DIAGRAM OF THE CAUSES OF MORTALITY

APRIL1854~MARCH1855 image.png APRIL1855~MARCH1856 image.png


■CHAPTER 04 実務で活かすためのテクニック

 CHAPTER 04 で、最初に使用する Notebook は、次の通りです。

Notebook(クリックで起動)         使用データセット データ内容
Pythonで視覚化[Multi編].ipynb Boston_housing: regression 1970年代後半におけるアメリカのボストンにおけるある区画の住宅価格に関するデータ
下の▶ をクリックすると、CHAPTER 04掲載の 変数とグラフとライブラリの組み合わせ表 が確認できます。
変数とグラフとライブラリの組み合わせ表

image.png

下の▶ をクリックすると、上記データセットで描いたpairplot が確認できます。
Boston_housing データセットで描いたpairplot 

image.png


 CHAPTER 04 で、2番目に使用する Notebook は、次の通りです。

Notebook(クリックで起動)            使用データセット データ内容
Pythonで視覚化[Dataprep編].ipynb Loan_prediction :binary 住宅ローンを取り扱う会社が管理する「ローン申請者の情報」と「ローン承認の是非」に関するデータ

■CHAPTER 05 データクリーニングのテクニック

 CHAPTER 05 で使用する Notebook は、次の通りです。

Notebook(クリックで起動)         使用データセット データ内容
Pythonで視覚化[Preparation編].ipynb Titanic(seaborn) :binary タイタニック号の乗客生死に関する二値データ
下の▶ をクリックすると、CHAPTER 05 掲載の 決定木画像 が確認できます。
CHAPTER 05 掲載の決定木画像

Titanicデータ(木の深さ:3) image.png Titanicデータ(木の深さ:5) image.png Boston-housingデータ(木の深さ:3) image.png


■CHAPTER 06 機械学習モデルの最適化

下の▶ をクリックすると、CHAPTER 06 掲載の 決定木画像 が確認できます。
CHAPTER 06 掲載の決定木画像

最適条件で描いた決定木(Titanicデータ) image.png 予測結果を表示した決定木(Titanicデータ) image.png 最適条件で描いた決定木(Boston-housingデータ) image.png


■APPENDIX Google ColabのForms機能について

 APPENDIX 記載内容を実行する Notebook は、次の通りです。

Notebook(クリックで起動)        内容
Google_Colab_Forms_適用例.ipynb 正規分布確率を算出するプログラム に Google Colab の Forms機能 を適用した例です。

About

書籍『Pythonでゼロからはじめる視覚化』のレポジトリ

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published