アクセスカウンター

  • 113本記事閲覧者数   👀💡:
  • 50今日の足あと    🦶💮:
  • 47375サイト訪問者数(累計)🦶💡:

python 機械学習 プログラミング

【機械学習】【python】pythonでのデータ分析(LightGBM) ー銀行の顧客ターゲティング(1)【SIGNATE】ー

 

どうも、solobochiのbochiです。

 

SIGNATEの銀行顧客マーケティングデータ分析について、前回Rでの分析についてまとめたので、同様にpythonでのデータ分析(今回はLightGBM)についてまとめておきます。

 

【機械学習】【R】Rでのデータ分析(1) ー銀行の顧客ターゲティング【SIGNATE】ー

 

 



 

 

 

目次

    1. 概要
    2. データセット
    3. 前処理
    4. モデル構築
    5. 予測
    6. 評価

 

 

1.概要

データ分析コンテストで有名なKaggleの日本版とも呼ばれるSIGNATEのデータ分析問題を扱います。

 

  • 銀行の定期預金申込キャンペーンについてキャンペーンデータから結果(定期預金のために口座開設したか)を予測する

 

 

 

 

<背景と目的>

銀行の定期預金申込キャンペーンについて、その効果を測定したい。

具体的には、どのような顧客にどのようなアプローチでキャンペーンを打つとより効果的に定期預金申込に繋がるのかを分析したい。

そのためにキャンペーンデータから実際に定期預金申込に至るかどうかを予測するモデルを構築する。

 

 

 

2.データセット

 

使用するデータは、27,128名の顧客データとキャンペーンの結果(定期預金申込の有無)データ。

最終的にコンペで予測するのは、18,083名のキャンペーンに対する反応(結果)。

 

データの確認

 

 

・カラムの確認

 

 

・要約統計量を確認する

 

 

・pandas_profilingで分析

👉VisualStudioCodeだと見づらい。。。

 

 

🔹JupyterLabで開くと見やすくなる。

 

👉変数ごとのValueの割合など見やすく分析できる。

 

👉負値や欠損の有無もわかる。

 

 

🔹jobとyとの関係性について

 

 

🔹pythonでデータフレームの型を確認する

 

 

・せっかくなので図示もしてみる。

👉棒グラフ

 

🔹データフレーム全体に対してヒストグラム を作成する

 

 



 

 

🔹続いて散布図

👉x軸がjobのvalue値、y軸がy(yes,no)なので散布図だとあまり旨味はない。。

 

 

🔹散布図っぽいグラフにするため数値データ同士でプロットする。

 

 

 



 

 

 

3.前処理

続けてデータの前処理を実施する。

 

目的変数y(yes, no)をastype(np.int)でダミー変数にする

 

 

負値補正

 

 

🔹年齢、資産をレンジに。

 

 

🔹balanceのヒストグラム

データに偏りがあると単純にヒストグラム を出しても傾向が見えづらい。

 

👉表示範囲を指定する

👉だいぶ見やすくなりました

 

 

🔹資産のレンジ

👉うまくバラけさせることができました

 

 

🔹dayのレンジ

 

 

月の上旬、中旬、下旬

 

 

 

 

 

前処理まで完了したのでモデルを構築して実際に予測します。

長くなったので別記事で。

 

 

 

 

 

 

 

以上

 

 

 

 

 

⬇️他にもよく見られている記事⬇️

最も訪問者が多かった記事 10 件 (過去 7 日間)
  • この記事を書いた人
  • 最新記事
solobochi

solobochi

(名前):solobochi

(説明)
都内在住の独身アラサー男子
新卒で大手IT企業へ就職して気付けば10年。
このままではマズいという強烈な危機感から会社を休職。


🔸使命に生きたい
🔸好きなひとと好きなことで生きていきたい
これを人生懸けて実現すべく、人生模索中の日々


(Like)
🔹最適化することが好き
🔹PDCAを回すのが好き


(当サイト)
日々思うことを徒然と発信
└(例)
・学びのアウトプット
・投資・資産運用
・プログラミング
・資格試験の対策
・セミナーのレビュー
・書評
etc...

詳しくは自己紹介記事にて。
自己紹介①
自己紹介②
自己紹介③
自己紹介④

おすすめ記事

1

  どうも、solobochiです。     先日(7/6(日))受験した、JDLA(日本ディープラーニング協会)認定のG検定資格に無事合格しました。   &n ...

2

  どうも、solobochiです。     先日、PMP試験に無事合格しました。 振り返り記事のPart2です。     目次 前日・当日の流れ 勉 ...

3

  どうも、solobochiです。   2014年からなのでもうかれこれ6年弱、株や投資信託への投資をしています。 株を始めた頃は社会人5年目、ようやく仕事にも余裕が出てきた頃。 ...

4

  どうも、solobochiです。     昔から読書は好きで、ルーツを辿ると小学生の頃電車通学で、地下鉄丸ノ内線の終点からほぼ終点まで通っていたためその時間にいつも本 ...

5

    どうも、solobochiです。   2019年に入ってからというもの、休日は割とpython触ってます。といってもまだ簡単なサンプルコードをなぞるだけですが。 ...

-python, 機械学習, プログラミング
-, , , , ,

Copyright© そろボチ , 2020 All Rights Reserved Powered by AFFINGER5.