概要
ローカルのpythonでスクレイピングをしました。でもデータの保存はスプレッドシートでしたい。
というような、気持ちはありますよね。
python学習して辛いところは、結局実務の運用がそのままだとエクセルなどになってしまうことです。それを避けるためには、スクレイピング等で取得したデータをスプレッドシートに書き込めるようになる必要があります。
Google API (今回はsheets API v4)を利用して、スプレッドシートデータの読み込み(get)や書き込み(write)ができるようになっていきましょう。
読んで欲しい人
- スクレイピングが終わった人
- Google sheets APIを利用してみたい人
- ローカルデータの定期アップロードがしたい人(launchedctlも絡みますが、今回は紹介しません。過去記事をご参照ください)
やれるようになること
ざっくりとは以下のことをやっていきたいと思います。取得するデータはそれぞれ皆さんで異なるでしょうから、データに合わせた最適化はしませんが、ローカルからスプレッドシートの読み書きができるようになるはずです。
事前準備:sheets APIのactivateとcredential.jsonの取得方法
①ローカルのpythonコードでgoogle sheets API他関連APIで利用するOauth2.0の認証認可を処理できる
②スプレッドシートのデータを取得してターミナルで表示
③pythonファイルで作成した特定データをスプレッドシートに書き込む
④ローカルのcsvファイルをuploadして、スプレッドシートを作成する
まとめ
pythonでスクレイピングできるようになったけど。。。って人ぐらいが対象のシリーズです。
pythonは比較的ライトな言語ですが、言語として取得しただけでできることもあれば、当然できないこともあります。日常使いのツールと組み合わせて、より効果を発揮する面があることは理解に難くないでしょう。
ということで、よく使うスプレッドシートとの連携は非常に便利だと思います。pythonの良さと、スプレッドシートの良さを両方生かして業務を楽にしていきましょう。
関連記事: pythonとsheets API v4を使ってスプレッドシートにアクセスする
pythonでスクレイピング等をした後に取得したデータをスプレッドシートで管理してみましょう。ローカルのpythonコードからgoogle sheets APIを利用してスプレッドシートにアクセスする方法を紹介しています。