メモ:Python分析フェーズ1(sales.csv)目次|最短7で「分析できた」まで

Python分析

こんにちは。いーかです。
できたところまででOK。今日は『ここまで進んだ』が成果です。


30秒まとめ

  • このシリーズは 架空データ sales.csv を使って、最短7記事で「分析できた」まで行きます
  • Windows+VS Code前提で、迷子になりやすい所は先に潰す 構成です
  • フェーズ2(実データ・政府統計など)は、フェーズ1完走後に“型を差し替える”だけで行けます

このシリーズで「できるようになること」

フェーズ1のゴールはこれ:

  • sales.csv を読み込める
  • 商品別の売上・件数を 辞書(dict) で集計できる
  • 上位N、会員割合、平均金額 みたいな“ミニ分析レポート”が出せる
  • (最終的に)結果を 保存できる(テキスト or CSV)

まず用意するもの(Windows+VS Code)

  • VS Code(Python拡張あり)
  • Python(CPython)
  • フォルダ1つ(作業場)

補足:Pythonのバージョンは人によって違います。
フェーズ1は大きく困らないことが多いけど、迷子防止のために「自分の sys.executable を確認する」だけは必須にします。


(番外編)環境で迷子になったらここ

  • Windows×VS CodeでPython実行を固定する(.venv直呼びで迷子ゼロ)【番外編|環境編】
    →(リンク

✅勝ち判定:check_python.pyexecutable/prefix.venv が出たらOK


サンプルデータ sales.csv(コピペでOK)

まずはこの内容で sales.csv を作ってください。
(VS Codeで新規ファイル → sales.csv → 貼り付け → 保存)

date,product,amount,is_member
2025-12-01,Book,1200,1
2025-12-01,Coffee,450,0
2025-12-02,Book,1200,0
2025-12-02,Pen,200,1
2025-12-03,Coffee,450,1
2025-12-03,Notebook,600,0
2025-12-04,Book,1200,1
2025-12-04,Pen,200,0
2025-12-05,Coffee,450,0
2025-12-05,Notebook,600,1

ここで大事:文字コードはUTF-8。メモ帳じゃなくて、VS Codeで作ればほぼ安全です。


コース選択(運用ルール)

✅最短コース:7記事(まず“分析できた”まで)

→ まずはこのページの「読む順番(最短7)」を順にやればOK。

理解優先コース:15記事(詰まりを丁寧に潰す)

→ 最短7に、途中の補助回(エラー・文字コード・設計)を挟みます。

資産化MAX:25記事

→ 最短7を核に、派生記事を足して“困りごと辞典”にします。


読む順番(最短7)

※各リンクは、公開したら差し替えます(いまは枠だけ置いておく)

  • メモ:Python分析(sales.csv)#01 まずは「Pythonがどれで動いてるか」を確定する【知識ゼロOK】 →(リンク
  • 第2回:VS CodeでPython実行を固定する(迷子防止の最短セット) →(リンク)
  • 第3回:条件文の型(if / elif / else)だけで割引ルールを書く →(リンク)
  • 第4回:for+listで「データを回す」感覚をつかむ(合計・件数) →(リンク)
  • 第5回:dict集計が分析の心臓(商品別カウント/売上合計) →(リンク)
  • 第6回:標準csvで sales.csv を読む(型変換とヘッダー処理) →(リンク)
  • 第7回:ミニ分析完成(上位N/会員割合/平均金額) →(リンク)

最短の進め方(迷わない運用)

  • まず #01 → 第2回 まで進めば、環境の迷子が激減します
  • その後は 第3回〜第7回 を順にやるだけ
  • 各回は「完璧」を狙わなくてOK。動いたら勝ちです
  • 記事が増えても、このハブだけ見れば迷わない(ここを正規ルートにします)

詰まったらここ(よくある“止まりポイント”だけ先に置く)

1) VS Codeで実行できない

  • 第2回に全部まとめます(ここが最重要)
  • どうしても迷子になる人向け:.venv\Scripts\python.exe 直呼びが最強

2) sales.csv が読めない(文字化け・区切りがおかしい)

  • まずはVS Codeで作り直す
  • CSVは カンマ区切り、1行目はヘッダー、保存は UTF-8
  • それでもダメなら:「開き方」じゃなく「中身(カンマ・改行)」を確認

3) 数値にできない(”1200″ が文字列のまま)

  • 第6回で「型変換(int)」を丁寧にやります
  • ここは誰でも一回つまずくポイントです

(増築パーツ)MAX25に増やすなら、ここから足す

※“困りごと系”は検索流入が強いので、資産化したい時に追加。

環境系(入口の補強)

  • ExecutionPolicyでActivate.ps1が動かない対処
  • VS Codeは新しいのにターミナルが古いPythonを呼ぶ理由
  • .venv を作ったPythonのバージョンはあとから変えられない話

CSV/実務系(分析に直結)

  • 文字コード(Shift-JIS/UTF-8)で読めない時の最短チェック
  • ヘッダ名の揺れ対策(列名の正規化)
  • 空白・欠損・数値変換(int/float)で落ちない書き方

“道具化”系(継続運用)

  • argparse でファイル名を引数にする
  • ログ(print→logging)にする
  • 小さなテスト(期待する集計値を固定して壊れ検知)

ミニクイズ(答えは記事の末尾)

Q1. sales.csv の1行目(ヘッダー)があると、何が嬉しい?
Q2. is_member は “0/1” だけど、最初は何として読み込まれる?
Q3. 分析でよく使う「商品別集計」は、listよりdictが向いてる理由は?


今日の1アクション

VS Codeで sales.csv を作って保存
これだけでOK。ここまで進んだ時点で、もう前進してる。


今日のひとこと

分析って、いきなり難しいことじゃなくて、
「読む → 数える → まとめる」の積み重ね。ここから一緒に型を作っていこう。


出典枠(このシリーズの方針)

  • ベース:Windows+VS Codeで「動かして理解する」
  • 参照:高橋麻奈さんのコラムは“導入の種”として使い、本文は 自分の言葉+自分の実験で組み立てます

ミニクイズ解答(ここにまとめます)

A1. ヘッダーがあると「この列は何か」が分かり、コードの読みやすさと安全性が上がる(列名で扱える)。
A2. まずは文字列として読み込まれることが多い。なので必要に応じて int() に変換する。
A3. dictは「キー(商品名)→合計/件数」を直で持てるので、探す・足す・集計するのが速いし簡単。

次に読む

  • (#01)メモ:Python分析(sales.csv)#01 まずは「Pythonがどれで動いてるか」を確定する【知識ゼロOK】 →(リンク

コメント

タイトルとURLをコピーしました