こんにちは。いーかです。
できたところまででOK。今日は『ここまで進んだ』が成果です。
30秒まとめ
- このシリーズは 架空データ
sales.csvを使って、最短7記事で「分析できた」まで行きます - Windows+VS Code前提で、迷子になりやすい所は先に潰す 構成です
- フェーズ2(実データ・政府統計など)は、フェーズ1完走後に“型を差し替える”だけで行けます
このシリーズで「できるようになること」
フェーズ1のゴールはこれ:
sales.csvを読み込める- 商品別の売上・件数を 辞書(dict) で集計できる
- 上位N、会員割合、平均金額 みたいな“ミニ分析レポート”が出せる
- (最終的に)結果を 保存できる(テキスト or CSV)
まず用意するもの(Windows+VS Code)
- VS Code(Python拡張あり)
- Python(CPython)
- フォルダ1つ(作業場)
補足:Pythonのバージョンは人によって違います。
フェーズ1は大きく困らないことが多いけど、迷子防止のために「自分のsys.executableを確認する」だけは必須にします。
(番外編)環境で迷子になったらここ
- Windows×VS CodeでPython実行を固定する(.venv直呼びで迷子ゼロ)【番外編|環境編】
→(リンク)
✅勝ち判定:
check_python.pyのexecutable/prefixに.venvが出たらOK
サンプルデータ sales.csv(コピペでOK)
まずはこの内容で sales.csv を作ってください。
(VS Codeで新規ファイル → sales.csv → 貼り付け → 保存)
date,product,amount,is_member
2025-12-01,Book,1200,1
2025-12-01,Coffee,450,0
2025-12-02,Book,1200,0
2025-12-02,Pen,200,1
2025-12-03,Coffee,450,1
2025-12-03,Notebook,600,0
2025-12-04,Book,1200,1
2025-12-04,Pen,200,0
2025-12-05,Coffee,450,0
2025-12-05,Notebook,600,1
ここで大事:文字コードはUTF-8。メモ帳じゃなくて、VS Codeで作ればほぼ安全です。
コース選択(運用ルール)
✅最短コース:7記事(まず“分析できた”まで)
→ まずはこのページの「読む順番(最短7)」を順にやればOK。
理解優先コース:15記事(詰まりを丁寧に潰す)
→ 最短7に、途中の補助回(エラー・文字コード・設計)を挟みます。
資産化MAX:25記事
→ 最短7を核に、派生記事を足して“困りごと辞典”にします。
読む順番(最短7)
※各リンクは、公開したら差し替えます(いまは枠だけ置いておく)
- メモ:Python分析(sales.csv)#01 まずは「Pythonがどれで動いてるか」を確定する【知識ゼロOK】 →(リンク)
- 第2回:VS CodeでPython実行を固定する(迷子防止の最短セット) →(リンク)
- 第3回:条件文の型(if / elif / else)だけで割引ルールを書く →(リンク)
- 第4回:for+listで「データを回す」感覚をつかむ(合計・件数) →(リンク)
- 第5回:dict集計が分析の心臓(商品別カウント/売上合計) →(リンク)
- 第6回:標準csvで sales.csv を読む(型変換とヘッダー処理) →(リンク)
- 第7回:ミニ分析完成(上位N/会員割合/平均金額) →(リンク)
最短の進め方(迷わない運用)
- まず #01 → 第2回 まで進めば、環境の迷子が激減します
- その後は 第3回〜第7回 を順にやるだけ
- 各回は「完璧」を狙わなくてOK。動いたら勝ちです
- 記事が増えても、このハブだけ見れば迷わない(ここを正規ルートにします)
詰まったらここ(よくある“止まりポイント”だけ先に置く)
1) VS Codeで実行できない
- 第2回に全部まとめます(ここが最重要)
- どうしても迷子になる人向け:
.venv\Scripts\python.exe直呼びが最強
2) sales.csv が読めない(文字化け・区切りがおかしい)
- まずはVS Codeで作り直す
- CSVは カンマ区切り、1行目はヘッダー、保存は UTF-8
- それでもダメなら:「開き方」じゃなく「中身(カンマ・改行)」を確認
3) 数値にできない(”1200″ が文字列のまま)
- 第6回で「型変換(int)」を丁寧にやります
- ここは誰でも一回つまずくポイントです
(増築パーツ)MAX25に増やすなら、ここから足す
※“困りごと系”は検索流入が強いので、資産化したい時に追加。
環境系(入口の補強)
- ExecutionPolicyでActivate.ps1が動かない対処
- VS Codeは新しいのにターミナルが古いPythonを呼ぶ理由
.venvを作ったPythonのバージョンはあとから変えられない話
CSV/実務系(分析に直結)
- 文字コード(Shift-JIS/UTF-8)で読めない時の最短チェック
- ヘッダ名の揺れ対策(列名の正規化)
- 空白・欠損・数値変換(int/float)で落ちない書き方
“道具化”系(継続運用)
argparseでファイル名を引数にする- ログ(print→logging)にする
- 小さなテスト(期待する集計値を固定して壊れ検知)
ミニクイズ(答えは記事の末尾)
Q1. sales.csv の1行目(ヘッダー)があると、何が嬉しい?
Q2. is_member は “0/1” だけど、最初は何として読み込まれる?
Q3. 分析でよく使う「商品別集計」は、listよりdictが向いてる理由は?
今日の1アクション
VS Codeで sales.csv を作って保存
これだけでOK。ここまで進んだ時点で、もう前進してる。
今日のひとこと
分析って、いきなり難しいことじゃなくて、
「読む → 数える → まとめる」の積み重ね。ここから一緒に型を作っていこう。
出典枠(このシリーズの方針)
- ベース:Windows+VS Codeで「動かして理解する」
- 参照:高橋麻奈さんのコラムは“導入の種”として使い、本文は 自分の言葉+自分の実験で組み立てます
ミニクイズ解答(ここにまとめます)
A1. ヘッダーがあると「この列は何か」が分かり、コードの読みやすさと安全性が上がる(列名で扱える)。
A2. まずは文字列として読み込まれることが多い。なので必要に応じて int() に変換する。
A3. dictは「キー(商品名)→合計/件数」を直で持てるので、探す・足す・集計するのが速いし簡単。
次に読む
- (#01)メモ:Python分析(sales.csv)#01 まずは「Pythonがどれで動いてるか」を確定する【知識ゼロOK】 →(リンク)


コメント