Pythonで機械学習やらせよう(Windows編)

ページ名:Pythonで機械学習やらせよう(Windows編)

この記事について

  • 記事の目標:それなりにまとまったテキストを貴方のコンピュータに学習させ、その結果として「元のテキストっぽい文章」を出力させること。
  • 想定読者:「Windowsユーザーだよ。メールとかネットサーフィンとかExcelとかはやってるよ。でもプログラミングは全く知らないよ/ほとんど知らないよ」の方。
  • 注意:以下、文字のエンコーディングは全てUTF-8(BOMなし)で保存してください(良くわからない場合はこちら
  • 超注意!:私はWindowsを持っていない。だから、その辺の情報を拾いながら躓きそうなところを想像して書いた。やるだけやってみて、おかしい時はTwitterとかで教えてください。できるだけサポートします。

(プログラミングは本来楽しいものだけど、プログラムを実行するまでが本当に大変で面倒くさい。でもそれを乗り越えると楽しいから。もし上手くいかなくても、どうか諦めないでください。)

+ (自分用カウンタ)-

今日 1 、合計 516

やることの概要

  • WindowsにPythonの実行環境を作る
  • Pythonの機能を増やす(pip)
  • サンプルテキストをサンプルプログラムで動かして、出力結果を得る
  • テキストプログラムの簡単な解説

WindowsにPythonの実行環境を作る

以下、管理者権限ユーザーで実行しているものとします。
とにかくPythonを動かせるようにします。以下、英数字とスペースは全て半角で入力してください。

  • Pythonのインストール
    • Python公式の通りにやってください
    • 「"Add Python 3.x to PATH"のチェック」を絶対忘れないでね

→「Cコンパイラ云々」はこの時点では何もせず、次の確認をしてください

    • コマンドプロンプトを起動します
      • 起動方法:[Windows]+[R]キーを押し、[ファイル名を指定して実行]ダイアログを開く。 次に[名前]入力ボックスに「cmd」と入力して、[Enter]キーを押すか、[OK]ボタンをクリック
    • 「>」の後ろに「python --version」と入力して[Enter]キー
      • 「Python 3.7.x」みたいな表示が出ればOK
      • 他の表示が出たら何かがおかしい。Twitterとかで連絡ください。一緒に原因究明だお。
  • ここまでできたら、Cコンパイラをインストール

エラーがなければ、とりあえず安心です。おめでとうございます!

Pythonの機能を増やす(pip)

本来、ここから先は「Pythonの環境設定」というのをやるのがお作法だけど、ハマるポイントになり得るので今回は無視して進める。とにかく動かせることを目標にする。
ここではPythonのpipというものを使い、Pythonをパワーアップさせます。
※以下、もしかしたら「py -m pip install XXX」ではなく「pip install XXX」でOKかも。

  • コマンドプロンプトを開きます
    • 「>」の後ろに「py -m pip install -U pip」と入力して[Enter]キー→再度「>」が表示されるまで待つ。
    • 「>」の後ろに「py -m pip install numpy」と入力して[Enter]キー→再度「>」が表示されるまで待つ。
    • 「>」の後ろに「py -m pip install matplotlib」と入力して[Enter]キー→再度「>」が表示されるまで待つ。
    • 「>」の後ろに「py -m pip install tensorflow」と入力して[Enter]キー→再度「>」が表示されるまで待つ。
    • 「>」の後ろに「py -m pip install keras」と入力して[Enter]キー→再度「>」が表示されるまで待つ。

基本的には、「SUCCESSFULLY INSTALLED」とか表示されるので、機能追加が上手くいったかは分かるはず。
上手く行かなかった場合はその画面をスクショして私に教えてくれれば何か手伝えるかもしれない。

    • コマンドプロンプトを×マークをクリックして閉じる

サンプルテキストをサンプルプログラムで動かして、出力結果を得る

    • マイドキュメントでもどこでも好きなフォルダで「Jikken」フォルダを作る。名前は何でも良いけど。
    • Jikkenフォルダ内に「test.txt」というファイルを作る。
    • 「test.txt」をテキストエディタで開き、このページの内容をコピペする
      • 「from」から「close()」までをコピペ。余計な改行とかは入れない。
      • サンプルプログラムはここのものをほぼそのまま流用している
    • test.txtをtest.pyに変更する。拡張子(.py)の変更の仕方が分からない場合はこちら
    • 同じくJikkenフォルダ内に「input.txt」というファイルを作る
      • このファイル内に、解析した内容のテキストを入力する。例えば御義口伝とか
    • Jikkenフォルダでコマンドプロンプトを開く
    • 「>」の後ろに「python test.py」と入力して[Enter]キー
      • 学習が始まる。文章量とかによって学習時間は変わる。
      • マシンのリソースを食うし、それなりに時間はかかる(とりあえず、学習回数は30に設定してある)
      • 「時間がかかりすぎ」「このままじゃPCが爆発する」など、処理を中断したい場合は[Ctrl]キーを押しながらCを押すと中断になる、はず。最悪、PCの電源落とせばなんとかなるだろ。

テキストプログラムの簡単な解説

と思ったけど、プログラムの中身は作成元を参照する方が良いと思う。
http://cedro3.com/ai/keras-lstm-text/
読んでわからないところは私でも解説できるかもしれないし、できないかもしれない。


ここまでやったら、上手くいったかどうかだけでも是非教えてください!

シェアボタン: このページをSNSに投稿するのに便利です。

コメント

返信元返信をやめる

※ 悪質なユーザーの書き込みは制限します。

最新を表示する

NG表示方式

NGID一覧