どんな単語が多く使われてるのかな?とかを分析した結果。
基本的に出力結果を全て掲載しているので普通に3万行とかになっている。
ファイル置き場あればCSV置いとくんだけどね。このWikiは画像のみOKの模様。
今日 2 、合計 571
※以下、全てにおいて参考まで。
真筆遺文で使われてる単語ランキング(形態素解析)…古文用の辞書使ってみたけど、仏教用語は厳しいね。
真蹟遺文で使われている漢字の名詞ランキング_2文字以上編…という訳で、自力コマンドで分析した結果
御書全集の真偽チェック一覧…そのまま。
テキスト処理のメモ…恥ずかしい記録。分かるんだよ。もっと綺麗な書き方とかあるの分かってるんだけど、Macのshは何かクセあるんだよ。
WordCloud遊び…その名の通りお遊び。
自分のために、あるいは似たようなことをする人々へ。
※「ボク/私は500万円超えのMacPro持ってっからー♪」って人は無視してくださいね。
とりあえず、WindowsでいうExcel相当のソフトとして、AppleのNoteとGoogleDriveのスプレッドシートを使ったのよ。
だめ。固まっちゃう。メモリ16GBのCPU3.5GHzでもだめだった。
こういうのはUNIX系のコマンド使うか、Pythonとかでツール作らんと厳しいねと。
今のところはshellコマンドとawkの組み合わせで間に合っている。
ただし、形態素解析については以下が使えて便利
https://chamame.ninjal.ac.jp/
便利なんだけど、Excelとか使って加工するとやっぱり厳しかった。
コメント
最新を表示する
NG表示方式
NGID一覧