テキスト分析のコーナー

ページ名:テキスト分析のコーナー

どんな単語が多く使われてるのかな?とかを分析した結果。
基本的に出力結果を全て掲載しているので普通に3万行とかになっている。
ファイル置き場あればCSV置いとくんだけどね。このWikiは画像のみOKの模様。


+ (自分用カウンタ)-

今日 2 、合計 571


※以下、全てにおいて参考まで。
真筆遺文で使われてる単語ランキング(形態素解析)…古文用の辞書使ってみたけど、仏教用語は厳しいね。
真蹟遺文で使われている漢字の名詞ランキング_2文字以上編…という訳で、自力コマンドで分析した結果
御書全集の真偽チェック一覧…そのまま。
テキスト処理のメモ…恥ずかしい記録。分かるんだよ。もっと綺麗な書き方とかあるの分かってるんだけど、Macのshは何かクセあるんだよ。
WordCloud遊び…その名の通りお遊び。


自分のために、あるいは似たようなことをする人々へ。

※「ボク/私は500万円超えのMacPro持ってっからー♪」って人は無視してくださいね。


とりあえず、WindowsでいうExcel相当のソフトとして、AppleのNoteとGoogleDriveのスプレッドシートを使ったのよ。
だめ。固まっちゃう。メモリ16GBのCPU3.5GHzでもだめだった。
こういうのはUNIX系のコマンド使うか、Pythonとかでツール作らんと厳しいねと。
今のところはshellコマンドとawkの組み合わせで間に合っている。


ただし、形態素解析については以下が使えて便利
https://chamame.ninjal.ac.jp/


便利なんだけど、Excelとか使って加工するとやっぱり厳しかった。

シェアボタン: このページをSNSに投稿するのに便利です。

コメント

返信元返信をやめる

※ 悪質なユーザーの書き込みは制限します。

最新を表示する

NG表示方式

NGID一覧