総合辞書アプリケーション(草案)

ページ名:総合辞書アプリケーション(草案)

ここでは辞書の中でもアクセントやコロケーションなど単語にかかわる様々な概念を一つのアプリケーションで閲覧・編集・作成が出来るソフトについて考えている。ここではそれの仕様を一覧として記していこうと思う。

目次

諦めかけている"Aliory Language Maker"の構想について

まずアリオリーランゲージメーカ(以下、ALM)の構想について説明したいと思う。まず名前は"A priori"や"A posteriori"などの単語の中で共通している"A -riori"の"r"を"l"に、"i"を"y"に書き換えたものである。ALMの構想を始めたのはPDICの使いにくい仕様からだ。今のご時世に「見出し語、発音、訳語、例文」だけという構成は古い気がする。そして編集機能もあまりよろしくなく一括編集をする際は条件を指定できない(自分の技量不足なのもあるだろうが)そういった仕様にイライラしていたのを覚えている。

そこでALMではそう言った使いにくさを克服するために以下の仕様にしようと思って作り始めた。

  • 万人が使いやすいようなソフトに仕上げる
  • 総合辞書(統合辞書)として機能するようにする。

だが、ここで自分の技量が足りないことに気が付いてしまった。小さい所は知っているが大きい部分を自分は知らなかったのだ。仕方なくPDICよりも使いやすい辞書ソフトを探して見つけたのが"ZpDIC"だった使い始めて自分は"ZpDIC"は辞書の神様が生み出したのではないかと思うくらい使いやすくてわかりやすかった。その上単語の自動生成までできてしまうことに驚いた。そこで満足してしまってEclipseの中のALMのソースファイルのことなど忘れかけていた。

でもALMで作りたかったソフトを忘れたくはないなのでここにそのALMで実装したかったものを記してゆく。

実際に求めていた機能の一覧

単語面

  1. 単語の作成・編集・削除
  2. タグや品詞による検索システムと各項目の検索
  3. 単語の綴り自動生成機能
  4. 各項目へのリンクによる指定(識別番号を挟んだリンクのデータ)

(構造は以下のよう)

  • 識別番号
  • 図鑑データ(リンクの識別番号)
  • 見出し語
  • 発音(akrantiainシステムで自動生成)
  • タグ
  • 訳語データ
    • 品詞
    • 訳語の配列
  • 概要データ(コンセプトや意味や語義、慣用句やことわざ、用法や使用上の注意などのデータ。むしろこっちがメイン)
    • 見出し
    • 内容(簡易的なHTML機能があるとなお良い)
  • 歴史データ
    • 見出し(時期)
    • 内容(簡易的なHTML機能があるとなお良い)
  • 派生形データ
    • 種類
    • 派生形の配列
  • 関連語データ
    • 種類
    • 関連語の識別番号の配列

リンク面

  1. リンクデータの作成・編集・削除(構造は以下のよう)
    • 識別番号
    • リンク(URLやパス情報)

例文面

  1. 例文の作成・編集・削除
  2. 内容が似ている例文へのリンク
  • 識別番号
  • 原文データ
  • 訳文データ

文法書面

  1. 文法書の項目の作成・編集・削除
  2. 文法書の項目の統合機能
    • 識別番号
    • 分類
    • 見出し
    • 内容

機能面

  1. 人工言語にも対応させたテキストマイニング(テキストの計量的な内容の分析)を行う機能 ["KH Coder"のような機能の人工言語版]
  2. テキストマイニング(テキストの計量的な内容の分析)時に、辞書データを参照できるような機能
  3. 言語単位(TPやPTP)を元に言語の完成度を数量化する機能 ["ZpDIC"には搭載済み]
  4. 全ての単語間で出てきた表記の比率を表示する機能 ["ZpDIC"には搭載済み]
  5. ある表現の書き換え機能(綴りから発音表現の生成など) ["akrantiain"で処理可;"ZpDIC"には搭載済み]
  6. 作成・編集・閲覧機能の良さ
  7. 他の辞書のデータを各項目毎で別々に閲覧できるシステム
    • 他の辞書データとの比較をしながらの編集

外部リンク

  1. 辞書作成・閲覧ソフト_ZpDIC-ホーム
  2. 辞書閲覧・作成ソフト_PDIC-ホーム
  3. テキストマイニングソフト_KH-Coder


特に記載のない限り、コミュニティのコンテンツはCC BY-SAライセンスの下で利用可能です。

シェアボタン: このページをSNSに投稿するのに便利です。


最近更新されたページ

左メニュー

左メニューサンプル左メニューはヘッダーメニューの【編集】>【左メニューを編集する】をクリックすると編集できます。ご自由に編集してください。掲示板雑談・質問・相談掲示板更新履歴最近のコメントカウン...

黙字

黙字とは、表音文字[1]を使用する言語に於いて、綴られているにもかかわらず発音されない文字のことである。サイレントとも言う。自然言語に於ける黙字自然言語に於いては主に以下のような歴史的な理由で黙字が存...

類型論

言語類型論抱合語孤立語膠着語屈折語総合的言語分析的言語特に記載のない限り、コミュニティのコンテンツはCC BY-SAライセンスの下で利用可能です。...

音韻論

音韻弁別的素性音素母音子音音節アクセントイントネーション韻律特に記載のない限り、コミュニティのコンテンツはCC BY-SAライセンスの下で利用可能です。...

音韻規則記述言語

音韻規則記述言語(PRDL; Phonetic Rule Description Language)とは、デネブさんによって提唱された、言語音の条件異音などを簡潔に記述するためのドメイン固有言語である...

音韻

ここでは、自然言語において起こり得る音韻の変化について説明する。目次1 母音関連1.1 母音調和1.2 ウムラウト1.3 アクセントのある音節の母音が変化する2 子音関連2.1 語中の有声音、無声音の...

音声記号の入力方法

芸術言語研究(カテゴリー)芸術言語の創り方・芸術言語の哲学このページの対象言語Se分類芸術言語モユネ分類ART音声記号の入力方法では,各種音声記号を入力する方法について解説する。目次1 文字コード1....

音声学

音声国際音声記号(IPA)国際音声記号への拡張調音調音部位調音方法特に記載のない限り、コミュニティのコンテンツはCC BY-SAライセンスの下で利用可能です。...

韓国日本語2

通り韓国日本語2.jpg特に記載のない限り、コミュニティのコンテンツはCC BY-SAライセンスの下で利用可能です。...

韓国日本語

写真の通り韓国日本語.jpg特に記載のない限り、コミュニティのコンテンツはCC BY-SAライセンスの下で利用可能です。...

集合化造語法

集合化造語法とは、短期間にたくさんの単語を作るための意味を創造する手法である。補完造語法と合わせることでより効果的になる。概要・方法この造語法の流れは以下の二つの手順で意味をあらかじめ考えておく必要が...

限定性と修正性

限定性と修正性は動詞の性質を示す用語である。言語の特徴を探る手掛かりとなる。簡単な内容は表1に記載表 1限定性修正性格の指定未定義文脈依存修飾必須任意抽象度高低限定性動詞に含まれる項が未定義で指定する...

関係方式

関係方式とは、辞書の保存方式の一つである。クノーツアクアにより提唱された。説明この方式では語句に含まれる意味や用法をカード毎に分割し、それらを組み合わせて辞書を作っていく。カードは形式毎に異なる種類の...

関与原理

関与原理(英: relatedness principle)とは、おかゆの発案による、意味役割の標示に関する原理である。関与原理は、関与という意味役割を提示する。これはいわば、あらゆる具体的な意味役割...

遺伝造語法

遺伝造語法とは、カルノス・アクアが考案した造語法の一種である。発端は、生物の遺伝の選択を造語にも生かせないか?というところからである。目次1 方法2 特徴3 用法・用量4 関連記事方法まず、何らかの共...

達丸漢字

写真2枚漢字1.jpg追記ほとんどなさそうです特に記載のない限り、コミュニティのコンテンツはCC BY-SAライセンスの下で利用可能です。...

達丸日本語

達丸日本語.jpgまず最初に達丸日本語から書きはじ‘めます。更新していく予定です 2023 4/1 (土) 21:24 現在 3つあります  googleplay アプリのcloudy で作成中ですま...

造語論

造語論とは、人工言語を制作する際の考え方の一つで、語句を作る際の考え方である。目次1 クノーツ法1.1 題目(テーマ)1.2 対象(ターゲット)1.3 目的(コンセプト)1.3.1 語法(ヴィジョン)...

辞書の読み物性

辞書の読み物性とは人工言語の辞書の読みごたえに関する指標の一つである。本来は "Fafs falira sashimi"氏が2014年に考案し、2015年7月に辞書の情報密度を表す数値として提案した。...

転写

転写とは、ある言語の発音を他の文字体系で表記することである。例えば日本の固有名詞(地名や人名など)をローマ字表記したり、英語圏の固有名詞をカタカナ表記したりすることなどである。あくまでも発音に基づいて...