スキップしてメイン コンテンツに移動

投稿

2月, 2019の投稿を表示しています

サイドにあるシフトキーを使うことで花配列をもう少し楽にできないか試す

花配列 に少し慣れてきたが、慣れても解消されない違和感がいくつか残っている。 右手小指側に1キー分ホームポジションから外に外れる文字があり、花配列で手首が怠惰になっているため、手首を全く動かさずに打とうとすると打ちづらい。「ー」「り」「え」 がそれに当たり特に「え」はつらい。 半濁音を入力するために4回も打鍵する必要があり打ちづらい。 使用頻度が低めの小書き文字「ぁ」「ぃ」「ぅ」「ぉ」の位置が覚えづらい。 「っ」「ゃ」が割り当てられているYキーの位置が 遠く感じる。 大抵は狭い範囲で入力が完結できてしまう花配列のせいで手首が怠惰になってしまったことに起因する。 1番目については月配列など中指シフト系配列に共通する悩みであるらしく、薬指にもう一つシフトキーを増やしてシフト面を増やしたり、数字段にも文字を割り当ててみたりという試みをされている方がいる。どうせシフトキーを増やすのだったら左右サイドにある本物のシフトキーを使ってしまえば新たに潰すキーもなくて良いんじゃないかと思ったのでやってみた。mozc、Google日本語入力のローマ字テーブル定義をいじる方法では実現できないので、DovrakJを使って実現する。DvorakJの花配列定義ファイルに下記の設定を追加した。 /* [shift] + 文字キー */ -shift[ | | | | | | | | | | | |ぇ| ぴ| |え|ぽ| ぺ |や| |ぅ| |い| | | あ|ょ|ゅ|ゃ| | ぱ |ぷ|ー|り|お| | | う| |ぁ| |ゅ|ぃ|っ|゜|ぉ| |ぇ| {shift}| ] 実際のDvorakJ定義ファイルはこちら⇒ ダウンロード 以下のような方針でキーを割り当てた。 「え」を内側に移動させるにあたって「ぇ」の入力と同じEキーを使うようにした。 「ひ」「ふ」「へ」「ほ」 の位置に半濁音「ぴ」「ぷ」「ぺ」「ぽ」を割り当てた。「ぱ」は「ぺ」と被るので空いているHキーに割り当てておく。 小書き文字を入力可能なキーを追加した。キーの位置は「あ」のキーと同じ位置に「ぁ」を、「い」のキーに「ぃ」を、「や」のキーに「ゃ」をというルールで割り当てた。「ゅ」だけは例外で小書きの「ゅ」と同じ位置に「ゅ」を割り当てた。 3と...

花配列のキー配列図を作った

ちょっと変わった日本語キー配列を覚えてみたくなって月配列2-263と花配列を覚えてみた。月配列2-263は1日で覚えることができた。1文字打つのに1〜5秒くらいかかるけれど五十音とその小書きを一通り見ずに打てるというレベルに到達するまで1日。10日間使って月配列2-263がしっくり来なかったので花配列に切り替えたのだが、花配列のほうは覚えるのに3日かかってしまった。 モチベーションが下がっていたとか、覚えたばかりの月配列2-263と記憶が混ざり合ってしまったとか言い訳も考えられるけれど、おそらくは花配列に大きく見やすいキー配列図が存在しないというのが覚えるのが困難な最大の理由だったと思う。ネットで見つかるのは考案者、冨樫雅文さんが公開されている 607✕197ピクセルのモスキートノイズでモヤモヤした画像 のみ。紙に大きく印刷してもどの文字が書かれているか判別するのに数秒かかってしまう。 しょうがないので作成したのがこの図。当初はプリンターでラベルシールに出力してキートップに貼ってやろうかとまで思っていたのでキーサイズは現物に近いサイズで描いてある。InkScapeで作られたSVGファイルになっているのでもし花配列を覚えようとする方がいらしたら修正して使ってください。 InkScape SVG形式の配列図 ダウンロード (右クリックして保存のこと) 小さめのPNG画像↓   花配列は仮名漢字変換ソフトのアルファベット定義ファイルを変更することで実現した。mozc定義ファイルは こちらのブログ からダウンロードさせてもらった。

日本語文章の1文字置きの2-gram頻度の調べ方

JISかなより楽な新しい日本語キー配列を一つ覚えられないかなといろいろ物色し、薙刀式配列を開発している大岡俊彦氏のブログも読んでいたのだけど、 【薙刀式】1文字置きの頻度転がってないかなあ というエントリを見かけた。 割と簡単に数えられそうな気がしたのでやってみた。 サンプル文章として使ったのは2月1日から2月9日までの 大岡俊彦氏のブログのタイトルと本文、26,827文字(改行・スペース込み、geditエディタが数えたもの)。Linux上で処理してしまったのでWindowsではここまで簡単に進まない。 まずはkakasiを使って漢字をひらがなに変換しておく。 $ kakasi -JH -KH -iutf8 < ブログの文章.txt > ひらがな文章.txt ひらがなに直したデータはこんな感じ。 ひらがな文章.txt(ダウンロード) 。ここでエディタから読めない文字があると警告が出ていたけどとりあえず無視して進む。 ひらがなに変換した文章を1文字置きに2文字づつ出力する自作rubyスクリプトに通す。更にパイプで五十音順並べ替え、カウント、個数順並べ替えと既製の標準的なUNIXコマンドを使って処理する。 $ ruby ichimoji.rb < ひらがな文章.txt | sort | uniq -c | sort -nr > 結果.txt それで得られた結果がこれ。 結果.txt(ダウンロード) [LF]という文字列は改行を表している。合計31,452個の組み合わせとなった。 Excelなど表計算ソフトで読み込む場合は8カラムの固定幅データとしてインポートするといい。 改行の絡むものは除いて、 トップ20はこのような顔ぶれ。 131, てる, 0.42% 121, な。, 0.38% 106, うう, 0.34% 104, しい, 0.33% 98, しう, 0.31% 94, のん, 0.30% 91, いい, 0.29% 89, なか, 0.28% 87, っい, 0.28% 87, うん, 0.28% 83, んう, 0.26% 83, かな, 0.26% 82, の、, 0.26% 82, とう, 0.26% 81, らい, 0.26% 79, んい, 0.25% 78, んん, 0.2...