Linuxに音声入力を導入する

createdAt: 2026/02/14 · amgsk

要約

hyprwhsprの特徴

AURにパッケージが用意されているので、AURヘルパーでインストールできる。

1
yay -S hyprwhspr

インストール後、対話式のセットアップウィザードを実行する。

1
hyprwhspr setup

ウィザードでは以下の設定を順に行う。

セットアップ完了後、ログアウト→ログインが必要。グループ権限の変更を反映させるため。

尚、私の環境では日本語環境の認識までに少し問題があった。
その内容はこちらの記事でまとめている。

デフォルトのホットキーはSuper+Alt+D。

シンプルなトグル操作で、どのアプリケーションでも音声入力が使える。

自分はデフォルトから右シフトキーに変更した。
Shiftキーは押しやすいのにもかかわらず、正直あまり使わないため音声入力のホットキーに最適と感じている。

設定の変更はhyprwhspr configコマンドで行う。

1
2
3
4
5
# 設定の確認
hyprwhspr config show

# 設定の変更
hyprwhspr config set <key> <value>

デフォルトでフィラーワード（「えーと」「あのー」など）の除去が有効になっているっぽい。わざとらしく「えっと」「あのー」「そのー」「なんか」等を喋ってみたが、認識結果には表示されなかった。いい感じ。

以下のコマンドで診断できる。

1
2
3
4
5
6
7
8
# マイクの動作確認
hyprwhspr test mic

# インストール状態の検証
hyprwhspr validate

# systemdサービスの状態確認
hyprwhspr systemd status

マイクが認識されない場合は、PipeWireまたはPulseAudioの設定でマイクが有効になっているか確認する。

音声入力は完全なタイピングの代替にはならないかなと言うのが印象。たぶん常用しない気がする。
エンジニアという職業柄、喋るようにタイピング出来る人が多いと思うので、そもそも文字を打つことが苦じゃない。
そんなに早口で喋ることは出来ないし（単純に早口が苦手）、もはやタイピングのほうが早かったりする。

そして精度は100%ではないので、誤認識の確認・修正も必要になる。タイプするのメンドイときに使う感じかなー。
数msのラグが発生するので脳が強制スイッチングされるのも気になる。