※当ブログには、アフィリエイトを利用した記事があります

iPhone 17 (iOS26?) の音声認識がすごい!【Winとの比較】

〇その他(雑記)
〇その他(雑記)

iPhone 17に買い替えて良かった!
っていう自己正当化の一環。

iOSの音声入力が
Windowsのそれよりも
圧倒的に優れていた
っていう話。

↓よければクリックお願いします↓

にほんブログ村 ライフスタイルブログ セミリタイア生活へ
にほんブログ村

iPhone 17 の音声認識がすごい!

iPhoneを新調してから
Google keepで
音声入力してみたんだけど、

  • 単純に変換精度が良い
  • 言い淀んでも「。」でブチブチ途切れない
  • 無意味な伏字が出てこない
  • キー入力しても音声入力モードが途切れない

といった様々な点で
Windowsの音声入力より
iOSの音声入力の方が
優れていると感じた。

Google keep内にマイクアイコンは存在しないから、
使ってるのはiOSの音声入力のはず。

特に
赤線引いた最後の一点が
ボクにとって革命的だった。

以下、
それぞれについて
思うところを垂れ流していく。

単純に変換精度が良い

これはもう説明不要。

単純に変換精度が良い。

使っていて一番顕著なのは、
「おおくの」

ボクの喋り方だと、
なぜかWinでは体感90%以上
「オークの」になる。

  • オークの研究
  • オークのクリエイター
  • オークの投資家

等々、
多くのオークが生まれた。

一方、
iOSでは今まで一度も
「オーク」になったことはない。
ちゃんと「多く」になる

今思い当たって
「多くのオークが生まれた」
音声入力したら、

  • Win:オークオークが生まれた。
  • iOS:多く多くが生まれた

になった(笑)

さすがに
(ボクの滑舌での)
「多くのオーク」
変換難易度がまだ高いっぽいけど、
どちらが実用的かは言うまでもない。

言い淀んでも「。」でブチブチ途切れない

Winは、
文節で音声が少しでも途切れると
「。」で区切ってくるイメージ。

一方
iOSにはそれがなく、
ちゃんと1文最後まで聞き終えてから
変換してくれる印象。

例として適当に
読書メモ(Winの変換結果)から抜粋↓

人生もこれと同じで要は横軸時間、縦軸、幸福度とした傾き微分が大きいほど幸福に対するインパクトがでかい

同じ文をiOSで音声入力すると、
こうなる↓。

人生もこれと同じで要は横軸時間、縦軸幸福度としたときの傾き微分が大きいほど幸福に対するインパクトがでかい

「とき」が平仮名だったり漢字だったりするのは棚上げ。

iOSだと無駄な「。」がない。
ボクの喋り方に差がある可能性も棚上げ


入力してて気づいたのは、
1文喋り終わった時点では
iOSは「。」をつけずに待機していて、
次の文が始まったら
さっきの文の最後に「。」をつけてから
次の文の変換を始めている
ということ。
Winはすぐ「。」がつく

iOSの方は一旦
音から意味を推定した上で
文字にしてる
のかな?

無意味な伏字が出てこない

Winの変換結果は、
ちょいちょい伏字「*」が出力される。

例はこんな感じ↓

  • 才能だけでな*、*の仕事なら~
  • 人的資本が小さ*、*の結果、相対的に**ス資本の比重が~
  • オンラ***カーで生計を~

とりあえず
「くそ」「えろ」「いんぽ」
NGワードで引っ掛かるっぽい。
いんぽ

「えろ」と「いんぽ」はともかく、
「~く、その~」っていうのは
頻出するから、
しょっちゅう伏字になる。

...海藤かよ!

なお、
iOSではそんなことなく、
伏字にならずに出力された。

ただ
これついては、
今Winに上記文章を音声入力したら
伏字にならずに出力したので、
日々改善してるっぽい。

キー入力しても音声入力モードが途切れない

いろいろ書いたけど、
一番便利なのがコレ。

まずは従来のWinの不便さを熱弁

Winでは
改行のためにエンターキーを押すと、
音声入力モードが解除される。

というか改行に限らず、
音声入力モード中にキー入力すると
解除され
てしまう

だから
最終的に改行を反映するには

  1. 改行を無視して一気に入力し、後で手動で改行する
  2. 改行するたびに音声入力モードをONにしなおす
  3. 音声で「改行」と命令して改行させる

のいずれかを
する必要があるんだけど、
1.2.は面倒だし、
3.は改行してくれずに
文中に唐突な「開業」という単語が
挟まることが頻繁におこる(笑)

作業面だけで言えば、
ワード上で「開業」を
改行アクション「^p」で
一括置換すれば一括改行できる
から
3.が一番楽かもしれないけど、

この場合の重大な欠点は
イチイチ「かいぎょう」って
発音しないといけないこと。

作業的には楽だとしても
入力テンポが壊滅的で
音声入力のメリットぶち壊し
なので、
ちょっと採用は考えられない。

iOSは、この不便さが一切なくなる

って感じで
すごく不便だったんだけど、
iOSだと
キー入力しても音声入力モードが
維持されるから、
これが一気に解決された。

手間を比較するとこんな感じ↓

【Win】

音声入力モードにする

音声入力

改行等、キーボード操作
(=強制的に音声入力モード解除)

音声入力モードにする

音声入力

キー操作の度に音声入力ONを繰り返し

だったのが、

【iOS】

音声入力モードにする

音声入力&改行等キーボード操作
(30秒無音でいるまでずっと維持)

になる!

しかも変換精度が良い!

もう
Winを使う理由なんかないでしょ。

現状の音声入力環境の不便さを挙げる

インデント

しいてiOS、
というか現状の不便さを挙げるなら、
Google keepにはインデント機能が
対応してない
っぽいこと。

ボクは
最初に本の目次を書き写して
インデントしてから、
思いついたことを
該当箇所に入力していくので、
インデント機能が欲しい。

ただ、
それはiOSの音声入力とは関係なく、
keepの問題。

だから
インデントが対応してるアプリを
使えばいいだけのこと。

Google Docsとか?

要画面タップ

あとは
なんだかんだで
大きなディスプレイを見ながらの
マウス&キーボード操作に慣れてるから、

小さなスマホ画面にタップする
っていうのにまだ不便さを感じる。

ただこれも
さっきと同じで、
音声入力の問題ではない。

ハードの問題なので、
慣れれば気にならなくなると思う。

ってことで、
現状の作業環境に
改善の余地はあるけれど、
音声入力という点では
iOSで決まり!

余談:Win版はしょっちゅう謎挙動が発生する

余談というか論外というか。

散々比較しておいてアレなんだけど、
Winの音声入力には
比較以前の問題がある。

意味不明なバグ

それは、

入力位置より後ろに
既に文章がある場合、
入力開始時に
その文章の一部が
勝手に出力されてしまう

という謎挙動が度々発生すること。
毎回ではないのがまた厄介

どういうことか例を挙げると、

今、

あいうえおさしすせそ

という文字列の間に
「かきくけこ」を
音声入力することを考える。

「さ」の手前にカーソルを置いて
「かきくけこ」と音声入力すると、

普通に考えると

あいうえおかきくけこさしすせそ

となるところ(句読点は今は無視)
なぜか

あいうえおさしすせそかきくけこさしすせそ

と出力される、ときがある。

※あくまでイメージなので、
バグの条件を正確に再現しているわけではない。

悪い意味での「住めば都」

慣れっていうのは恐ろしくて、
このバグが発生しても
「またか…」って感じで
無駄に出てきた文字列を
淡々と消すだけになる

ただ
こうやって振り返ると
そもそもそんなバグがある状態で
よく使ってたなって思う(笑)

当然、
iOSの方でこんな謎挙動は
発生していない。

ってことで
やっぱり音声入力は
iOS一択だよな、
という話。

以上、

それでは~

作業環境で言えば、あとはスマホの位置を最適化したい。
これ↓
とか自由度高くて良さそうだけど、タップしたらグラグラ揺れそうだよな。。。

↓よければクリックお願いします↓

にほんブログ村 ライフスタイルブログ セミリタイア生活へ
にほんブログ村
この記事を書いた人↓
よしの

◆11年勤めた理系研究職を36歳で辞めた、無職エンジョイ勢(5年目)

◆主な話題:出費記録/甘味/読書感想/節約/各種手続の過程

◆2025年の総出費:年間95万円 (月平均7.9万円)

◆自身の体験に基づくアレコレを書くブログ

よしのをフォローする
スポンサーリンク

コメント