AI議事録、精度90%の正体と残る10%の落とし穴
ホーム Askiveデイリー

Askiveデイリー #33 ・ 2026-06-01

AI議事録、精度90%の正体と残る10%の落とし穴

ある中堅メーカーの会議室で、こんな場面に立ち会ったことがある。営業部長が前週の商談議事録を読み上げながら、途中で眉をひそめた。「この『発注済み』ってどこから出てきた?」。AIが自動生成した議事録には、相手企業の担当者が「発注を検討します」と言った箇所が、なぜか「発注済みです」と書き起こされていた。原稿は確かに90%以上が正確だった。ただ、間違っていた残りの数行が、たまたま金額の意思決定に直結する一文だった。

導入担当者は焦って言った。「精度95%って書いてあったんですよ」。誰も嘘はついていない。それでも現場は混乱した。AI議事録ツールの「精度」という言葉が、実務の感覚と食い違っている典型例だった。

「精度90%」の中身を分解する

音声認識AIのベンダーが掲げる精度指標は、たいていWER(Word Error Rate、単語誤り率)で算出されている。1000単語のうち何単語を間違えたかを測る指標だ。WER10%は、確かに「90%正確」と言い換えても嘘ではない。

ただし、ここに観察すべき癖がある。WERは助詞の取りこぼしも、固有名詞の致命的な誤変換も、同じ「1単語の誤り」として数える。「てにをは」を10個落とすのと、「未発注」を「発注済」と書き換えるのは、機械から見れば同じ重みなのだ。

Stanford AI Index 2026(2026-06-01確認)が報告する通り、汎用音声認識モデルの英語WERはここ2年で約8〜12%の範囲に収まっている。日本語はやや劣り、業界別の専門用語が混じると15〜20%まで悪化するケースが普通に観測される。中堅社員1人が1時間の会議を文字起こしする労力(実測でおよそ3〜4時間)を考えれば、十分に元は取れる水準だ。問題は元の取れ方ではなく、残った1〜2割の誤りがどこに落ちるかの方にある。

落ちる場所には法則がある

100以上の議事録ログを観察すると、AIが間違える箇所には偏りがある。

第一に、固有名詞。社名、人名、製品名、業界略語。学習データに登場頻度が低いものほど、近い音の一般名詞に吸い寄せられる。「アスクル」が「明日来る」になり、「SaaS」が「サース」のままテキストに残る。

第二に、否定形と数値。「やらない」が「やる」に、「3000万」が「300万」に化ける現象は、決して珍しくない。脳科学的にいえば人間も同じで、ノイズの中では否定情報を聞き落とす。AIも統計的に「肯定形の方が出現頻度が高い」ため、迷ったら肯定に倒す傾向がある。

第三に、話者の重なり。2人以上が同時に話した瞬間、AIはどちらか一方を捨てるか、両方をマージして意味不明な文を吐き出す。Granolaのような近年の議事録ツールはこの問題を改善したと謳うが、複数人会議のログを通しで読むと、白熱した議論の山場ほど記録が薄くなる傾向は依然として残っている。

つまり精度90%とは、「読みやすい部分が90%」であって、「意思決定に使える部分が90%」とは限らない。この差を埋めないまま導入すると、冒頭の営業部長のような事故が起きる。

それでも導入する価値はある、ただし配置を間違えなければ

ここで議事録AIを否定するのは早計だ。AINOWやMicrosoft公式ブログ(2026-06-01確認)が紹介する導入事例を眺めていると、うまくいっている企業には共通の配置がある。AIに「下書き」を作らせ、人間が「意思決定箇所」だけを検算する運用に切り替えているのだ。

たとえば従業員80人のあるIT企業では、週12本の社内会議すべてにAI議事録を導入し、参加者の1人が会議後10〜15分だけ「金額」「期限」「担当者」「決定事項」の4項目をログから抽出して確認する運用にした。文字起こしに費やしていた時間は月およそ40時間から月8時間へ圧縮された。中堅社員1人の週1日分が浮いた計算になる。

注目すべきは、彼らが「精度を上げる」ではなく「誤りの当たりをつけて潰す」方向に切り替えた点だ。AIに完璧を求めず、誤りやすい場所を運用で囲い込む。配置の妙である。

「AIが議事録を書く時代」の隠れたコスト

便利になるはずの仕組みが、入れた瞬間に重荷になることもある。議事録AIで最も観察されるのは、「全部記録される」ことによる発言の萎縮だ。

ある制作会社のディレクターが漏らしていた。「冗談が言えなくなった」。雑談から生まれるアイデアの種が、ログ化される前提だと出にくくなる。これは技術の問題ではなく、人間の問題である。心理学では「観察者効果」と呼ばれる現象で、記録されると知っている人間は発言を最適化する。会議の生産性指標は上がっても、創造性指標は下がる、ということが起こりうる。

もう一つはプライバシーと情報統制だ。クラウド型の議事録AIは録音データを外部サーバに送信する。取引先との商談を録音する場合、相手の同意取得が法的にも実務的にも必要になる。ローカル処理型の議事録ツールが2026年に入って増えてきたのは、この摩擦の裏返しでもある。

90%の中身を疑える人が、導入の主導権を握る

ベンダーが提示する精度数値は嘘ではない。ただ、その数字が何を測り、何を測っていないかを読み解ける担当者が社内にいるかどうかで、導入後の景色は大きく変わる。

AIが「会議の8割を片付ける道具」であるのは間違いない。残った2割を、どこに、どう人間の手で配置するか。そこから先は、ツール選定の話ではなく、業務設計の話になる。導入を急ぐ企業ほど、この境界線を曖昧にしたまま「AIが議事録を書いてくれる」と社内に告知してしまう。期待値が一段高い場所に置かれた瞬間、現場の小さな誤変換が「AIは使えない」という結論にすり替わっていく。

精度90%のAIは、実際にはとても優秀だ。問題はいつも、残り10%の置き場所である。

本記事はAI編集を経たのち、編集長が事実確認と品質チェックを実施しています。