文字起こし

文字起こし（もじおこし）とは、音声や動画に含まれる発話内容を文字として書き起こす作業を指す。会議記録やインタビュー、講演、裁判記録、学術研究、動画字幕の作成など、幅広い分野で利用されている。

現代日本語においては、「文字起こし」が録音・録画媒体を限定しない総称として最も一般的に用いられており、「テープ起こし」「反訳」などの関連する呼称が存在する。^[1]

項目	手動文字起こし	自動文字起こし
品質	極めて高い。話者の特定、専門用語、方言、雑音があっても正確に再現可能。	中程度〜高い。同音異義語や専門用語、複数話者の区別に弱く、条件によって誤認識が生じる。
納期/速度	人の作業時間を要する。	比較的短時間で処理可能。
費用	高価（人件費がかかるため）。	安価または無料の場合が多い。
処理手順	専門の反訳者が音声を再生し、手動でタイピング・校正・ケバ取り・整文などを行う。	AIが音声をテキストに変換し、ユーザー自身が校正（ケバ取り、整文など）を行う必要がある。
得意な用途	裁判記録、医療記録、重要な会議議事録、聞き取りにくい講演。	社内メモ、簡単なWeb会議、動画の仮字幕、速報性が必要な場面。
メリット	最高精度の納品物、整文・要約など付加サービスの利用が可能。	スピード、低コスト。
デメリット	高コスト、納期も比較的長い。	校正作業が必須、音質不良に弱い。

文字起こしの方法