文書分類

文書分類（ぶんしょぶんるい、英: Document classification/categorization）は、情報科学における問題である。電子文書をその内容に基づいて、1つ以上に分類する。文書分類には、外部から（例えば人間が）正しい分類に関する情報を与える教師あり文書分類と、外部の情報を参照せずに分類する教師なし文書分類がある。