El idioma tucano registra los siguientes fonemas:[2]
Son seis vocales orales. Todas las vocales orales pueden llevar el rasgo supra-segmental +NALSAL, de esta manera ellas pueden contrastar con las vocales orales. Welch y West (1977).
El tucano tiene tres niveles de tono silábico significativo: alto, medio y bajo. Los morfemas monosílabos siempre registran tono alto. En los bisílabos ocurren sólo tres combinaciones: alto-alto, alto-bajo y bajo-alto. En los trisílabos hay dos combinaciones principales: bajo-medio-alto y bajo-alto-bajo, aunque se registran otras cuatro de forma excepcional. El tono alto está asociado con el acento, de manera que toda palabra está acentuada una o más veces. El tono medio podría no ser fonémico y estar asociado a las sílabas intermedias entre tonos diferentes o a casos gramaticales específicos.
Son doce fonemas consonánticos. Las oclusivas sonoras b, d, g y la aproximante palatal j (y) tienen variantes nasales m, n, ŋ (ng), ɲ (ñ), antes de vocal nasal.
El tucano tiene tres niveles de tono silábico significativo:[2] alto, medio y bajo. Los morfemas monosílabos siempre registran tono alto. En los bisílabos ocurren sólo tres combinaciones: alto-alto, alto-bajo y bajo-alto. En los trisílabos hay dos combinaciones principales: bajo-medio-alto y bajo-alto-bajo, aunque se registran otras cuatro de forma excepcional. El tono alto está asociado con el acento, de manera que toda palabra está acentuada una o más veces. El tono medio podría no ser fonémico y estar asociado a las sílabas intermedias entre tonos diferentes o a casos gramaticales específicos.