Wg Romana Jakobsona i Morrisa Halle (1962): "Fonem, jak zauważył [Edward ] Sapir, <z niczym nie pozostaje w osobnym, właściwym sobie związku odpowiadania> (has no singleness of reference) (...) Żaden fonem nie sygnalizuje nic poza innością (otherness). Ten brak indywidualnej wartości sygnalizacyjnej odróżnia cechy dystynktywne i ich kombinacje w fonemy od wszelkich innych jednostek językowych. (...) Zespoły cech dystynktywnych występują jednocześnie, stanowiąc pęki zwane fonemami; fonemy następują po sobie tworząc ciąg; elementarnym układem (pattern) leżącym u podstawy każdego zgrupowania fonemów jest sylaba."
Wg Umberto Eco (1991): "Fonem jest najmniejszą jednostką posiadającą dystynktywne cechy dźwiękowe; jego wartość określa jego pozycja i jego odmienność od innych elementów. Fonem może wykazywać warianty fakultatywne, odmienne u różnych mówiących, które jednak nie zacierają różnic decydujących o znaczeniu. System fonemów jest systemem różnic, który może być analogiczny w różnych językach, nawet jeśli wartości fonetyczne (fizyczna jakość dźwięków) są odmienne."