Neuronale Netzwerke ermöglichen detaillierte Abbildung von Stimmlautidentität im Gehirn
Sonstige: Neuronale Netzwerke ermöglichen detaillierte Abbildung von Stimmlautidentität im Gehirn
Hintergrund
Forscher haben bereits festgestellt, dass sowohl Menschen als auch nicht‑menschliche Primaten beim Verarbeiten von Stimminformationen spezialisierte Hirnregionen aktivieren, die als temporale Stimmbereiche (TVAs) bezeichnet werden. Diese Regionen zeigen eine bevorzugte Reaktion auf vokale Signale von Artgenossen, doch die genaue Repräsentation von Sprecheridentität innerhalb dieser neuronalen Populationen blieb bislang unklar.
Methodik
In einer neuen Studie wurde ein tiefes neuronales Netzwerk (DNN) trainiert, um einen hochdimensionalen, aber kompakten Darstellungsraum für Stimmlautidentität zu erzeugen, den die Autoren als „voice latent space“ (VLS) bezeichnen. Anschließend wurden funktionelle Magnetresonanztomographie‑Messungen (fMRT) von Probanden ausgewertet, die auf Zehntausende von Stimmstimuli von mehreren hundert Sprecher*innen reagierten. Die Analyse umfasste Kodierungs‑, Repräsentations‑Ähnlichkeits‑ und Decodierungsverfahren, um die lineare Beziehung zwischen VLS und zerebraler Aktivität zu prüfen.
Ergebnisse im Vergleich von TVAs und primärem auditorischem Kortex
Die Untersuchung ergab, dass der VLS die fMRT‑Daten der TVAs signifikant besser erklärt als die des primären auditorischen Kortex (A1). Die strukturelle Ähnlichkeit zwischen dem VLS und den gemessenen Aktivitätsmustern war insbesondere in den TVAs ausgeprägt, was auf eine spezialisierte Verarbeitung von Sprecheridentität in diesen Bereichen hinweist.
Rekonstruktion von Stimuli
Durch die Nutzung des VLS konnten die Forscher Stimuli aus den TVA‑Aktivitätsmustern rekonstruieren. Diese Rekonstruktionen bewahrten zentrale Merkmale der Sprecheridentität, wie von automatisierten Klassifikatoren und von menschlichen Zuhörern beurteilt wurde. Beide Bewertungsgruppen erkannten die rekonstruierten Stimmen zuverlässig als zugehörig zu den ursprünglichen Sprechern.
Bedeutung der Befunde
Die Resultate legen nahe, dass das durch das DNN abgeleitete VLS hochgradige, abstrahierte Repräsentationen von Stimmlautidentität in den TVAs bereitstellt. Damit wird ein wichtiger Schritt zur Erklärung geleistet, wie das menschliche Gehirn komplexe akustische Merkmale wie die Identität eines Sprechers verarbeitet.
Ausblick
Die Studie eröffnet Perspektiven für weitere Forschungen, die darauf abzielen, neuronale Repräsentationen von Sprache und Stimme genauer zu kartieren und potenziell für Anwendungen in der Neurotechnologie und in der Sprachverarbeitung zu nutzen.Dieser Bericht basiert auf Informationen von eLife, lizenziert unter Creative Commons BY 4.0 (Open Access). Wissenschaftliche Inhalte, offen zugänglich.
Ende der Übertragung
