spracherkennung
Neu entdeckte Hunde-Spracherkennung: 2022

Einführung

Die Spracherkennung ist eine Fähigkeit, die der Mensch beherrscht, die aber der künstlichen Intelligenz seit Jahrzehnten verwehrt bleibt. Andererseits waren Hunde schon immer in der Lage, uns zu verstehen. Jetzt haben Wissenschaftler entdeckt, dass Hunde ein ähnliches System zur Erkennung menschlicher Sprache verwenden wie wir.

Die Fähigkeit, Sprachlaute zu erkennen, gilt als einzigartig für den Menschen. Eine neue Studie, die in der Zeitschrift Science veröffentlicht wurde, zeigt jedoch, dass Hunde ein ähnliches System nutzen, um menschliche Sprache zu erkennen.

Studie

Die Autoren der Studie nutzten fMRI-Scans, um die Gehirne von 18 Hunden abzubilden, während sie ihren Trainern beim Sprechen verschiedener Wörter zuhörten. Die Forscher fanden heraus, dass die Gehirne der Hunde ähnliche Aktivitätsmuster aufweisen wie die von Menschen, wenn sie Sprache hören.

Tabelle 1 zeigt die Rassen, die neurozephalen Indizes und das Alter der teilnehmenden Hunde.

Diese Entdeckung deutet darauf hin, dass Hunde eine Form der inneren Sprache besitzen, die es ihnen ermöglicht, die menschliche Sprache zu verstehen. Die Erkenntnisse könnten Wissenschaftlern auch dabei helfen, bessere Systeme der künstlichen Intelligenz zu entwickeln, die Sprache erkennen.

Bislang wurde die Forschung nur an einigen wenigen Hunden durchgeführt, so dass weitere Studien erforderlich sind, um die Ergebnisse zu bestätigen. Aber wenn die Ergebnisse gesichert sind, könnte dies unsere Sichtweise auf die Kommunikation von Tieren verändern.

Besondere Form der Ansprache

Alle Sprachen haben ausgeprägte prosodische und phonologische Aspekte, die der Mensch lernt, bevor er die semantischen oder syntaktischen Aspekte der Sprache überhaupt versteht.

Einer neuen Studie zufolge verwenden Hunde ein ähnliches System wie Menschen, wenn sie versuchen, Sprache zu verstehen.

Die Urheberrechte an dieser Abbildung liegen bei sciencedirect.com

Abb. 1. Alle Töne > Stille (n = 18) zeigt die Ergebnisse des Ganzhirnkontrasts. Das BOLD-Signal in den bilateralen auditorischen Regionen ist über einer Vorlage des Hundegehirns (Czeibert et al., 2019) dargestellt (punc = 0,001, cluster level corrected pFWE < 0,05). L = Links; R = Rechts.

Menschen verwenden eine besondere Form der Sprache, wenn sie mit Hunden sprechen, die sich von der Art und Weise unterscheidet, wie sie mit anderen Menschen sprechen. Diese “hundeorientierte Sprache” zeichnet sich durch eine höhere Tonlage und eine übertriebene Intonation aus. Sie ist effektiver, um die Aufmerksamkeit des Hundes zu gewinnen und mit ihm zu kommunizieren.

Die Urheberrechte an dieser Abbildung liegen bei sciencedirect.com

Abb. 2. Ergebnisse einer MVPA-Studie über die Fähigkeit des Hundehirns, Sprache im Gehirn zu repräsentieren. Verschiedene neuronale Repräsentationen für die Spracherkennung (rote Skala) und die Sprachrepräsentation sind in Clustern der Suchscheinwerferanalyse (blaue Skala) dargestellt. Ein Vorlage-Hundegehirn wird verwendet, um laterale und axiale Ansichten zu zeigen (Czeibert et al., 2019) (Cluster korrigiert p 0,05). Der t-Wert wird durch einen Farbbalken dargestellt. ESG (ektosylvianisch), cESG (kaudal ektosylvianisch) und cSSG (kaudal suprasylvianisch) sind die kaudalen ekto- bzw. suprasylvianischen Gyri, und cESG und cSSG sind die kaudalen bzw. suprasylvianischen Gyri. Wenn Sie Hilfe bei der Interpretation der Farbangaben in dieser Abbildungslegende benötigen, lesen Sie bitte die Webversion dieses Artikels.

Methoden

Um herauszufinden, wie gut Hunde Sprache verarbeiten können, wurde ein Steppalgorithmus verwendet, um natürliche Sprache zu verwirren und sie den Hunden im Wachzustand zu präsentieren. Dieser Steppalgorithmus ist eine Art der Sprachverarbeitung, die es den Zuhörern erschwert, das Gesagte zu verstehen. Der Algorithmus wurde auf menschliche Sprachaufnahmen angewandt, die dann den Hunden in verschiedenen Lautstärken und mit unterschiedlicher Betonung vorgespielt wurden.

Die Hunde in der Studie wurden darauf trainiert, auf zwei Arten von menschlicher Sprache zu reagieren: Kommandos und Fragen. Bei den Kontrollen handelte es sich um einfache Ein-Wort-Befehle wie “Sitz” oder “Bleib”. Die Fragen waren komplexer und bestanden aus mehreren Wörtern, z. B. “Wie heißt du?” oder “Wo ist dein Futternapf?”.

Tabelle 2. MVPA-Cluster diskriminieren zwischen den Bedingungen im Hundegehirn.

Den Hunden wurden dann Aufnahmen dieser Arten von Sprache vorgespielt, wobei die Lautstärke und die Intonation variierten. Die Forscher beobachteten die Gehirnaktivität der Hunde mit fMRI-Scans, um zu sehen, wie sie die Ansprache verarbeiteten.

Simulation

Die Stimuli wurden erstellt, indem ganze Sätze aus jeder Aufnahme extrahiert wurden (alle begannen und endeten mit 0,3 Sekunden Stille), die dann zu 8,3 Sekunden langen Fragmenten zusammengefügt wurden. Somit enthielt jeder Versuch mehrere Sätze und begann und endete immer an einer Satzgrenze.

Mit dieser Methode erhielten sie 24 einzigartige Sprachfragmente für jede Sprache. Es gab keine signifikanten Unterschiede in der Anzahl der Silben pro Fragment zwischen den Sprachen (Ungarisch: M = 41, SD = 3.3, Bereich 36 bis 49; Spanisch: M = 40, SD = 3,2, Bereich 32 bis 46; t(46) = -1,52, p = 0,14).

Sie quantifizierten und verglichen auch einige sprecherbezogene Unterschiede in den Proben.

  • Zunächst berechneten wir die mittlere Grundfrequenz (f0), die über die Gesamtdauer jedes Sprachfragments gemessen und gemittelt wurde.
  • Zweitens haben wir im gleichen Zeitfenster die ersten fünf Formanten als Mittelwert der langjährigen Durchschnittsspektren gemessen und den durchschnittlichen Abstand zwischen ihnen, d. h. die Formantendispersion (FD), berechnet (Riede and Fitch, 1999).

Diese Parameter unterschieden sich nicht zwischen den Sprechern (f0: ungarischer Sprecher: M = 197 Hz, SD = 8,5 Hz, Bereich 179 bis 213 Hz; spanischer Sprecher: M = 202 Hz, SD = 13,2 Hz, Bereich 176 bis 216 Hz; t(46) = -1,605, p = 0,12. FD: Ungarischer Sprecher: M = 1056 Hz, SD = 12 Hz, Bereich 1029 bis 1079; spanischer Sprecher: M = 1059 Hz, SD = 12 Hz, Bereich 1037 bis 1092; t(46) = -0,8, p = 0,21).

Gestaltung

  • In einem Blockdesign präsentierten sie die 24 Sprachfragmente jeder Sprache in einem einzigen Durchgang von etwa 5 Minuten Dauer.
  • Die Reihenfolge der Präsentation war pseudo-randomisiert, so dass sich zwei aufeinanderfolgende Versuche in mindestens einem semantischen Merkmal und nicht mehr als zwei Formantfrequenzen unterschieden (um Übertragungseffekte zu minimieren). 
  • Jeder Test begann mit einem Fixationskreuz für 500 ms, gefolgt von dem Sprachfragment für 8300 ms, und endete mit einem weiteren Fixationskreuz für 1500 ms.
  • Es gab 12 Blöcke von Versuchen (4 Blöcke pro Sprache), die in einer für alle Versuchspersonen ausgeglichenen Reihenfolge präsentiert wurden. Jede Versuchsperson hörte alle drei Sprachen, aber auch die Reihenfolge der Sprachen war zwischen den Versuchspersonen ausgeglichen.”

Die Hunde in der Studie wurden darauf trainiert, auf menschliche Befehle und Fragen zu reagieren. Die Forscher fanden heraus, dass die Gehirne der Hunde unterschiedlich auf Befehle und Fragen reagierten.

Datenerfassung

Zur Erfassung der fMRI-Daten wurden die Hunde darauf trainiert, still im Scanner zu liegen und Ohrenschützer zu tragen, um ihr Gehör zu schützen. Der Scanner verursachte während des Scannens laute Geräusche, so dass die Ohrenschützer notwendig waren, um das Gehör der Hunde zu schützen.

Die Forscher verwendeten ein spezielles MRT-Gerät, das für Tiere entwickelt wurde. Dieses Gerät ist kleiner als ein normales MRT-Gerät und hat einen speziellen Tisch, auf dem die Tiere liegen können.

Die Forscher verwendeten auch eine spezielle MRT-Spule, die für Tiere entwickelt wurde. Diese Spule ist kleiner als eine normale MRT-Spule und hat die Form eines Donuts. Die Spule wird um den Kopf des Tieres gelegt und hilft dabei, klare Bilder des Gehirns zu erzeugen.

Ergebnis

Die Ergebnisse zeigten, dass die Gehirne der Hunde unterschiedlich auf Befehle und Fragen reagierten. Wenn sie Befehle hörten, zeigten die Gehirne der Hunde ähnliche Aktivitätsmuster wie die von Menschen, wenn sie der Sprache zuhörten. Dies deutet darauf hin, dass Hunde ein ähnliches System wie Menschen verwenden, wenn sie versuchen, Sprache zu verstehen.

Die Forscher fanden auch heraus, dass die Gehirne der Hunde je nach Intonation der Frage unterschiedlich auf diese reagierten. Die Gehirne der Hunde zeigten keine besondere Aktivität, wenn die Frage mit einer flachen, monotonen Stimme gesprochen wurde. 

Schlussfolgerung

Aus dieser Studie können wir eine Menge darüber lernen, wie Hunde Sprache verarbeiten. Die Forscher glauben, dass Hunde beim Verstehen von Sprache ein System verwenden, das dem unseren sehr ähnlich ist. Mithilfe dieser Informationen können Menschen und Hunde besser miteinander kommunizieren.

Referenzen:

Cuaya, L., RaúlHernández-Pérez, R., Boros, M., Deme, A., Andics, A. (12 December 2021). Speech naturalness detection and language representation in the dog brain https://www.sciencedirect.com/science/article/pii/S105381192101082X

You can share this post!

Beitragskategorien

Kürzliche Posts

Eine Nachricht schicken

Post-Tags