Microsoft Word: Speech to Text Innovation
Explore Word's new dictation feature, converting spoken language to text, with tips on using Microsoft Word, Stream, and more for transcription tasks.
File
Folge 51 Gesprochenes in Text umwandeln
Added on 01/27/2025
Speakers
add Add new speaker

Speaker 1: Heute geht es um etwas, was eine neue Funktion von Microsoft Word ist und zwar ganz allgemein um die Frage, wie kann ich Sprache, gesprochene Rede in einen schriftlichen Text umwandeln und ganz neu bei Word ist diese Funktion diktieren. Ich klicke da mal drauf und jetzt rede ich einfach mal weiter und schaue, was passiert. Und tatsächlich beginnt jetzt das, was ich sage, direkt in Sätze umzuformulieren.

Speaker 2: Jetzt, mit einem kleinen Einschub, kann ich auch Satzzeichen einfügen.

Speaker 1: Und ihr seht, wie das funktioniert. Noch nicht alles ist ganz perfekt, es hat noch kleine Fehler drin, aber die Funktion lernt auch dazu. Je öfter ihr sie verwendet, desto besser wird sie. Und ich kann jetzt auch recht schnell sprechen und ich denke, das ist eigentlich ganz brauchbar, was jetzt hier Word macht. Das ist der einfache Fall, ihr redet irgendwo rein und möchtet, dass so ein Word-Dokument entsteht. Ich denke gerade auch für Schülerinnen und Schüler, die vielleicht mit der Rechtschreibung nicht so sicher sind, ist dieses neue Feature von Word recht gut brauchbar. Ich schalte es wieder aus und zeige hier, man muss natürlich die richtige Sprache anwählen. Es gibt nicht alle Sprachen im Moment, aber man kann es auch in den zugänglichen Fremdsprachen. Das geht auch in der Word-Version, die ich habe. Ich habe Word kürzlich aktualisiert und dann war diese Funktion da. Ich zeige noch kurz, welche Version ich habe. Es ist Word für Mac-Version 16.36 und die Lizenz ist Office 365 Abo, die Version von 2020. Wenn man das in Word nicht benutzen kann, dann kann ich so noch zwei Workarounds zeigen. Dazu wechsle ich kurz auf mein mobiles Gerät, weil es dort natürlich recht einfach geht. Ich öffne jetzt einfach die Notizbuch-App und versuche jetzt hier etwas zu schreiben. Statt dass ich reinschreibe, klicke ich ganz unten rechts auf das Mikrofon und jetzt spreche ich hier rein in mein Gerät. Das formuliert meinen Text jetzt auch in einen schriftlichen Text um. Nicht alles ist ganz sauber, aber grundsätzlich funktioniert das. Wenn ich langsam und deutlich und abgesetzt spreche, sollte es keine Probleme geben. Ich kann es eigentlich mit der Notizbuch-App machen. Bei Android gibt es ähnliche Features, selbstverständlich auch. Die Profi-Version heisst Dragon, wenn man das ganz oft benutzt. Da klicke ich auch drauf und jetzt geht es los. Das nimmt jetzt mein Diktat auf und schreibt auf, was ich da reinspreche. Das ist eine Profi-Version, da hat es noch ganz viele Features, also spielt ein bisschen damit rum. Aber dieses Dragon, ich zeige es nochmal kurz, es heisst Dragon Anywhere. Wenn ihr das benutzen wollt, ist es kostenpflichtig. Es ist ein Abo-Modell, also nicht für den Low-Level-Einstieg zu benutzen. Da würde ich wiederum mit Bordmitteln arbeiten, also das was an Software schon drauf ist. Das kann eine einfache WhatsApp-Gruppe sein, in der man einfach die Nachrichten reinspricht, ohne sie zu verschicken. Dann kann ich den Text nehmen, kopieren und irgendwo sonst einfügen. Also die meisten Programme können das auf dem Handy. Jetzt möchte ich noch zeigen, wie man ein Ton-File hat. In diesem Fall geht es darum, dass ich ein Video habe und ich möchte gerne den Text aus diesem Video rausziehen. Also gerade wenn ihr Videokonferenzen aufnehmt und ihr möchtet einen Vortrag, ihr möchtet den Vortragstext dort rauskopieren, dann geht das im Moment am einfachsten mit Microsoft Stream. Das Feature ist auch in YouTube drin, Google hat auch eine API, mit der das geht. Das zeige ich dann nachher. Zuerst ist Stream im Office 365-Abo dabei. Ihr erreicht es unter stream.microsoft.com. Einfach mal suchen nach Microsoft Stream in eurer Office 365-Installation. Das ist die Online-Version, da habe ich verschiedene Apps jetzt bei mir drin. Ich bin jetzt eingeloggt, das seht ihr hier oben. Wenn ich da alle Apps ausklappe, dann finde ich ganz vieles, von dem ihr wahrscheinlich gar nicht wisst, dass ihr es habt. Stream ist eine dieser Apps, die bei Microsoft 365 dabei sind. Stream ist die Idee, dass ich in meinem Unternehmen Videos hochladen kann und gerade im schulischen Kontext ist es sehr cool daran. Schülerinnen und Schüler können das nicht runterladen. Ich kann auch bestimmen, dass es nur einzelne Klassen sehen können. Ich habe recht gute Kontrolle über diese Video-Inhalte. Gerade gibt es viele Lehrpersonen, die lieber Dinge nicht auf YouTube laden möchten, die nur für eine Klasse gedacht sind. Da ist Stream optimal, wenn ihr eine Teams-Installation habt oder Office 365. Wenn ich dann ein Video hochlade, kann ich einfach erst stellen und dann kann ich ein Video hochladen. Das habe ich jetzt hier gemacht. Ich habe einer Klasse erklärt, wie eine philosophische Erörterung funktioniert. Da wird jetzt automatisch mein Text aufgezeichnet. Ich kann auch tatsächlich diese Aufzeichnung durchsuchen. Wenn ich jetzt sage, wo kommt das Wort Thema vor, dann zeigt es mir die Stellen an, wo ich Thema gesagt habe. Ich habe Schweizerdeutsch gesprochen, Dialekt in diesem Video, deshalb ist die Transkription nicht so ganz ideal. Aber grundsätzlich funktioniert das sehr gut. Es hat noch coolere Features. Ich zeige noch etwas kurz, wenn ich mir einen Exkurs erlauben darf. Normalerweise bin ich im Unterrichtszimmer immer so in dem Modus, wo ich noch über Dinge spreche, die vielleicht gar nicht so direkt da hingehören. Ich erlaube mir das deshalb jetzt hier noch zu machen. Mal schauen, ob ich es noch finde. Ja, ich finde es gar nicht mehr, mein Video, das ich da hochgeladen habe. Was ich auch machen kann, ist jeweils die Sprecher anzeigen. Ich zeige das hier noch. Verlinke den Artikel dann auch gleich unten, wo ich das aufgeschrieben habe. Hier habe ich nämlich das in einem Blogpost schon mal kurz begründet, weshalb ich Stream sehr überzeugend finde. Dann zeige ich zum Schluss noch ein letztes Tool, mit dem ich Sprache in Text ändern kann. Was Stream auch macht hier, ist ein Video, bei dem viele Personen vorgekommen sind. Ihr seht jetzt hier, das zeigt dann unterhalb an, wer wann gesprochen hat, sodass ich dann eigentlich direkt auf die Stelle klicken könnte, in der eine bestimmte Person geredet hat. Wenn ihr jetzt an Zoom-Meetings denkt oder Teams-Meeting, die ihr aufzeichnet, dann wieder verwertet, dann wäre es damit sehr einfach möglich, unterschiedliche Sprecherinnen und Sprecher zu identifizieren. Ihr seht, Stream macht sogar ein Bild von der Person, sodass ich wiedererkennen kann, wer das war. Das sind all die Stellen, an denen ich jetzt gesprochen habe. Das bin ich. Das sind dann andere Personen, die in diesem Video vorkommen. Also diese Auswertung von Stream ist wirklich hervorragend, ein sehr verstecktes Feature, das viele nicht kennen. Ich zeige als letzte Möglichkeit, um Sprachfiles in Text zu verwandeln, Aufonic. Das ist ein Tool, das man für Podcasts, für Audio-Files verwenden kann, um Audio-Dateien zu optimieren. Das läuft dann sehr automatisiert ab. Also wenn ich jetzt hier diesen Text aufnehme und bevor ich ihn dann bei YouTube publiziere, könnte ich ihn dann noch mit Aufonic leveln lassen, sodass der Ton wirklich sehr angenehm zu hören ist. Dafür ist diese App gemacht und ich kann jetzt hier Speech Recognition, ich kann einen Dienst einbinden und habe das auch tatsächlich schon gemacht. Mit der Google-AP habe ich diesen Dienst benutzt. Google kann das auch natürlich, Sprache in Text umwandeln und habe dann eine Folge, die Folge 48, umgewandelt. Ihr seht, da unten habe ich ein Video oder ein Audio-File, bei dem ich an jedem Ort auch lesen kann, was da gesagt wird und könnte dann eigentlich das ganze Transkript auch durchsuchen. Ich kann es auch als Text-File runterladen. Also hier kann ich jetzt auf Download klicken und ich habe die ganze Podcast-Folge jetzt hier als Text-File. Das ist jetzt alles, was ich gesagt habe und das könnte ich jetzt so runterladen. Aufonic, ihr seht vom Menü her, das ist jetzt nicht ganz so ein Klick machen, sondern es braucht einige Einstellungen. Das ist wie das Tool für Profis. Ich fasse kurz zusammen. Wenn ihr ganz einfach Word-Dokumente erzeugen wollt, in dem ihr diktiert, neuste Wörter runterladen, das läuft. Wenn ihr das sonst machen wollt, benutzt ein Handy. Da gibt es viele schon Bordmittel, wo man Sprache in Text umwandeln kann. Es geht ganz einfach. Wenn ihr es mit bestimmten Videodateien macht, würde ich Microsoft Stream empfehlen und für Audio-Dateien Aufonic. Bereit seid, euch ein bisschen reinzuknien.

ai AI Insights
Summary

Generate a brief summary highlighting the main points of the transcript.

Generate
Title

Generate a concise and relevant title for the transcript based on the main themes and content discussed.

Generate
Keywords

Identify and highlight the key words or phrases most relevant to the content of the transcript.

Generate
Enter your query
Sentiments

Analyze the emotional tone of the transcript to determine whether the sentiment is positive, negative, or neutral.

Generate
Quizzes

Create interactive quizzes based on the content of the transcript to test comprehension or engage users.

Generate
{{ secondsToHumanTime(time) }}
Back
Forward
{{ Math.round(speed * 100) / 100 }}x
{{ secondsToHumanTime(duration) }}
close
New speaker
Add speaker
close
Edit speaker
Save changes
close
Share Transcript