Speaker 1: Text-to-Speech ist ein Teil der generativen KI, mit der du Text in gesprochene Sprache umwandeln lassen kannst. Früher wurde diese Technologie häufig für Menschen mit Sehbehinderung oder Lernschwächen genutzt, um den Zugang zu Geschriebenen zu erleichtern. Doch heute sieht es ganz anders aus und die Anwendungsbereiche sind vielfältiger. Vom E-Learning bis hin zu Podcasts, Hörbüchern oder auch für Marketing-Videos. Text-to-Speech kann für die verschiedensten Bereiche eingesetzt werden. Ich sehe zum Beispiel auch immer mehr Kurzvideos auf Social Media oder auch YouTube-Videos, wo ganz klar zu erkennen ist, dass hier ein Text-to-Speech-Tool eingesetzt wurde, was nicht heißen soll, dass es schlecht klingt. Denn mittlerweile haben diese Art von KI-Tools sehr fortgeschrittene Modelle, in denen du zum Beispiel, wie du später auch sehen wirst, die Emotionen der Stimme auswählen kannst. Und das macht das Ganze wirklich spannend, wie ich finde. In diesem Video stelle ich dir meine Top 3 Text-to-Speech-Tools vor, mit denen du einiges anstellen kannst. Jedes dieser Tools verlinke ich dir wie immer auch unter dem Video in der Beschreibung und ich wünsche dir jetzt viel Spaß mit dem Video. Wir starten mit dem ersten Tool und dieses nennt sich Merv.ai. Du siehst hier oben Produkte, Text-to-Speech, sogar Voice-Cloning, Voice-Over-Video, Voice-Over-Google-Slides-Add-on, Voice-Changer und eine API, also Merv.ai. Er hat einige Funktionen zu bieten und wenn du die Use Cases anschaust, dann siehst du hier sehr, sehr viel. Wie auch schon am Anfang des Videos gesagt, es gibt mittlerweile sehr, sehr viele Einsatzbereiche. Wir gehen direkt in das Tool rein und so sieht eben die Startseite aus. Du klickst dann einfach auf Create Project und dann kannst du nämlich hier auswählen, ob du nur Audio möchtest oder auch Video. Wir lassen es jetzt mal bei Audio, könnten jetzt hier eine Vorlage auswählen. Ich klicke aber auf Start Blank und dann klicke ich auf Create Project. Und nun haben wir hier den Bereich, wo wir eben unseren Text eingeben können und hier oben links kann ich die Stimme auswählen. Und hier siehst du jetzt, gibt es einige zur Auswahl. Wir können hier links jetzt erstmal die Sprache auswählen. Da klicke ich auf Deutsch und dann sehen wir alle verfügbaren deutschen Stimmen. Es gibt die Pro-Stimmen auch im zahlungspflichtigen Tarif, aber du kannst Merv auch kostenlos ausprobieren. Und wenn du dann auf die Stimme klickst, kannst du diese auch anhören.
Speaker 2: Wenn Sie eine sanfte und professionelle Stimme brauchen, könnte ich das auch tun.
Speaker 1: Und wenn dir eine gefällt, dann kannst du eben auf Select drücken und diese ist hier nun ausgewählt. Ich muss ehrlich sagen, Merv gefällt mir sehr gut, aber die Auswahl von deutschen Stimmen ist jetzt noch nicht so ausgereift. Englische Stimmen gibt es aber auf jeden Fall genug. So nun geben wir mal einen Beispieltext ein und dann klicke ich eben auf Generate Audio und dann wird dieser Text in Audio umgewandelt. Anschließend können wir auf Play drücken.
Speaker 2: Das hier ist ein Test. Ich möchte die Stimme hören und Merv etwas testen.
Speaker 1: Und dann hören wir eben das, was wir eingegeben haben. Wir können jetzt auch noch Einstellungen vornehmen, zum Beispiel den Pitch. Wenn ich das hier auf plus 25 verändere, dann hörst du.
Speaker 2: Das hier ist ein Test. Ich möchte die Stimme hören und Merv etwas testen.
Speaker 1: Dann hört sich die Stimme eben höher oder auch tiefer an. Wir nehmen jetzt mal das Extrembeispiel auf minus 50, klicken wieder auf Generate Audio, drücken auf Play.
Speaker 3: Das hier ist ein Test. Ich möchte die Stimme hören und Merv etwas testen.
Speaker 1: Also dann hört sich das Ganze sehr sehr künstlich an. Deshalb würde ich das Ganze immer auf Null lassen und dann könnten wir hier noch die Geschwindigkeit auswählen. Du kannst eben hier in Merv einzelne Blöcke erstellen, d.h. Abschnitte, damit du auch eine bessere Übersicht hast. So gibst du eben Abschnitt für Abschnitt ein, Block für Block. Und wenn du fertig bist, dann klickst du auf Export und du siehst, du kannst das Ganze als eine einzelne Datei downloaden oder auch aufgesplittet Block für Block downloaden. Du kannst verschiedene Formate auswählen, die Qualität in Stereo oder Mono. Du kannst es auch mit Musik zusammen downloaden, wenn du das Ganze so erstellst. Du könntest z.B. auch nur das Skript downloaden. Also du hast hier mehrere Möglichkeiten, auch mit Video und Voice und Music. Das sind eben die Möglichkeiten, wie du es dann nutzen kannst, wenn es fertig ist. Du könntest auch hier ein Skript importieren und du kannst natürlich auch Mediadateien, d.h. Musik, Bilder und Videos hinzufügen und könntest dann direkt in Merv ein Video erstellen. Weiter geht es mit dem zweiten Tool und das nennt sich PlayHT. PlayHT ist ein Tool, welches auch einige Funktionen hat, z.B. die ultrarealistische Stimme. Es gibt außerdem über 800 Stimmen in über 130 Sprachen, Voice Cloning auch, Text-to-Voice Editor und dann noch einige weitere Funktionen. Wir springen direkt mal rein. So, wir sind jetzt hier drinnen und dann kannst du eben hier auf der linken Seite die Kategorie auswählen, AI Voice Overs. Du kannst hier auf Voices klicken und dann siehst du alle Stimmen, die in PlayHT vorhanden sind. Und oben wählen wir mal die Sprache aus. Wir können Standard- oder die Premium-Stimme auswählen und auch das Geschlecht. Und wenn du dann hier auf dieses Icon klickst mit dem Lautsprecher, dann kannst du die Stimme anhören. So eine deutsche Stimme gibt es in PlayHT vier Seiten, also ein bisschen mehr als bei Merv. Und letztendlich funktioniert es ähnlich. Du wählst die Stimme aus, klickst auf Use Voice und dann öffnet sich der Editor. Und dieser sieht eben ähnlich wie ein Word-Dokument aus. Du kannst hier das Skript einfügen oder auch einen Text eingeben. So, wenn du den Text eingegeben hast, kannst du hier wieder auf dieses Symbol klicken. Und dann hörst du das Ganze. Du kannst auch hier Pausen hinzufügen und so hast du eben einige Möglichkeiten, dann das Ganze auch später zu konvertieren und zu downloaden. Dann hat PlayHT noch das Voice Cloning. Hier kannst du auf Clone a Voice klicken. Und hier hast du jetzt eben die zwei Möglichkeiten zwischen High Fidelity und Instant. Bei Instant reichen 30 Sekunden Audio-Datei, bei High Fidelity musst du eben bis zu 30 Minuten hochladen, bekommst aber dementsprechend dann auch ein besseres Ergebnis. Dann hast du noch weitere Funktionen, wie zum Beispiel die API oder auch hier verschiedene Integrationen, zum Beispiel WordPress Plugin für Webseiten, Chrome Extension und so weiter, Audio Widgets, Podcast Hosting. Also du siehst, Play.HT hat einige umfangreiche Funktionen und ist es auf jeden Fall wert, einmal, zumindest mal, getestet zu werden. Das nächste Tool nennt sich lovo.ai. Du siehst hier Realistic AI Voices that Captivate Your Audience. Features sind unter anderem Text-to-Speech, dann auch Voice Cloning. Es gibt einen Online Video Editor, AI Voices, dann einen AI Art Generator und einen AI Writer. Wir loggen uns zuerst mal ein und klicken dann auf New Project, dann Voice Over oder Video. Wir nehmen jetzt mal nur Voice Over und jetzt haben wir eben hier auch auf der linken Seite die Sprecher, die wir auswählen können. Es gibt Pro-Stimmen also, die du in einem Premium Zahlungsplan dann mit drin hast. Es gibt die Rapid Voice, Fast Generating Voices and Voices that can express up to 25 different emotions, aber nur in Englisch leider. Dann die Global Voices, dann auch das Voice Cloning, Collectable Voice, das heißt hier kannst du NFT-Stimmen nutzen. Bei den Pro-Voices wählen wir jetzt mal Mail aus. Du kannst hier sogar das Alter auswählen, das heißt Erwachsen oder eben Jung und Use Case kannst du auch auswählen. Wir belassen es jetzt mal hierbei. In der Pro-Voice sind eben nur englischsprachige Rapid Voices. Sehr, sehr cool, du kannst hier nämlich die Emotion auswählen, leider, leider, aber ist das nur in Englisch verfügbar. Und Global Voice, hier gibt es dann eben die Sprachauswahl. Wir wählen Deutsch aus und dann siehst du, es gibt nicht allzu viele, aber einige Stimmen, zum Beispiel diese Kinderstimme hier.
Speaker 4: Sie suchen die perfekte Stimme? Dann bin ich Ihre beste Wahl.
Speaker 1: Also hört es sich auf jeden Fall cool an. Da hast du eben die Auswahl, wählst dann die Stimme aus und wie auch bei den vorherigen Text-to-Speech-Tools, die ich dir gezeigt habe, gibst du dann hier den Text ein und es läuft letztendlich ähnlich ab, dass du dann verschiedene Blöcke hast. Du hast dann hier die Auswahl, das Ganze noch schneller zu machen und kannst es dann später eben exportieren. Du hast auf der linken Seite dann noch weitere Funktionen, wie zum Beispiel den Untertitel, den du dann hinzufügen lassen kannst. Du hast den AI-Writer, also wo du letztendlich ja auch ein Skript schreiben lassen kannst. Das heißt, du gibst die Details ein und wenn du dann alles ausgewählt hast, klickst du auf Create und dann wird dir eben ein Skript erstellt. Du siehst, hier ist jetzt das Skript. Ich klicke auf Edit and Insert, Add to Project und jetzt hätten wir das ganze Skript hier drin und können uns das eben anhören mit der ausgewählten Stimme und könnten sozusagen innerhalb von diesem Tool hier das Ganze auch bearbeiten und letztendlich dann als ein fertiges Video exportieren. Ja, das waren meine Top 3 Text-to-Speech-Tools. Je nachdem, für was du das Tool verwendest, ist natürlich das eine besser geeignet als das andere. Das muss jeder für sich selbst herausfinden, aber im Großen und Ganzen kannst du meiner Meinung nach jedes dieser drei Tools mit sehr, sehr gutem Gewissen und mit richtig guten Funktionen nutzen. Wenn dir das Video gefallen hat, dann lass gerne einen Daumen nach oben da. Schreibe deine Meinung in die Kommentare. Deine Erfahrungen mit Text-to-Speech-Tools. Nutzt du solch ein Tool? Wenn ja, für was? Würde mich sehr interessieren. Und dann würde ich sagen, wir sehen uns im nächsten Video wieder. Danke fürs Zuschauen. Bis dann. Mach's gut. Ciao.
Generate a brief summary highlighting the main points of the transcript.
GenerateGenerate a concise and relevant title for the transcript based on the main themes and content discussed.
GenerateIdentify and highlight the key words or phrases most relevant to the content of the transcript.
GenerateAnalyze the emotional tone of the transcript to determine whether the sentiment is positive, negative, or neutral.
GenerateCreate interactive quizzes based on the content of the transcript to test comprehension or engage users.
GenerateWe’re Ready to Help
Call or Book a Meeting Now