NAPS - Neues aus der Podcast-Szene

Transkription für Podcasts - Wie gut arbeitet die Software?

, aktualisiert: 13. Januar 2023

Was kann Transkriptionssoftware heute leisten? Luisa Thiele von aiconix erklärt im NAPS Podcast das Potenzial für die Podcast-Welt. Um ihr hauseigenes Tool gleich zu testen, gibt es hier auch gleich das Transkript der Episode.

Bild: podcast.de
Transkription für Podcasts - Wie gut arbeitet die Software?

Transkriptionssoftware soll Podcastern völlig neue Möglichkeiten, denn sie verspricht Zeit- und Kostenersparnis. Bislang stellte sich jedoch häufig die Frage, wie gut die Software funktioniert.

In Episode #13 des NAPS-Podcasts erklärt Luisa Thiele, die Potenziale der Technologie. Als Business Development Managerin bei aiconix beschreibt sie, wie Podcaster vorhandene Inhalte durch Transkriptionen "verdelen" können. Sie ist von Vorteilen in Auffindbarkeit, Barrierefreiheit und Arbeitsaufwand überzeugt.

NAPS - Neues aus der Podcast-Szene

Einfach Podcasts! Bei NAPS gibt's regelmäßig Podcast-News und Interviews aus der podcast.de-Redaktion.

Die gesamte Episode wurde mit aiconix transcribe transkribiert und, abgesehen vom Absatz nach der Anmoderation, unverändert übernommen. Für NAPS-Hörer, die gern auch NAPS-Leser sein möchten, gibt es das Transkript im nächsten Absatz. aiconix hat übrigens auch Versionen mit Timecodes, Absätzen und Übersetzung ins Englische bereitgestellt, aus Platzgründen gibt es hier jedoch nur den Fließtext. Auf Wunsch versenden wir die anderen Versionen aber gerne per Mail.

Transkript der NAPS-Episode durch aiconix transcribe

Anforderung an einen Redakteur einer Redakteurin sind heute so unglaublich groß. Wie cool ist es doch, wenn du deine smarten Assistenten hast, der dir wenigstens ein klein Teil abnimmt und dich dann auch noch sehr gut dastehen lässt. Laabs Neues aus der Podcast Szene Hallo liebe Bad Gastfreund, hier Steffen von Podcast Punkt D Vor einiger Zeit habe ich angefangen, mich für künstliche Stimmen und Transkriptionen Prozesse zu interessieren. Ich würde gern rausfinden, welche Bedeutung Sie für die Podcast Welt haben. Bei meiner Recherche bin ich auf einige Unternehmen gestoßen, die sich mit diesen Themen auseinandersetzen. Eines davon war I Comix. Iconic setzt sich auseinander mit künstlicher Intelligenz und bringt sie bereits an vielen verschiedenen Stellen zum Einsatz. Sie bieten keine Lösungen für verschiedene Bereiche und Transkriptionen. Ist eines ihrer Kern Produkte und das könnt ihr auch für Podcaster spannend sein. Was hat Podcaster bislang davon abgehalten, ihre Podcasts zu transkribieren? Nun machen wir uns nichts vor. Das macht überhaupt gar keinen Spaß. Es dauert unendlich lange und wenn man das nicht selber machen möchte, dann war es bisher eigentlich auch immer relativ teuer. Aber das könnte sich in Zukunft ändern, wenn Technologien schreiten voran und das wird immer leichter und kostengünstiger. Transkripte der eigenen Podcasts anfertigen zu lassen. Wie genau das funktioniert, das wird Sarah Luiza Tile mir erklären. Sie kann mir sagen, was Transkriptionen heute schon leisten kann, welche Benefiz Podcaster davon haben und wo es bisher noch klemmt. Um zu schauen, wie gut Iconic Transkriptionen Software funktioniert, werden wir diese Episode komplett von Honigs Fans bei transkribieren lassen.

Herzlich willkommen, liebe Sarah Luisa Tile, was genau macht die Bayer Comix? Wir haben bei Königs eine Plattform gegründet, mit der du als User Zugang zu ganz vielen Key Services von unterschiedlichen Providern erhältst, damit du deine audiovisuellen Inhalte z.B. Audio oder Video analysieren und verarbeiten lassen kannst. Das klingt jetzt recht. Wie soll ich es sagen? Es klingt wahrscheinlich sehr abstrakt für jemand, der sich nicht damit auskennt. Sind das erst einmal böhmische Dörfer? Deswegen lass mich das mal anhand eines Beispiels erklären. Und zwar jeder von uns kennt ja Hotel Bookings Plattform der Gäste mit dem Ziel rein, ein super Hotelzimmer für dich zu finden. Das ist dein Ziel und du hast auch bestimmte Kriterien, nach denen du dein Hotelzimmer suchst, z.B. mit Strand, Blick oder Meerblick mit Zimmerservice. Er konnte schnell. Das alles soll dabei sein. Und so ähnlich funktioniert auch unsere Plattform. Du kannst sozusagen mit dem Wunsch reingehen, deine audiovisuellen Inhalte analysieren zu lassen und kannst aber nach verschiedensten Kriterien filtern. Zum Beispiel kannst du Speech to Text Konvertierung bei uns anklicken. Das heißt Sprache zu Text konvertieren lassen. Du kannst automatisiert Transkripte von deinen Interviews, wie wir das jetzt hier gerade führen, durchführen lassen und dann kannst du nach den nächsten Schritt gehen. Du kannst sagen Okay, jetzt habe ich den automatisiert herunter geschriebenen Text von einer KI. Aber daraus lässt sich ja super viel ableiten, z.B. Worum geht's denn jetzt eigentlich in dem Interview? Was sind die Themen? Wer sind die Menschen, die da genannt werden? Das alles lässt sich aus dem gesprochenen bzw. bzw. dann niedergeschriebenen Text heraus extrahieren. Also ganz, ganz viele Informationen, die super wichtig sein könnten für dich und dein Unternehmen. Und wir wollen dir das sozusagen erst einmal vor Augen führen, dass dein Content einen richtig großen Wert hat. Also wir haben uns zum Ziel gesetzt, deine Daten zu veredeln. Das heißt, da gibt's ganz, ganz viele Potenziale für Podcaster und angehende Podcaster und auch für die Zukunft des Podcasting an sich. Jetzt bist du Business Development Managerin. Was genau ist denn dein Aufgabenbereich? Business Development Managerin Das ist auch so ein Wort. Das bedeutet alles und nichts. Wahrscheinlich für sehr viele Menschen. Deswegen ja gut ist es fragst und ich kann es dir gerne erklären. Also ich würde es erst einmal übersetzen, das heißt Geschäfts Entwicklungs Managerin. Und wie der Name sagt, bin ich dafür verantwortlich, das Geschäft von Honigs weiterzuentwickeln. Das heißt zum einen, dass ich mich um Kundengewinnung und Kundenbetreuung kümmere und schaue Wer sind potentielle neue Kunden für uns? Dann geht es aber auch darum, Partnerschaften zu finden und heraus zu extrahieren, die uns in der Öffentlichkeit repräsentieren, die auch wiederum neue Kunden für uns gewinnen. Und dann? Ich bezeichne mich selbst immer als so eine Art! Vielleicht ist der Vergleich nicht so schön, aber wie so eine Art Krake, die so ganz viele Arme hat und überall sozusagen ihre Finger mit im Spiel hat, ihre Arme mit im Spiel hat. Ich bin ganz eng mit der Geschäftsführung verflochten, tausche mich da sehr eng aus, aber natürlich auch mit dem Marketing. Weil wenn ich Produkte nach außen trage, müssen die natürlich auch schön sozusagen angepriesen werden. Das heißt, das, was ich von außen von den Kunden bekomme, trage ich ins Unternehmen, ins Marketing hinein, aber auch natürlich in die Produktentwicklung. Weil das Feedback der Kunden ist essentiell wichtig für uns. Daraus können wir sozusagen wieder neue Produkte entwickeln oder unsere bestehende weiterentwickeln und. Das ist eigentlich das, was ja auch super spannend ist und super Spaß macht er sich sehr, sehr vielfältig. Mein Job Jetzt ist es so, dass Cray im Moment ein ganz, ganz heißes Eisen ist. Das wird an vielen Stellen diskutiert und entwickelt und auch der Konnex. Es ist ein ganz großes Thema. Viele findet ihr den Begriff KI. KI ist praktisch für uns eine Art Werkzeug, das uns ermöglicht, neuen Content zu kreieren im Sinne von wenn wir wieder das Beispiel Interview nehmen, was wir transkribieren. Das bedeutet ja dann sozusagen für uns und auch für das Unternehmen, für das wir das machen, oder für die einzelnen Person, für die wir das machen. Das daraus wieder neuer Content entsteht. Wir können z.B. anhand des transkribieren Textes von unserem Interview hier diesen auf eine Website laden und daraus einen Artikel oder ein herunter geschriebenes Interview sozusagen veröffentlichen. Daraus lassen sich wiederum Blogposts machen oder Social Media Posts. Daraus lässt sich SEO generieren. All das sind verschiedenste Möglichkeiten und vielleicht ist der Vergleich ganz gut, wenn ich sage Dein Interview ist die süße Kirsche, aber wir packen die Sahne noch obendrauf, sodass es noch süßer schmeckt. Wir haben uns auch darauf geeinigt, dass wir dieses Interview hier heute transkribiert lassen von der Software. Das heißt, wir jagen. Das sind da einmal dadurch und stellen das einmal auf die Probe. Ich bin super gespannt, wie das ausfällt. Und genau das kann man dann schon nachprüfen. Iconic Stefan Zweig ist die Transkriptionen Software, die er anbietet. Und warum seid ihr gerade auf diesem Feld so stark engagiert? Warum seht ihr da so großes Potenzial drin? Im Wort liegt die meiste Information. Ich dachte eigentlich immer, es sei das Video. Ich dachte immer, Video sei King, wie man das immer so schön sagt. Aber mit meiner mittlerweile aufgezogenen CI Brille sag ich Audios Queen und das gesprochene Wort liefert uns die meisten Informationen, aus denen wir dann wiederum ein Inhalte sozusagen produzieren können. Also anhand des Interviews, was wir transkribieren, können wir eine semantische Analyse durchführen und daraus lassen sich dann wieder ganz viele Informationen ableiten. Wie ich schon im Vorfeld gesagt habe z.B. Worum geht es? Welche Orte werden benannt, welche Personen, von welchen Personen wird gesprochen? Und all das kann man fertigen. All das macht dann auch. Gibt dann auch wieder einen Mehrwert in Sachen Auffindbarkeit. Wenn wir dein gesamtes Podcast Archiv sozusagen einmal komplett analysieren würden und jeden Podcast transkribieren würden, könnten wir dann Themenblöcke erstellen. Wir könnten Personen erstellen, die immer wieder darin vorkommen. Und du könntest dann einfach, wenn du Person XY suchst in deinem Median Archiv ganz einfach danach suchen. Und wir würden ja alle Podcast du zu sagen vorstellen oder vorschlagen, die mit der Person zusammenhängen. Wenn ich Alkoholikers richtig verstanden habe, dann ist das aber nicht nur eure hauseigene Lösung, sondern ihr bietet auch Zugriff auf die Transkription Teillösung anderer Dienst an mit wem arbeitet ihr denn da zusammen? Ja, das hast richtig verstanden. Wir bündeln sozusagen. Wir kuratieren verschiedenste Services. Einmal von den ganz Großen, die am Markt sind. Ich glaube, wir sind uns allen bekannt. Aber wir scannen auch die ganz kleinen, also Nischen Provider, die für bestimmte Sprachen super super gut sind. Und da möchte ich nochmal betonen Es ist nicht immer gesagt, dass die Großen auch wirklich die Besten sind, weil die haben vielleicht ein ganz gutes Marketing. Da denkt man Okay, die machen das wahrscheinlich super. Aber es ist für uns essentiell wichtig, den Markt immer wieder zu scannen und die Kleinen auch mit rein zu nehmen und für bestimmte Sprachen oder Dialekte einzusetzen und diese, diese alle diese ganze Provider miteinander zu kombinieren. Das ist eigentlich unser USP, weil wir ganz genau wissen Okay, dieser Provider, der funktioniert ganz toll für deutsche Transkription. Der andere wiederum vielleicht der kleine der Nischen Provider. Der funktioniert aber super für die puncto Action und also Kommasetzung, Punkt Setzung. Und all das vereinen wir miteinander. Und unser Algorithmus liefert dann sozusagen das beste Ergebnis, weil wir immer die Genauigkeit für jedes einzelne Wort berechnen und das Modell, was in dem Moment für das Wort am besten greift, gewinnt sozusagen. Genau mit diesen Partnern arbeitet ihr zusammen. Ungefähr. Lass mich nicht lügen. Es kommen ja immer wieder welche dazu und es werden auch wieder welche herausgeschmissen. Also ich würde sagen momentan 15, aber das ändert sich auch sehr stark, weil wie gesagt. Der Markt verändert sich sehr, sehr schnell. Und was sag ich mal vor einem Jahr noch richtig gut funktioniert hat, kann jetzt schon bei dem einen Provider kann jetzt bei einem anderen kleinen Provider schon viel, viel besser funktionieren und dann wird er dementsprechend auch höher gerankt. Ich denke mal an die großen Provider, von denen du gesprochen hast. Das sind dann internationale Großkonzerne, von denen wir alle auch schon verschiedene Dienste nutzen wollen oder nicht. Was sind denn kleinere Anbieter, kleinere Nischen Provider, von denen du gesprochen hast? Ich bin ganz neugierig. Ja, also das sind verschiedenste kleinen Provider aus dem Ausland, zum Teil also auch kleine Startups, die immer wieder danach suchen, auch zu kooperieren. Und da sind wir natürlich auch sehr aufgeschlossen gegenüber. Also wir wollen natürlich auch kleine Unternehmen unterstützen und deswegen reden wir auch ganz viel. Und als es noch möglich war, waren wir natürlich auch auf vielen Ermessen unterwegs. Und in diesen sogenannten Startup Corners findet man natürlich auch ganz, ganz viele unterschiedliche. Und dann kommt man mit denen ins Gespräch und denkt sich so Okay, ja, da lohnt es sich, mal genauer hinzuhören und mit denen müssen wir mal intensiver reden. Ja, ich befürchte, du wirst mir das Geheimnis nicht verraten, aber ich bin ganz neugierig. Vielleicht kannst ja trotzdem Tipps geben, welche Dienste bei welchen Übersetzungsleistung am besten funktionieren. Oder vielleicht auch bei den Transkriptionen Leistungen? Ja. Gibt es Dienste, die bei Punkt, Ration oder Vokabular besonders herausstechen? Ja, die gibt es. Du hast es schon richtig erkannt. Natürlich kann ich dir jetzt nicht alles offenbaren, weil es ist natürlich auch unser USP, unser Wissen zu sagen Okay, der eine Provider funktioniert richtig gut, was Grammatik angeht. Der eine Provider funktioniert richtig gut, was die deutsche Sprache angeht. Das sind alles so Sachen, die kann ich dir hier nicht offenlegen. Er möchte ich auch nicht walte. Soll sie bitte unseren Dienst nutzen und ich davon selbst überzeugen? Aber klar, es gibt diese Unterschiede. Und da tut sich ganz, ganz viel am Markt und wir versuchen das alles zu scannen. Trotzdem noch einmal die Frage Gibt es denn auch thematische Vorteile bei verschiedenen Diensten? Kann der eine Dienst z.B. Rezepte ganz toll übersetzen und der andere jetzt Fachtexte und der nächste Literatur, soweit mir bekannt ist? Ist das nicht der Fall? Es gibt natürlich immer Wortlisten, die bei einzelnen Providern hinterlegt sind. Fachbegriffe, die von dem einen besser erkannt werden als vom anderen wir selbst. Das gilt für unsere Live Transkription. Das machen wir nämlich auch. Die Untertitel Live bei Video Streams können vorab Wörter hinterlegen, wo wir wissen, die werden definitiv bei der Panel Diskussion vorkommen und die werden dann auch besser erkannt. Man kann nie zu 100 prozent sagen, dass die KI alles erkennen würde. Auf dem Stand sind wir einfach noch nicht und da ist es auch egal ob wir die großen Provider nehmen oder die kleinen Provider. Das geht nicht. Wir haben ungefähr eine Genauigkeit von 95 prozent aktuell was unsere KI Leistung angeht. Wir dürfen aber die übrigen 5 prozent nicht außer Acht lassen. Das heißt, selbst wenn du jetzt unsere Transkriptionen App oder unser Tool nutzt, würde ich immer raten Schau nochmal drauf und mach nochmal die letzte Endkontrolle. Ich möchte nämlich auch hier in dem Zusammenhang nochmal sagen Ne KI kann nie die menschliche Arbeit ersetzen, sondern ich möchte eher das Bewusstsein dafür schaffen, dass KI deine Arbeit mit unterstützen kann. Sie ist sozusagen der smarte Assistentinnen deines Smart Assistentin, die dir hilft, Workflows zu vereinfachen, sie effizienter zu gestalten, damit du jetzt z.B. als Podcaster, als Redakteur dich den spannenderen Sachen und Aufgaben widmen kannst, wie z.B. eine intensivere Recherche oder in Interviews vorzubereiten. Lass doch die KI arbeiten, sag ich mal das Interview transkribieren, während du schon wieder den nächsten Gast raus suchst. Das heißt, derjenige, der transkribieren musste vorher, wird dann in dem Sinne zu einem Lektor. Die Aufgaben verschieben sich dann genau. Die Aufgaben werden sich verschieben und ich denke auch das ist eine sehr wage These. Aber wenn man das akzeptiert und versteht, mit der KI zu interagieren, kann man den größten Mehrwert daraus ziehen und man kann auch Spaß daran haben. Also wir arbeiten mittlerweile auch mit verschiedenen Lektoren zusammen, die befördern der Video Livestream mit der Untertitelung richtig on air geht nochmal drüberschauen und nochmal die letzten Korrekturen ja vornehmen, nochmal Groß Kleinschreibung prüfen, nochmal Zahlen prüfen, weil daran. Darin ist die KI noch nicht sehr gut. Also Zahlen zu verschriftlichen, das kann die KI einfach noch nicht so gut. Und das alles macht der Lektor. Das ist natürlich auch eine Entlastung. Im ersten Moment ist es so Oh mein Gott, was passiert hier gerade wenn der Mensch sozusagen sieht, wie der Sport, was gerade erst gesprochen wurde, jetzt herunter geschrieben wird von dem System und das ganz schnell im nächsten Moment. Ist es denn, wenn man sich mal damit befasst, aber auch irgendwie ein kleines Wunder? Und dann denkt man so wohl, das geht heutzutage schon. Ja, das supernett kann ich mich ja darauf konzentrieren, das hier alles im Text stimmt. Also man kann den Fokus eigentlich nochmal viel besser drauf setzen. Es hat ein bisschen was von dieser magischen Feder aus. Den Harry Potter funktioniert hoffentlich besser. Ja, jetzt ist es so. Es gibt schon einige der weltgrößten Konzerne, die bereits an diesen Technologien arbeiten und ihr seid ein Start-Up aus Deutschland. Fokussiert euch jetzt insbesondere auf den deutschen Markt und überlasst das Englische vielleicht das man den anderen Wettbewerbern oder wie probiert ihr euch zu positionieren? Ja, das hast du schon richtig gut erkannt. Also wir konzentrieren uns wirklich auf den deutschen, auf den europäischen Markt. Wir wollen die europäischen Sprachen in unserer Plattform bündeln. Momentan konzentrieren wir uns ganz stark auf den deutschen Markt, also auf den deutschsprachigen Markt. Und da sind wir auch wirklich gut drin. Also das kann ich auch selbstbewusst sagen, dass wir da wirklich gut drin sind. Ich habe ja schon gesagt 95 Prozent Genauigkeit bei der Erkennung. Und aktuell haben wir auch ein ganz spannendes Projekt. Wir wurden gefördert von der EU und analysieren gerade österreichische Dialekte, um die Erkennung von österreichischen Dialekten zu verbessern. Und Ziel des Ganzen ist natürlich auch hier ein Sprach Modell zu entwickeln, was wir unserer Plattform hinzufügen können, damit in dem Moment, wo ein z.B. Politiker, die einen etwas stärkeren Dialekt hat, bayerisch österreichisch besser erkannt wird von der K.I. Weil Dialekte sind immer noch so eine Herausforderung, muss man ehrlich sagen. Hochdeutsch wird supergut erkannt, wenn z.B. Frau Merkel spricht. Das ist wunderbar. Das erkennt die ich ohne Probleme. Aber wenn es dann z.B. Herr Söder ist, dann wird er schon ein bisschen schwieriger, weil der dann natürlich schon ein bisschen einen Dialekt hat. Und wenn wir dann noch weiter in Richtung Österreich gehen und dort jemanden sozusagen transkribieren wollen, dann gibt es schon eine relativ hohe Fehlerquote. Nee, die wird erreicht, ist relativ hoch. Und da kommen dann die Modelle schon an ihre Grenzen. Was spricht denn aus deiner Sicht dagegen, dass Podcaster ihre Podcasts einfach von Hand transkribieren? Das ist eine gute Frage. Also natürlich spricht da überhaupt nichts gegen. Also wer die Zeit hat und das Geld hat, der kann das natürlich gerne machen. Aber warum kompliziert, wenn es auch einfach geht? Also ich kann mich daran erinnern, als ich vor 11 Jahren im Studium steckte. Im Journalismus Studium hab ich nebenbei transkribiert für verschiedene Polit-Talkshows. Und das hat extrem viel Zeit gekostet und dem Unternehmen oder dem Sender auch ganz schön viel Geld. Obwohl wir natürlich auch als Studenten nicht das beste Gehalt bekommen haben. Also da lag eine Transkription ungefähr pro Stunde bei 10 bis 15 Euro, die Kox wird. Ich hatte nämlich auch ein paar Daten rausgesucht. Das kostet. Und hab's mal verglichen. Es gibt auch Online-Portale. Ja, Leute, dann Sachen für dich transkribieren, wenn die sagen Guck mal, ich hab relativ viel Zeit und macht das gerne und du machst es ungerne und wenig Zeit, dann lass uns doch zusammenarbeiten und dort liegen die Preise für eine halbe Stunde Podcast zwischen 30 und 56 Euro. Naja, dann haben die einen ganz guten Stundenlohn, sag ich mal ja selbst da geht einiges an Geld drauf, wenn man das transkribieren lassen möchte. Wie ist denn der Preisvergleich? Wie schneidet jeder ab? Also sagen wir mal so Wenn du jetzt pro Stunde mit 60 Euro rechnest von einem professionellen Menschen, der deinen Podcast transkribiert, dann gibt es bei uns die Möglichkeit zu sagen Okay, du kannst, wenn du den preiswertesten Provider nimmst, pro Stunde 60 Cent dafür aufbringen. Wenn du aber unseren Algorithmus anbellt, der iconic best heißt, wo wirklich alle Provider miteinander kombiniert werden. Wie ich dir schon erzählt habe die höchste Genauigkeit pro Wort wird berechnet, dann liegen wir bei ungefähr 6 Euro die Stunde. Das heißt immer noch erheblich günstiger, als es manuell machen zu lassen. Einen Bruchteil davon. Das ist ein Bruchteil davon. Und ich möchte aber trotzdem nochmal betonen Du musst dich dann nochmal hinsetzen und muss das nochmal korrigieren. Aber wir haben in unserem Tool auch die Funktion eingebaut, dass du in dem Moment, wo du das automatisierte Transkript bekommst, erst mal siehst, wo die KI sich unsicher war. Das wird markiert und da kannst du dann auch gleich nochmal zum Wort rein springen und dir das nochmal anhören, was dann sozusagen im Interview gesagt wurde. Und wenn Schlüssel ich nehme jetzt einfach einen. Ein Beispiel Wenn Schlüsselt nicht so richtig erkannt wurde von der KI, weil derjenige so ein bisschen genuschelt hat, dann kannst du zu diesem Wort Schlüssel springen und dann nochmal reinhören und dann hörst du auf einmal Oh, es war ja doch nicht Schlüssel, sondern derjenige hat Schüssel gesagt und dann naso das einfach nochmal und korrigiert sozusagen so deinen Text und es kostet nochmal ein bisschen Zeit. Aber man kann das ja gegeneinander aufrechnen, was dann im Endeffekt mehr Sinn macht. Das heißt, gegen die Transkriptionen spricht. Es ist ein Zeitaufwand und es ist ein Kostenfaktor. Lass uns nochmal auf die Vorteile zu sprechen kommen. Ich hab mal meine Fantasie ein bisschen schweifen lassen und überlegt, welche Benefiz Podcaster alles davon haben, wenn sie ihren Podcast transkribieren lassen. Um Punkt 1, der mir aufgefallen ist, war die Auffindbarkeit ja bislang nicht möglich, alle Podcast samt und sonders von der ersten bis zur letzten Minute zu scannen auf die gesprochene Wörter. Aber wenn es ein Text ist, dann ist es möglich und dann wird man besser findbar in Suchmaschinen z.b. Was gibt's noch für Vorteile? Ja, das ist ein gutes Beispiel. Du kannst natürlich aber auch daraus wieder neuen Content generieren im Sinne von ok, jetzt hast du das Interview in Textform und daraus nimmst du jetzt einzelne Passagen und bereitest die nochmal für Social-Media auf, indem du aus deinem Podcast die Bringt nanntest, Zitate raus nimmst und die bei Instagram sozusagen nochmal schön aufbereitet und die auf deiner Instagram Seite dann nochmal sozusagen veröffentlichst. Das ist ein Beispiel. Dann natürlich dein Medien Archiv wird dadurch durchsuchbar, ja. Also du kannst dann, wie ich dir schon gesagt habe, nach Person, nach Teams filtern. Das kannst du machen. Ja, das ist noch ein Beispiel. Natürlich dadurch, dass du jetzt verschiedensten Content auch auf Social Media dann posten kannst, den du ganz automatisiert von uns generiert bekommst, dann hast du natürlich auch die Möglichkeit, dass eine Zielgruppe dadurch erweitert wird. Und wenn du die Live Transkriptionen von uns nutzt, also die Untertitelung von einem Live Videostream, dann haben wir natürlich auch den ganz großen Vorteil, dass wir barrierefreien Inhalt ermöglichen. Also dass wir da auch nochmal eine ganz neue Zielgruppe ansprechen und auch hinsichtlich der Inklusion in ganz großem Mehrwert schaffen. Das heißt, Menschen, die Podcast nicht hören oder nicht wahrnehmen könnten, können das aber dann lesen. Ja, das ist auch eine Möglichkeit. Natürlicher Plus Man kann Inhalte verständlicher machen. Ja, das heißt, das, was man vor sich sieht, das ist ja nochmal anders zugänglich, als wenn man es nur gehört hat. Denn das gehörte das relativ schnell wieder weg und da muss man vielleicht nochmal zurück skippen oder hat die Stelle im Podcast vergessen. Und sobald man das dann vor sich auf einem Zettel oder Display hat, dann wird es nochmal wahrnehmbarer. Definitiv. Oder du stehst auch sag ich mal mit deinem Transkribieren Interview. Da nimmst du den spannendsten Teil oder vielleicht nicht den spannendsten. Aber dann nimmst du ein Teil raus, der dir richtig gut gefällt. Den veröffentlichst er auf deiner Website und machst dann Punkt, Punkt, Punkt. Und für den Rest hätte euch jetzt den Podcast an. Also es ist ja auch wieder sozusagen eine Möglichkeit, da nochmal ein Interesse zu schaffen, ohne dass du wirklich viel Arbeit hast. Ich meine, die Anforderungen an einen Redakteur einer Redakteurin sind heute so unglaublich groß. Also alle wollen ja, dass jeder alles kann. Du sollst ja gut recherchieren können. Du sollst gut schreiben können. Du sollst am besten noch gut drehen können, gut moderieren können das alles. Und dann sollst du weiß ich nicht das auch noch selbst Distributoren und dann sollst du dich noch um Social Media kümmern. Und all das sind unzählige Aufgaben. Wie cool ist es doch, wenn du deiner smarten Assistenten hast, der dir wenigstens einen kleinen Teil abnimmt und dich dann auch noch sehr gut dastehen lässt. Die Technologie entwickelt sich immer rasanter weiter. Er ist ein exponentielles Wachstum, in denen diese Technologie schlauer wird. Was glaubst du auf einer Skala von Oh ha, da müssen wir nochmal ran bis zu. Das kann jetzt langsam so bleiben. Bei welchem Punkt sind wir gerade? Wie weit sind wir in diesem Fortschritt? Da muss ich eine Sekunde drüber nachdenken. Also wir sind da schon extrem weit. Ich hätte vielleicht noch vor drei Jahren gesagt Du schick mir mal, wenn wir jetzt einen Podcast transkribieren wollen. Schick mir mal die einzelnen Spuren am besten ohne Hintergrundgeräusche, ohne Musik. Dann können wir es richtig gut transkribieren. Mittlerweile kann ich dir sagen Naja, wenn du da jetzt noch Musik rein haust oder vielleicht irgendwie das Fenster offenbar beim Interview. Was hält sich der Fall ist. Aber wenn das Fenster offen wäre und im Hintergrund irgendwie ein Huben wäre und ein lautes Störgeräusch. Dann hätten wir es nicht rausgeholt. Dann hätten wir den Text nicht transkribieren können. Und mittlerweile können wir den aber trotzdem transkribieren, weil die Kiddis herausfiltert. Wie kommen die Tools denn mit mehreren Sprechern zurecht? Du und ich, wir unterhalten sie zu zweit und ich denke mir, die Chancen, dass das gut klappt, sind relativ hoch. Was ist denn, wenn es 3 4 Leute sind oder die relativ ähnlich klingen? Also Sprecher Wechsel ist schon möglich. Das wird erkannt von der KI. Sprecher einSprecher 2 Sprecher 3 Arbeit Die KI versteht noch nicht Mensch, da spricht ja jetzt der Steffen schon wieder. Und da spricht er die Luisas schon wieder. Also es ist ja eh noch ein Schritt, bis wirklich die KI erkennt, dass du und ich hier sprechen, weil wir nicht wirklich Personen des öffentlichen Lebens sind. Die würden dann erst mal trainiert werden mit Personen des öffentlichen Lebens, deren Stimmen besser bekannt und dann auch erkannt werden. Da ist die keiner nicht soweit bzw. kennen wir leider noch keinen Anbieter, der das ermöglicht. Sofern hier jemand Bescheid weiß und da extra Infos hat, dann bitte gerne an uns wenden, weil wir wirklich händeringend danach suchen, weil das auch ein ganz großes Thema ist. Es ist dann wie bei vielen anderen Carries auch, dass man mit möglichst viel Inhalt füttert und immer wieder füttert. Erst einmal Nachrichtensprecherin, weil die sprechen ganz sauber bis zu Politikern, weil die sprechen doch größtenteils sauber bis hin zu den regulären Altag Sprechern. Ja ja. Also die Daten sind das A und O, die Daten. Davon hängt alles ab. Und das ist auch das Schwierigste. Das haben wir jetzt z.B. auch wieder bei unserem Dialekt Modell gemerkt, was wir trainieren wollen für österreichische Dialekte. Erst mal an die Daten ranzukommen, das ist ein ganz sensibles Thema. Datenverarbeitung, Datensicherung und dann Datenanalyse. Und dann natürlich auch selbst wenn du einen riesen Bestand von sag ich mal tausend Stunden Datenmaterial hast, daraus Trainingsdaten zu generieren, die wirklich das wiedergeben, was dann? Womit deine KI trainiert werden soll, das ist sehr zeitaufwendig und das ist ein sehr großer Prozess. Also das ist ein riesen Stück Arbeit und davon hängt der Erfolg dann auch eines Sprach Modells sehr stark ab. Und wir gehen mit unserer episodisch volles Risiko. Ja, wir geben den fertigen Mix rein. Du kannst uns gerne Challenge und wir kennen es. Wir kann's probieren. Ok, cool, ich freue mich richtig schön. Dann können wir da vielleicht auch noch festhalten. Wenn man die KI unterstützen möchte, dann tut man er und sich selber auch im Endeffekt gefallen, wenn man möglichst gute Audioqualität zur Verfügung stellt. Wenn nicht, wie in unserer letzten Laabs Episode. Da hab ich nämlich einen Audio Test gemacht mit einem ganz furchtbaren Audio Stück und geschaut ob die KI oder ein Audio Profi das wieder hinbiegen können. Naja, wenn man die Transkription gut haben möchte, dann liefert man wahrscheinlich am besten was. Ohne Störgeräusche, ohne Hintergrundmusik, ohne Dialekt noch. Ja, wenn du ganz auf Nummer sicher gehen willst, dann ja. Aber du kannst natürlich auch. Also wir sind erstaunt selber, dass das so gut funktioniert. Aber du kannst auch meinetwegen Musik mit einspeisen in Intro. Das wird auch erkannt. Jetzt frage ich mich angenommen man bekommt eine Transkriptionen dann aus der Maschine, dann hat man sich die angeschaut und hat sie nochmal lektoriert. Gibt's denn auch eine Möglichkeit der KI, diese Daten wieder zuzuführen, um die KI zu unterstützen, dass sie besser lernt? Ja, diese Möglichkeit gibt es. Und ist es der Standart weg oder ist es etwas, was man extra und explizit machen muss? Das ist, was man extra und explizit machen muss. An dem Punkt sind wir auch noch nicht, aber das haben wir sozusagen auch vor. Das wäre das Allerbeste, wenn man selber der Maschine sofort das Feedback gibt, wann sie was gut und wann sie etwas nicht gut gemacht hat und das dann sofort in den Kreislauf mündet. Gibt es einen Zeitplan, wann das implementiert werden soll? Das ist auf unserer Roadmap und ich als Business Developer. Wir rinnsale natürlich auch immer so schnell wie möglich. Also ich hätte es natürlich gerne im nächsten halben Jahr. Aber man muss auch immer die den ganzen Kontext sehen und wir sind ein relativ kleines Team und da muss man wirklich schauen, wie man mit den Ressourcen umgeht und wie man die Prioritäten setzt. Also ich denke jetzt gerade, ich habe gerade das Bild von unserem Product Owner im Kopf und er wird wahrscheinlich gerade wenn er das hört, beide Hände über sich zusammenschlagen und denken Luiza, wie kannst du sowas sagen in einem halben Jahr? Das ist total unrealistisch. Aber das ist halt auch der Punkt. Also wir als Startup haben auch ein ganz anderes Süd-Ost Verständnis als die großen Konzerne. Und wenn wir sagen, wir machen das schnell, dann ist das bei uns wirklich im Sinne von Ja. Also maximal ein halbes Jahr umgesetzt, weil es kommt natürlich auch wirklich drauf an. Wir müssen uns am Markt beweisen. Wir müssen uns etablieren. Wir müssen gucken, dass wir einen großen Nutzen für die User schaffen. Und da können wir nicht anderthalb Jahre warten, bis irgendein Feature mal entwickelt wird. Also das geht nicht. Das ist dann schon immer sehr interessant zu sehen, wenn man mit den großen Sendern spricht und man sagt Ja, das muss schnell passieren und wir dann in unserem Kopf haben ja in einem halben Jahr maximalen Antti, sondern dann sagen Ja, in anderthalb Jahren wäre das schon ganz gut. Also da redet man noch eine ganz andere Sprache. Das heißt, er hat ehrgeizige Ziele. Natürlich, das haben wir. Und große Vision. Wenn Podcaster, Rinnen und Podcaster euer Tool nutzen möchten. Wie erhalten die den Zugang dazu? Wie könnt ihr es ausprobieren? Also am besten guckt ihr einfach auf unsere Website www. Econ. Fixpunkt. Und da habt ihr verschiedenste Möglichkeiten. Es kommt immer drauf an, seid jetzt eine große Podcast Bude oder seid der einzelne Podcaster. Wir können unsere Transkriptionen Tools über verschiedenste Zugänge anbieten. Also wenn ihr eine große Podcast wurde seid wirklich in großes Medien Archiv, habt ein CMS System, dann würde ich euch raten unsere API unsere Schnittstelle zu nutzen und da könnte dann wirklich die einzelnen Services auswählen. Wollt ihr nur einen Provider der vielleicht nicht teuer ist, aber der alles erst einmal schnell runter transkribiert, damit ihr erst mal alle eure Podcasts verschriftlicht habt? Oder wird ihr gleich an ein Konnex best Reserl? Dann habt ihr wirklich die höchste Genauigkeit und richtig gute Transkripte. Das würde ich sozusagen den Großen empfehlen und den kleineren den einzelnen Podcast dann, die aber vielleicht auch eine große Community haben und die das auch richtig gut finden würden, wenn ihre Podcast transkribiert werden würden. Den würde ich sagen nutzt unsere App in Slack. Da könnt ihr unsere App euch herunterladen und einfach per Drag and Drop in unserem Tool eure Interviews transkribieren lassen. Und das Schöne ist könnt ihr nicht nur transkribieren lassen, sondern ihr könnt ihr auch gleichzeitig noch übersetzen lassen. Also es ist nicht nur möglich, deutsche Sprache transkribieren zu lassen und ins Englische übersetzen zu lassen, sondern ihr könnt z.B. auch wenn ihr einen spanischen Gast z.B. habt oder einen russischen. All das könnt ihr in der App transkribieren lassen und dann z.B. auf Englisch oder Deutsch übersetzen lassen, wenn noch jemand Rückfragen hat. Wenn euch jemand erreichen möchte. Wenn jemand wissen möchte, wie das funktioniert oder mit euch zusammenarbeiten möchte, wo erreichen wir euch? Also erstmal wir sind auf allen Kanälen sozusagen erreichbar. Wir sind auf unserer Website. Könnt ihr im Kontaktformular mit uns in Kontakt treten. Wir haben da auch eine Telefonnummer hinterlegt. Da könnt ihr uns anrufen. Da geht immer einer ran. Definitiv. Ob morgens, mittags, abends oder nachts. Also wir sind vierundzwanzig Stunden erreichbar und auf Social Media über linkt in natürlich auch. Ihr könnt auch gerne mich über linkt in Anschreiben und genau wenn ihr da sozusagen einmal durchgeführt werden möchtet, was? Die Optionen sind dann immer her mit euren Anfragen. Wir führen euch gerne durch. Vielen, vielen lieben Dank für deine Auskünfte zu Honigs Produkten und der Bedeutung für die Podcast Welt. Sehr gerne. Danke für das Interview. Schön, dass du da etwas pta. Das war nix neues. Aus der podcast szene.


Folge unserem News-Podcast NAPS: auf podcast.de | per RSS | auf Spotify | auf Apple Podcasts | auf Google
Folge unseren News: per RSS | auf Google News | auf Newsadoo