Limburger Zeitung

Deutsche und europäische Nachrichten, Analysen, Meinungen und aktuelle Nachrichten des deutschen internationalen Senders.

Mozilla teilt mit NVIDIA die Demokratisierung und Diversifizierung der Audiotechnologie

Während die Technologie sprachfähige Produkte verändert, investiert NVIDIA 1,5 Millionen US-Dollar in Mozilla Common Voice, um die Spracherkennungslandschaft zu verändern.

In den nächsten zehn Jahren wird Sprache die wichtigste Art und Weise sein, wie Menschen mit Geräten interagieren – von Laptops und Telefonen über digitale Assistenten bis hin zu Einzelhandelskiosken. Geräte, die heutzutage Sprache unterstützen, sind für viele Menschen jedoch nicht zugänglich, da sie weite Bereiche der Sprachen, Dialekte und Sprachmuster der Welt nicht verstehen können.

Um sicherzustellen, dass Menschen überall von diesem massiven Technologiewandel profitieren, arbeitet Mozilla mit NVIDIA zusammen, das 1,5 Millionen US-Dollar in Mozilla Common Voice investiert, eine ehrgeizige Open-Source-Initiative zur Demokratisierung der Entwicklung und Diversifizierung der Audiotechnologie.

Die meisten Audiodaten, die derzeit zum Trainieren von Algorithmen für maschinelles Lernen verwendet werden, werden von einigen großen Unternehmen aufbewahrt. Dies stellt andere vor Herausforderungen, die hochwertige Spracherkennungstechnologien entwickeln und gleichzeitig die Spracherkennungslücke zwischen englischsprachigen Personen und dem Rest der Welt vergrößern möchten.

Common Voice wurde 2017 eingeführt und zielt darauf ab, die Wettbewerbsbedingungen zu verbessern und gleichzeitig die KI-Vorurteile zu verringern. Es ermöglicht jedem, seine Stimmen an eine kostenlose, öffentlich verfügbare Datenbank zu spenden, mit der Startups, Forscher und Entwickler Apps, Produkte und Dienste trainieren können, die Sprache unterstützen. Heute ist es der größte mehrsprachige Audiodatensatz der Welt mit mehr als 9.000 Stunden Audiodaten in 60 verschiedenen Sprachen, einschließlich weit verbreiteter und weniger gebräuchlicher Sprachen wie Walisisch und Kinyarwanda, die in Ruanda gesprochen werden. Bisher haben weltweit mehr als 164.000 Menschen zu dem Projekt beigetragen.

Diese Investition wird das Wachstum des Common Voice-Datensatzes beschleunigen, mehr Gemeinden und Freiwillige in das Projekt einbeziehen und die Einstellung neuer Mitarbeiter unterstützen.

READ  Samsungs iTest wirft einen Blick auf Galaxy Android auf dem iPhone

Um die Erweiterung zu unterstützen, wird Common Voice nun im Rahmen seiner Initiativen, die darauf abzielen, die KI vertrauenswürdiger zu machen, unter dem Dach der Mozilla Foundation arbeiten. Laut Mark Surman, CEO der Stiftung, ist Common Voice bereit, führend bei der Spende von Daten als wirksames Instrument zu sein, mit dem die Öffentlichkeit die Zukunft der Technologie zum Besseren gestalten kann.

“Sprache ist ein wichtiger Bestandteil unserer Identität, und Menschen, keine profitablen Unternehmen, sind die richtigen Verwalter dafür, wie Sprache in unserem digitalen Leben erscheint”, sagte Surman. “Durch die Erleichterung der Spende von Audiodaten ermöglicht Common Voice den Menschen, eine direkte Rolle bei der Schaffung von Technologien zu spielen, die der Menschheit helfen, anstatt sie zu schädigen. Mozilla und NVIDIA sehen Audio als eine große Chance, bei der die Menschen die Kontrolle über die Technologie wiedererlangen und ihre volle Wirkung entfalten können Potenzial. “.

“Die Nachfrage nach Konversations-KI steigt, und Chatbots und virtuelle Assistenten betreffen nahezu alle Branchen”, sagte Carey Brisky, Senior Manager der NVIDIA-Abteilung für Accelerated Computing-Produkte. “Mit den großen, offenen Datensätzen von Common Voice können wir vorgefertigte Modelle entwickeln und diese kostenlos der Community präsentieren. Gemeinsam arbeiten wir auf ein gemeinsames Ziel hin, Communitys zu unterstützen und aufzubauen – insbesondere für Sprachen mit geringen Ressourcen und unterversorgten Sprachen.”