Watson tale til tekst anmeldelse: Den bedste transkriptionstjeneste med stort volumen?

Indholdsfortegnelse:

Anonim

Watson er IBMs computersprogssystem, der behandler naturligt sprog. Det driver den berømte spørgsmålssvarende supercomputer samt en række AI-baserede virksomhedsprodukter, herunder Watson Speech to Text. I vores Watson tale til tekst gennemgang ser vi på en af ​​de bedste tale-til-tekst apps, der er ideelle til alle, der ønsker at konvertere lyd til tekst i skala.

Watson-talebehandlingsplatformen er tilgængelig på IBM Cloud. Det er et alsidigt værktøj og kan bruges i mange sammenhænge, ​​herunder diktering og transkription af konferenceopkald. Hvad mere er, i modsætning til de fleste andre tale-til-tekst-apps, er den tilgængelig som en API, der giver udviklere mulighed for at integrere den i stemmestyringssystemer blandt andet.

Watson tale til tekst: planer og priser

Du kan bruge Watson Speech to Text til at behandle op til 500 minutters lyd gratis pr. Måned. Hvis du vil konvertere mere end det, skal du betale for hvert lydminut, og hastigheden ændres baseret på varigheden af ​​den behandlede lyd. Omkostningerne spænder fra $ 0,01 til $ 0,02 pr. Minut, og der opkræves et tillægsgebyr på 0,03 $ pr. Minut, hvis du har brug for IBMs Custom Language Model. Der findes også premium Watson-abonnementer, som giver adgang til forbedrede data-fortrolighedsfunktioner og oppetidsgarantier.

Watsons tale-til-tekst-service er prissat baseret på den mængde indhold, du har brug for at transskribe.

Du kan også få adgang til Watson tale til tekst-systemet via et almindeligt IBM Cloud-abonnement. Naturlig sprogbehandling er kun en app i en bred vifte af AI-tjenester, du kan få gennem IBM Cloud, så dette er en god mulighed for enhver organisation, der har brug for adgang til dataoverførsler med hurtig hastighed, chatbots eller tekst til tale-værktøjer.

Watson tale til tekst: Funktioner

Takket være fleksibel API-integration og andre forudbyggede IBM-værktøjer går Watson talegenkendelsestjeneste langt ud over grundlæggende transkription. Hvis du f.eks. Vil bruge det i en kundeservicekontekst, kan Watson Assistant konfigureres til at behandle spørgsmål om naturlige sprog direkte eller besvare forespørgsler over telefonen.

I Watson har IBM sammensat en funktionsrig naturlig sprogbehandlingsplatform.

Watson arbejder med live lyd på 11 sprog og kan importere lyde i en række præindspillede formater. I realtid betyder diagnostisk support i realtid, at Watson kan bede brugere om at komme tættere på deres mikrofon eller ændre deres miljø. Imponerende er også det faktum, at Watson kan skelne mellem forskellige højttalere i en delt samtale takket være Speaker Diarization, en funktion, der stadig gennemgår beta-test.

Watson tale til tekst: Opsætning

For at bruge Watson er den første ting, du skal gøre, at oprette en IBM Bluemix-konto. Registrering er gratis og smertefri og kræver kun en e-mail-adresse og adgangskode. Når du er logget ind, skal du tilføje en bestemmelse på din konto til tjenesten Tale til tekst. Du får et par legitimationsoplysninger på dette tidspunkt, som du skal gemme i dine egne poster.

Registrering til en IBM Bluemix-konto er nødvendig for at få adgang til Watsons fulde funktionssæt.

Når du har gjort det, bliver tingene betydeligt mere komplekse. For at få adgang til Watson skal du tilføje disse legitimationsoplysninger til en batch cURL-kode (client uniform resource locator) og derefter køre den på din maskine. For at finde ud af præcis, hvilken kommando du skal ringe til, skal du tjekke denne praktiske vejledning. Alternativt, hvis du bare vil se, hvor godt Watson-systemet fungerer uden at skulle springe gennem alle disse bøjler, kan du i stedet prøve det på IBMs demo-side.

Watson tale til tekst: grænseflade

I modsætning til forbruger-vendt stemme-til-tekst-apps er Watsons tjenester designet til at få adgang via API'er og kode indlejret i andre systemer. Af denne grund er der ingen ægte Watson "interface". I stedet kan du få adgang til Watson via tre forskellige internetprotokoller. Disse er WebSockets, REST API og Watson Developer Cloud.

Watson tale til tekst kan styres via Watson Developer Cloud-systemet.

For at kontrollere Watson skal du bruge et kommandolinjeværktøj, der opretter forbindelse til IBMs sky via en af ​​disse tre ruter. Den grænseflade, som slutbrugeren, der interagerer med Watson ser, skal bygges separat af nogen på dit udviklingsteam.

Watson tale til tekst: ydeevne

Samlet set var vi imponeret over den måde, hvorpå denne naturlige sprogbehandlingsplatform håndterede ægte tale. Vi brugte Watson til at transkribere klip, vi optog i en række udfordrende miljøer, såvel som soundbites af berømte taler, der blev givet på flere af Watsons 11 understøttede sprog.

Vi fandt ud af, at Watson klarede sig godt med forindspillet tale.

Selvom fejl voksede hyppigere for klip med masser af baggrundsstøj, genererede Watson generelt utrolige nøjagtige resultater. Vi vurderer ud fra vores test, at uopfordrede fejl kun opstod en gang hvert 150 ord i gennemsnit. Det blev imidlertid klart, hvorfor Watsons funktion for højttaler diarisering forbliver i BETA-test, da en stemme flere gange under vores evaluering blev forkert mærket som separate højttalere.

Watson tale til tekst: Support

IBM-ressourcecenteret tilbyder masser af dokumentation for bedre at forstå, hvordan du anvender Watson til din særlige brugssag. Det er også værd at bruge API-integrationer og SDK'er oprettet af Watson-udviklerfællesskabet og sendt til GitHub.

Watson API GitHub-siden er en god kilde til support til Watson Speech to Text-tjenesten.

Hvis du ikke finder løsningen på dit problem der, kan du kontakte IBM direkte ved at åbne en supportbillet eller kontakte dem over telefonen. Så længe du har valgt en af ​​de premium Watson-pakker, vil din Watson-brug blive beskyttet af en serviceniveau Uptime-aftale.

Watson tale til tekst: Endelig dom

Hvis din organisation har knowhow og ressourcer til korrekt at integrere IBM Watson Speech to Text-platformen i dit system, får du fordel af avancerede funktioner som realtidsdiagnosticering af lydmiljø og midlertidige transkriptionsresultater. Imidlertid vil små virksomheder og organisationer kæmpe med den tekniske udfordring at sætte Watson ordentligt op.

Konkurrencen

IBM Watson tale til tekst-tjenesten er en direkte konkurrent til bulk-transkriptionstjenester Google Cloud tale-til-tekst og Amazon Transkribe. Begge disse er betydeligt billigere end Watson, med f.eks. Google Cloud-transkription, der starter ved $ 0,006 pr. Minut. Alle tre tjenester deler lignende funktioner, såsom tilpasset ordforråd, men en funktion, der meget mangler fra IBM Watson, men som er tilgængelig med begge konkurrenter, er automatisk tegnsætningsgenkendelse.

Leder du efter en anden tale til tekst-løsning? Tjek vores bedste guide til tekst-til-tekst-software.