Microsoft Azure-gennemgang: Banebrydende stemmebehandling

Indholdsfortegnelse:

Anonim

Microsoft Azure tale til tekst er en af ​​de mest avancerede stemmegenkendelsesplatforme. Som en del af Microsofts produktprogram Cognitive Speech Services bruger det dyb læringsalgoritmer til at overvinde dårlig lydkvalitet og kan tilpasse sig forskellige talestilarter for nøjagtige lydtranskriptioner. I denne Microsoft Azure tale til tekst gennemgang vil vi se nærmere på denne service.

Det er værd at bemærke, at Microsoft Azure Speech to Text ikke er et traditionelt stykke brugervenligt dikteringssoftware. I stedet er dette en udviklerorienteret platform designet til at hjælpe virksomheder med at oprette, teste og administrere deres egne produkter. Hvis du bare vil transkribere et antal lydfiler, kan alternative tale-til-tekst-apps være en bedre mulighed. Se vores bedste tale-til-tekst softwareguide for de bedste alternativer.

Microsoft Azure tale til tekst: planer og priser

Ved hjælp af Microsoft Azure Speech to Text kan du transskribere op til fem timers lyd gratis og oprette en brugerdefineret stemmemodel om måneden. Men med den gratis plan er kun en enkelt samtidig lydanmodning tilgængelig ad gangen, hvilket betyder, at denne mulighed ikke er levedygtig for de fleste virksomheder.

Fakturering af Azure-taletjeneste er opdelt i intervaller på et sekund.

Hvis du vil transskribe mere end et taleklip på én gang, skal du opgradere til det almindelige Azure-prissystem. Dette koster $ 1 pr. Time lyd og understøtter op til 20 samtidige anmodninger. Yderligere gebyrer er involveret, hvis du har brug for en brugerdefineret lydmodel eller transskriberer multikanals lydfiler. Disse ekstra tjenester koster henholdsvis $ 1,40 og $ 2,10 pr. Lydtime.

Selvom Microsoft angiver sine priser i et "pr. Lydtimeformat", som det er industristandarden, er fakturering faktisk opdelt i intervaller på et sekund, så du ikke betaler for mere behandlingstid end krævet.

Microsoft Azure tale til tekst: Funktioner

Nøglen til Azure Speech to Text-funktionen er den adgang, den giver til Microsofts kraftfulde naturlige sprogbehandlingssystem. I løbet af de sidste par år har Microsofts tale AI nået flere vigtige milepæle. Dette betyder, at det nu kan gennemføre opgaver, der tidligere var umulige for en talegenkendelsestjeneste, såsom nøjagtig transskription af krydstale under små gruppesamtaler.

Microsoft Azure tale til tekst-tjenesten kan integreres med Office 365 for optimal nøjagtighed.

Azure fungerer med snesevis af sprog og dialekter og kan trænes - ved hjælp af tilpassede talegenkendelsesmodeller - til bedre at tilpasse sig en brugers talestil, baggrundsmiljøstøj og ordforråd. Hvis din organisation allerede er forpligtet til Microsofts produktøkosystem, kan du udnytte brugerens Office 365-data for bedre at forbedre talegenkendelsesnøjagtigheden for organisationsspecifikke vilkår. Og vigtigst af alt kan dette gøres uden at kompromittere din datasikkerhed, fordi tale til tekst kan køres lokalt.

Microsoft Azure tale til tekst: Opsætning

Microsoft Azure er designet til udviklere snarere end forbrugere. Dette betyder, at opsætning er en involveret og noget udfordrende procedure, der bedst overlades til en person med en hel del teknisk know-how.

Opsætning af Azure er ikke ligefrem ligetil, medmindre du har kodningserfaring.

Den hurtigste måde at konfigurere Azure på er at bruge Azure Speech SDK på et programmeringssprog som Java eller C ++. Til dette skal du registrere dig for en gratis Azure-konto og oprette et tomt projekt i dit udviklingsmiljø. Du skal derefter bruge Microsoft Visual Studio og skrive et kort program til at initialisere Microsofts SpeechRecognizer-objekt.

Microsoft Azure tale til tekst: grænseflade

Ligesom andre bulk-transkriptionsplatforme er Microsoft Azure Speech to Text beregnet til at blive kørt som en applikationsprogrammeringsgrænseflade (API), tilføjet til Office 365-programmer eller integreret i nye platforme og tjenester. På grund af dette er der ingen enkelt Azure Speech to Text-grænseflade. Hvad slutbrugeren ser, afhænger af, hvordan Azure Speech to Text er blevet integreret.

Azure online-portalen er intuitiv og nem at bruge.

I mellemtiden vil udvikleren, der administrerer Azure, gøre det via Microsofts online Azure Portal, som føles moderne og let at navigere. Det tager kun et par minutter at finde siden med taletjenestens ressourcer, og når en instans er blevet føjet til din konto, kan overvågningsalarmer og brug ses i et enkelt vindue.

Microsoft Azure tale til tekst: ydeevne

Som en del af vores Microsoft Azure Speech to Text-gennemgang var vi ivrige efter at se, hvordan denne platform håndterede udfordringen med at behandle rå stemmeoptagelser, så når vores Azure-konto var klar til brug, uploadede vi en række klip med varierende niveauer af baggrundsstøj . Overalt på linjen gjorde Azure et godt stykke arbejde med at behandle vores prøver, da vi ikke så mere end en håndfuld fejl i løbet af vores evaluering.

Aktivering af Azures tilpassede talemodel forbedrede vores transkriptionsnøjagtighed.

Azure kæmpede lidt, når de først behandlede usædvanlige eller specialsætninger som sportsholdsnavne og videnskabelige udtryk, men dette blev hurtigt løst ved at aktivere den tilpassede modeloutputmulighed. Når vi først havde aktiveret denne mulighed, kunne Azure tilpasse sig den unikke ordforråd og talestil, vi brugte.

Microsoft Azure tale til tekst: Support

For at lære at interagere med Azure Speech Services SDK gennem forskellige programmeringssprog og integrere Azure Speech to Text-funktionerne i din egen platform, har du helt sikkert brug for hjælp. Heldigvis har Microsoft oprettet et omfattende katalog med uddannelsesmateriale til Azure-platformen, hvor du finder kodeeksempler og praktiske tip.

Træningsafsnittet på Azure-webstedet indeholder mange nyttige ressourcer.

Også alle Azure-kunder får gratis fakturerings- og abonnementsadministrationssupport, som kan tilgås via et billetsystem. Mere dybdegående support kan føjes til din konto mod et tilbagevendende gebyr, der starter ved $ 29 pr. Måned.

Microsoft Azure tale til tekst: Endelig dom

Azure Speech to Text-platformen bruger avanceret teknologi til at levere en næsten perfekt transskriptionstjeneste. Det er bedst egnet til virksomheder, der allerede er investeret i Microsoft Office 365-økosystemet, fordi brugerdefinerede tale- og ordforrådsmodeller kan genereres sikkert fra dit eksisterende dokumentarkiv. Nogle små virksomheder kan kæmpe med Azure, da det kræver opmærksomhed fra en kvalificeret Microsoft cloududvikler at konfigurere det korrekt.

Konkurrencen

Amazon Transcribe, Google Cloud Speech-to-Text og Watson Speech to Text er direkte konkurrenter til Microsoft Azure. Disse tre platforme er også alle i stand til at udføre batch-transskriptioner med stort volumen nøjagtigt. Google Cloud er den eneste nære konkurrent, der er i stand til at arbejde med flere sprog end Azure, men det er dyrere med en starterhastighed på kun 0,006 $ pr. 15 sekunder sammenlignet med Azures 0,017 $ pr. Minut (0,00425 $ pr. 15 sekunder).

For at finde andre alternativer til Microsoft Azure Speech to Text, se vores bedste tale-til-tekst softwareguide.