Gennemgang af Sonix.ai-transkriptionssoftware

Hvert værktøj, der transskriberer, er målrettet mod en bestemt niche, og Sonix har valgt dem, der optager møder eller præsentationer og derefter har brug for en indtastet version for at søge eller formidle.

Derfor kunne det være lige så nyttigt for en studerende som det kunne være for en direktør, der leverer transkriptioner, der let kan indekseres til fremtidig reference.

Men for at få succes med disse opgaver, skal softwaren være nøjagtig og overkommelig.
Er Sonix.ai det værktøj, og kan en onlinetjeneste konkurrere med en installeret applikation?

  • Vil du prøve Sonix.ai? Tjek hjemmesiden her

Planer og priser

Som med mange transskriptionstjenester er Sonix-omkostningsmodellen en, der er baseret på tid. Specifikt er længden af ​​enhver optagelse, som du uploader til tjenesten for at behandle, og omkostningerne ved den ressource er $ 10 pr. Time, hvis du bruger dens pay-as-you-go-standardtjeneste.

Omkostningen pr. Time kan sænkes til $ 5, hvis du tilmelder dig Premium-abonnementstjenesten til $ 22 pr. Måned for hver bruger. Og der er volumenrabatter tilgængelige for de virksomheder, der kræver mere end 100 timer pr. Måned transskriberet.

Standardplanen har de mest basale funktioner, og Premium tilføjer yderligere dem som adgang til flere brugere og deling af team. Og Enterprise har alt, hvad Premium tilbyder med masser af administration ekstra og en forbedret supportmodel.

Efterhånden som transskriptionstjenester går, er Sonix en af ​​de dyrere og bestemt ikke noget, som de fleste studerende eller hjemmebrugere med rimelighed har råd til.

Design

My.sonix.ai-webstedet bruger et usædvanligt rent design, og det er gratis at oprette en konto.

I skrivende stund er dette udelukkende en webbaseret tjeneste, og Sonix har ingen mobilapp, der kan registreres og sendes til behandling af lydoptagelser.

Men som vi dækker sent, er der enkle måder omkring dette problem, der løser manglen på en mobilapp noget.

Startpunktet for ethvert transkriberingsjob er Sonix.ai-instrumentbrættet, hvor du kan se den lyd, der allerede er blevet transskriberet, og tilføje nye, der skal behandles.

Da dette system er designet til flere brugere, inkluderer det et virtuelt mappesystem til at organisere transkriptioner på den måde, der anses for passende.

Ved at klikke på 'upload' føres brugeren til en side, hvor flere filer kan slippes ned i systemet, og hvis kontoen har tilstrækkelig kredit, kan de derefter behandles.

Alle standard lydfilformater understøttes inklusive wav, mp3, mp4a, aiff, acc, ogg og wma, og du kan også uploade nogle videopakningsstrukturer. Den maksimale filstørrelse er 4 GB, så før du uploader en stor 4K-opløsning-videofil, vil vi anbefale, at du bruger et andet værktøj til at opdele lyden for at gøre upload hurtigere.

En god måde at fremskynde upload på er at bruge en cloud-lagerfacilitet som Google Drive, One Drive, Box eller Dropbox og at linke det direkte til kontoen. Du kan også e-maile systemet ved hjælp af Gmail som et middel til at skabe en mere elegant arbejdsgang end at slippe filer på en webside.

Denne automatisering leveres via Zapier, hvilket giver mulighed for meget bredere integration, hvis den virksomhed, der bruger den, har investeret i denne teknologi for at forbinde sine forretningsprocesser.

En anden god berøring er, at du sammen med lyd- eller videofilen kan medtage eksisterende transkription som et middel til hurtigere at afslutte processen og forbedre nøjagtigheden.

En anden god berøring er, at du sammen med lyd- eller videofilen kan medtage eksisterende transkription som et middel til hurtigere at afslutte processen og forbedre nøjagtigheden.

På grund af arten af ​​Cloud-baseret behandling er det umuligt at bedømme, hvor hurtig eller langsom behandling kan være, men Sonix.ai er relativt hurtig i vores erfaring. Det tager typisk mellem 10% og 20% ​​af tiden at transkribe, når optagelsen varer. Derfor tager det normalt under 2 minutter at fuldføre en 10-minutters optagelse.

Du behøver ikke at følge behandlingen, da systemet sender dig en underretning via e-mail, når arbejdet er udført sammen med et link til den nye transkription.

Når filen er behandlet, kan du åbne den inden for og redigere siden for at gennemgå resultaterne og også eksportere teksten i en lang række nyttige formater, herunder dem, der er defineret som undertekster af nogle apps.

Antallet af sprog og dialekter, der understøttes af systemet, er 36, og det inkluderer flere engelske, franske, kantonesiske, mandarin-, portugisisk- og spansktalende lande sammen med alle almindelige vest- og østeuropæiske sprog sammen med nogle asiatiske og arabiske.

Optagelser

Ved siden af ​​det arbejde, der gik ind i AI, der var nødvendigt for at fortolke de lyde, som mennesker laver, repræsenterer sandsynligvis Recordings-siden en betydelig kodningsindsats her.

Her kan både lyden og dens tilknyttede transkription sammenlignes og forbedres manuelt med detaljer om højttalerændringer og rettelser til fejlagtige fortolkninger.

For alle, der arbejder igennem en udskrift for at polere teksten, angiver denne side kulfladens placering. Det giver mening, at der er gjort en del indsats i denne del, da det er meget let at bruge og følge.

I et forsøg på at henvise brugeren til, hvor der kan være problemer, vil Sonix.ai farvekode indholdet for at fremhæve de sektioner, som det er mindre selvsikker. Denne funktion kan være nyttig, selvom Sonix.ai kan begå fejl i selv de dele, hvor den anser transkriptionen for at have en 'Meget tillidsfuld' status.

De bedste aspekter af denne side er, hvordan lydafspilning og tekst synkroniseres, så placeringen af ​​markøren i teksten flytter afspilningspositionen til det samme afsnit.

Ved siden af ​​almindelig redigering er det også muligt at fremhæve sektioner i forskellige stilarter og lave noter for at gå sammen med transkriptionen.

Du kan også tilpasse tidskoden, især nyttig, hvis optagelsen starter med en lang pause eller uønsket præambel.

Nøjagtighed

Sonix beskriver Sonix.ai som 'Den bedste automatiserede transkriptionssoftware, der drives af banebrydende AI'.

I betragtning af vores test vil vi beskrive dette produkt som meget afhængigt af kvaliteten af ​​optagelsen og mange andre faktorer, der ikke let kan kontrolleres.

Når vi behandlede vores klassiske historiske taleoptagelser, havde det virkelig svært for nogle højttalere, selvom de lød klart for os.

Disse resultater var i markant kontrast til nogle flere samtidige optagelser, hvor nøjagtigheden var acceptabel, men næppe stjernernes.

Vi konkluderede, at Sonix's tilgang antager flere antagelser, der kan fungere eller ej, afhængigt af højttaleren og kvaliteten af ​​optagelsen.

Hvad der var fascinerende er, at tjenesten vil farvekode sin transkription baseret på, hvor sikker den er på det, der siges, og denne selvanalyse er meget afslørende.

Under nogle omstændigheder vil det korrekt identificere, at en sektion kan være mistænkelig, men i andre dele er den sikker på, at den er transskriberet helt forkert.

Et par almindelige problemer ser ud til at kaste det en kurvekugle, og en af ​​disse er mennesker, der ikke taler grammatisk perfekt prosa. I et forsøg på at gøre deres tale mere direkte har de fjernet nogle ord fra deres sætninger, hvilket giver en mere dramatisk stil. Når disse transskriberes af Sonix, ser det ud til at være fast besluttet på at tilføje disse ord tilbage for at passe til dens interne grammatikmodel snarere end hvad der faktisk blev talt.

Transkriptionen læser bedre som et dokument, men det er ikke rigtig repræsentativt for det, der blev sagt.

Sonix er bestemt bedre, når kvaliteten af ​​optagelsen og højttalernes klarhed er høj, som vi beviste med et lille klip af Stephen Fry, der læste Harry Potter. Men det er ikke muligt altid at have sådan kontrol over lydkvaliteten, og det lavede stadig fejl med den test.

Et andet problemområde er formelle navne og tekniske ord eller forkortelser. Disse kan løses ved at føje dem til den brugerdefinerede ordbog, men dette kræver arbejde for at gøre systemet i stand til at realisere bedre, når navne eller akronymer bruges.

For dem, der har brug for transkriptionsord perfekt, har Sonix et udvalg af tilknyttede professionelle transkriberere, der kan arbejde igennem en optagelse og løse disse problemer, men dette modvirker noget formålet med behandlet transskription.

Sikkerhed

Fokus for Sonix.ai-sikkerhed er de servere, hvor lyden behandles, og transkriptionerne holdes.

Al trafik krypteres ved hjælp af TLS (Transport Layer Security), og når filerne er på serveren, der er beskyttet af flere lag af firewall, er indtrængningsbeskyttelse og alle data ringfence af AES-256 server-kryptering. Og virksomheden lover, at medarbejderne ikke har adgang til optagelser eller transkriptioner, medmindre der gives udtrykkelig tilladelse til dem at have det.

Det kritiske problem med denne tilgang er, at et simpelt login og adgangskode kan omgå det hele. Sonix.ai har ingen tofaktorautentificering, og den har ikke en let tilgængelig logbog over, hvem der har adgang til filer og hvornår.

Fra et sikkerhedsmæssigt synspunkt kan dette meget vel blive betragtet som en overdreven tillid til integriteten hos dem, der bruger systemet, for ikke at dele optagelser med andre uden for virksomheden eller beholde potentielt følsomme filer, når de forlader virksomheden.

Kort sagt, sikkerheden skal være bedre, og sporing eller brugeraktivitet gives større prioritet.

Endelig dom

I betragtning af de relativt høje omkostninger forventede vi, at Sonix ville klare sig bedre, end det gjorde.

Måske var vi uheldige med vores valg af ting at omkode, men det så stadig ud til at gøre en overdreven mængde fejl.

På plussiden af ​​denne ligning er det hurtigt, og det er et bemærkelsesværdigt nemt system at bruge, selvom vi vil anbefale at køre et par eksempler på optagelser gennem denne løsning, inden vi abonnerer på et abonnement.

Det største problem med Sonix er de høje omkostninger, og selvom det er det rigtige værktøj til netop dit krav, er der billigere måder at gøre lyd til tekst andre steder.

Interessante artikler...