Det bliver mere og mere almindeligt at bruge stemme til at kontrollere vores hjem og computere. Hvor det kun for et årti siden blev bedt om Alexa eller Google Home om at kontrollere lysene eller bestille et produkt fra internettet, kunne have virket usædvanligt, men det er nu normen.
Et af de virksomheder, der har investeret mest i denne type teknologi, er Google, der gør det muligt for deres Google Home-enheder og Android-systemer at acceptere verbale kommandoer og endda genkende højttaleren.
I dag skal vi se på, hvordan de har linket denne teknologi til deres Google Docs-platform og overveje, om dette er et levedygtigt alternativ til andre kommercielle tale-til-tekst-løsninger.
Priser
Softwaren er inkluderet i Google Docs, og det er iboende gratis. Alt hvad du behøver for at bruge det er en Google-konto og enten en mobilenhed eller computer med en mikrofon. Det er en anden datakilde, som Google kan høste, men det er en del af prisen for 'gratis' i disse dage.
Design
Det er muligt at bruge stemme til input på Google Docs, funktionen kaldes 'Voice Typing' og kan findes i menuen Funktioner på et Google Doc eller i Google Slides. Det kan også aktiveres på begge steder ved hjælp af genvejstasten Ctrl-Shift-S.
Når du aktiverede den for første gang, bliver du bedt om at sanktionere adgangen til mikrofonen for docs.google.com.
Når du har accepteret, at der vises et lille felt med et mikrofonlogo, som du kan klikke på for at aktivere stemmeinput. Dette erstattes derefter med et rødt mikrofonsymbol ved siden af dokumentet for at indikere, at systemet er i lyttefunktion.
Før du aktiverer stemmetypning af kontrolpanelet, kan du vælge et sprog fra en menu, og da dette er Google, er der masser af valg. Og du kan også klikke på et spørgsmålstegn og modtage hjælp til, hvordan du bruger systemet.
Efterhånden som disse systemer går, er dette en meget kondenseret løsning.
Google behandler det, du siger, efter bedste evne, og hvis systemet er usikker på et ord, vil det understrege det med gråt. Disse 'mistænkte' ord kan derefter klikkes på og nogle alternativer leveres af systemet.
Men du kan hurtigt bevæge dig rundt i et dokument og rette problemer manuelt eller placere markøren og give Voice Typing endnu et stød på det.
Hvis du har brug for at tale med en anden person, mens du arbejder, kan du bede Google om at stoppe med at lytte og derefter genoptage bagefter.
Men for at få den fulde kapacitet af denne løsning er der en lang liste over kommandoer, der skal huskes, der kan kopiere, indsætte, flytte rundt i dokumentet, indsætte tabeller og et utal af andre funktioner.
Og du kan indsætte tegnsætning, formatere dokumentet og endda indsætte hyperlinks.
Men at få mest muligt ud af det forudsætter, at du kan huske kommandoerne eller have hjælp åben til at jogge din hukommelse.
En liste er hurtigt tilgængelig ved let at sige 'Liste over stemmekommandoer'.
Sprog
Hvor mange tale-til-tekst-løsninger kun dækker et lille antal sprog, har Googles et betydeligt beløb. Den nuværende endelige liste er:
Afrikaans, amharisk, arabisk, arabisk (Algeriet), arabisk (Bahrain), arabisk (Egypten), arabisk (Israel), arabisk (Jordan), arabisk (Kuwait), arabisk (Libanon), arabisk (Marokko), arabisk (oman) , Arabisk (Palæstina), Arabisk (Qatar), Arabisk (Saudi-Arabien), Arabisk (Tunesien), Arabisk (De Forenede Arabiske Emirater), Armensk, Aserbajdsjansk, Bahasa Indonesien, Baskisk, Bengali (Bangladesh), Bengali (Indien), Bulgarsk, Catalansk, Kinesisk (forenklet), Kinesisk (traditionel), Kinesisk (Hongkong), Kroatisk, Tjekkisk, Dansk, Hollandsk, Engelsk (Australien), Engelsk (Canada), Engelsk (Ghana), Engelsk (Indien), Engelsk (Irland) , Engelsk (Kenya), Engelsk (New Zealand), Engelsk (Nigeria), Engelsk (Filippinerne), Engelsk (Sydafrika), Engelsk (Tanzania), Engelsk (UK), Engelsk (USA), Farsi, Filippinsk, Finsk, Fransk , Galicisk, georgisk, tysk, græsk, gujarati, hebraisk, hindi, ungarsk, islandsk, italiensk, italiensk (Italien), italiensk (Schweiz), japansk, javanesisk, kannada, khmer, koreansk, laotisk, lettisk, litauisk, malayalam, Malaysia n, Marathi, Nepali, Norsk, Polsk, Portugisisk (Brasilien), Portugisisk (Portugal), Rumænsk, Russisk, Slovakisk, Slovensk, Serbisk, Singalesisk, Spansk, Spansk (Argentina), Spansk (Bolivia), Spansk (Chile), Spansk (Colombia), Spansk (Costa Rica), Spansk (Ecuador), Spansk (El Salvador), Spansk (Spanien), Spansk (USA), Spansk (Guatemala), Spansk (Honduras), Spansk (Latinamerika), Spansk (Mexico ), Spansk (Nicaragua), Spansk (Panama), Spansk (Paraguay), Spansk (Peru), Spansk (Puerto Rico), Spansk (Uruguay), Spansk (Venezuela), Sundanesisk, Swahili (Kenya), Swahili (Tanzania), Svensk, tamil (Indien), tamil (Malaysia), tamil (Singapore), tamil (Sri Lanka), thai, tyrkisk, ukrainsk, urdu (Indien), urdu (Pakistan), vietnamesisk og zulu.
Det er 119 sprog, inklusive 13 arabiske former, 19 spanske variationer, 13 engelske dialekter og endda fire varianter af tamil.
Der er inkluderet sprog, der sjældent understøttes af dikteringssoftware, som zulu og islandsk, på grund af det relativt lille antal højttalere.
Sprogdækning er sandsynligvis Google Voice Typing's største styrke.
Optagelser
Hvis denne løsning har en svaghed, er den, at den ikke let kan behandle optagelser.
Selvom det ikke er umuligt at få det til at gøre dette, men det kræver patchning af lydsystem på computeren, så det tager output bestemt til højttalerne og dirigerer det som om det kommer fra mikrofonen. Men ved at gøre dette kan du ikke skelne mellem forskellige personer på optagelserne, og det kan forstyrre den AI, som Google bruger til at gøre verbal nøjagtighed bedre ved at lære, hvordan du taler.
Hvis du ønsker at transskribe podcasts eller optagede interviews, vil vi anbefale, at du bruger noget andet, da dette værktøj ikke er bygget til det formål.
Nøjagtighed
Det er svært at bedømme nøjagtigheden af et stemmebehandlingssystem, når du ikke kan sende det de samme optagelser, som andre produkter har konverteret. Og enhver, der bruger Alexa eller Google Home regelmæssigt, ved, at det lejlighedsvis ikke vil forstå os, hovedsagelig på grund af fremmede lyde eller inkonsekvent tale.
Når det er sagt, i den aktive test, vi gjorde, fik dette værktøj generelt de fleste ord korrekt, eller det rigtige ord var hurtigt tilgængeligt i menuen mistænkte ord.
For at få de bedste resultater skal der udvises en vis kontrol i hastighed, lydstyrke og tone ved at tale, noget der utvivlsomt følger med praksis. At være i stand til at huske alle de specielle kommandoer kan også reducere antallet af nødvendige redigeringer efter optagelse, kritisk.
Afhængigt af dine forventninger er nøjagtigheden her acceptabel. Der er en konsistens i dens fortolkninger, som den opretholdt under vores tests. Hvor godt det fungerer for dig, kan vi ikke forudsige. Men da det er gratis, koster det ikke andet end din tid at bestemme det.
Sikkerhed
Da dette er Google, er sikkerhedsmodellen den samme, der styrer adgangen til alle Google-konti. Det spænder fra simpel adgangskodebeskyttelse op til en mere rimelig metode til tofaktorautentificering (TFA).
I betragtning af antallet af identitetstyve rundt løber de, der bruger Google uden TFA, en betydelig risiko for at få deres konti kompromitteret.
Selv denne sikkerhedsmulighed har sine grænser, men det er bedre end blot en adgangskode.
For dem, der ikke er tilstrækkeligt paranoide, anbefaler vi kraftigt, at du går til https://myactivity.google.com/myactivity
Og du kan se, hvad Google indsamler om dig dagligt, og det kan omfatte optagelser af dine stemmekommandoer.
Endelig dom
Dette kan være en længere gennemgang, hvis denne software tilbyder mere funktionalitet, men det gør det ikke.
Når tale-til-tekst-løsninger går, er denne ikke kompliceret, men den har nok funktionalitet til at være virkelig nyttig.
Andre løsninger er bygget til at håndtere transkribering af samtaler mellem flere mennesker, hvor dette blev designet til at håndtere en enkelt person, der taler på en kontrolleret og præcis måde.
Hvad det bruger antager, er at du er glad for at bruge Google og Google Docs, selvom det ikke er den ultimative destination for den tekst, du indtaster.
Det er ingen opgave at kopiere en indsætningsdiktat fra Google Docs til en anden applikation, og du får en sky-kopi til reference, hvis du ender med at have brug for en.
Nogle brugere har forståeligt nok problemer med at fodre Googles umættelige appetit på brugerdata, og denne mekanisme er endnu en datakilde, som den kan snacke.
Hvis du har lyst til det, bruger du ikke Google Voice Typing eller noget fra Google.
For dem, der er villige til at acceptere, hvor meget Google måske ved om dem, så er stemmediktatløsningen i Google Docs i stand nok til generel brug, især hvis du kun har brug for denne funktion lejlighedsvis.