Microsoft Azure-granskning: Banbrytande röstbehandling

Microsoft Azure Speech to Text är en av de mest avancerade plattformarna för röstigenkänning. Som en del av Microsofts produktprogram Cognitive Speech Services använder den sig av djupinlärningsalgoritmer för att övervinna dålig ljudkvalitet och kan anpassas till olika talstilar för exakta ljudtranskriptioner. I den här Microsoft Azure Speech to Text-granskningen kommer vi att titta närmare på den här tjänsten.

Det är värt att notera att Microsoft Azure Speech to Text inte är en traditionell användarvänlig dikteringsprogramvara. Istället är detta en utvecklarorienterad plattform som är utformad för att hjälpa företag att skapa, testa och hantera sina egna produkter. Om du bara vill transkribera en rad ljudfiler kan alternativa tal-till-text-appar vara ett bättre alternativ. Ta en titt på vår bästa guide till text-till-text-programvara för de bästa alternativen.

Microsoft Azure Tal till text: Planer och prissättning

Med hjälp av Microsoft Azure Speech to Text kan du transkribera upp till fem timmars ljud gratis och skapa en anpassad röstmodell per månad. Men med den kostnadsfria planen är bara en enda samtidig ljudförfrågan tillgänglig åt gången, vilket innebär att det här alternativet inte är genomförbart för de flesta företag.

Fakturering av Azure-taltjänsten är uppdelad i steg om en sekund.

Om du vill transkribera mer än ett talklipp samtidigt måste du uppgradera till det vanliga Azure-prissystemet. Detta kostar $ 1 per timmes ljud och stöder upp till 20 samtidiga förfrågningar. Ytterligare avgifter är involverade om du behöver använda en anpassad ljudmodell eller transkribera flerkanaliga ljudfiler. Dessa extra tjänster kostar $ 1,40 respektive $ 2,10 per ljudtimme.

Även om Microsoft listar sina priser i formatet "per ljudtimme", liksom branschstandarden, faktureras faktiskt i steg om en sekund så att du inte betalar för mer bearbetningstid än vad som krävs.

Microsoft Azure-tal till text: funktioner

Nyckelfunktionen Azure Speech to Text är den åtkomst den ger till Microsofts kraftfulla naturliga språkbehandlingssystem. Under de senaste åren har Microsofts tal AI nått flera viktiga milstolpar. Det betyder att det nu kan slutföra uppgifter som tidigare var omöjliga för en taligenkänningstjänst, som att exakt transkribera korsprat under små gruppkonversationer.

Microsoft Azure Speech to Text-tjänsten kan integreras med Office 365 för optimal noggrannhet.

Azure arbetar med dussintals språk och dialekter och kan utbildas - med hjälp av anpassade taligenkänningsmodeller - för att bättre anpassa sig till en användares talstil, bakgrundsmiljöbrus och ordförråd. Om din organisation redan är engagerad i Microsofts produktekosystem kan du använda Office 365-data för att bättre förbättra taligenkänningsnoggrannheten för organisationsspecifika termer. Och viktigare, detta kan göras utan att kompromissa med din datasäkerhet eftersom Tal till text kan köras lokalt.

Microsoft Azure-tal till text: installation

Microsoft Azure har utformats för utvecklare snarare än konsumenter. Detta innebär att inställningen är en involverad och något utmanande procedur som bäst lämnas åt någon med en hel del teknisk kunskap.

Att konfigurera Azure är inte precis enkelt om du inte har kodningserfarenhet.

Det snabbaste sättet att konfigurera Azure är att använda Azure Speech SDK i ett programmeringsspråk som Java eller C ++. För detta måste du registrera dig för ett gratis Azure-konto och skapa ett tomt projekt i din utvecklingsmiljö. Du måste sedan använda Microsoft Visual Studio och skriva ett kort program för att initiera Microsofts SpeechRecognizer-objekt.

Microsoft Azure tal till text: gränssnitt

Liksom andra bulk transkriptionsplattformar är Microsoft Azure Speech to Text avsedd att köras som ett applikationsprogrammeringsgränssnitt (API), läggas till i Office 365-program eller integreras i nya plattformar och tjänster. På grund av detta finns det inget enda Azure Speech to Text-gränssnitt. Vad slutanvändaren ser beror på hur Azure Speech to Text har integrerats.

Azure online-portalen är intuitiv och enkel att använda.

Under tiden kommer utvecklaren som hanterar Azure att göra det via Microsofts Azure Portal online, som känns modern och är lätt att navigera. Det tar bara några minuter att hitta resursidan för taltjänster och när en instans har lagts till i ditt konto kan övervakningsvarningar och användning visas i ett enda fönster.

Microsoft Azure-tal till text: prestanda

Som en del av vår granskning av Microsoft Azure Speech to Text var vi angelägna om att se hur den här plattformen hanterade utmaningen att bearbeta råa röstinspelningar, så när vårt Azure-konto var klart att börja lade vi upp en serie klipp med varierande nivåer av bakgrundsbrus . Över hela linjen gjorde Azure ett bra jobb med att bearbeta våra prover eftersom vi inte såg mer än en handfull fel under vår utvärdering.

Att aktivera Azures anpassade talmodell förbättrade vår transkriptionsnoggrannhet.

Azure kämpade lite när de först behandlade ovanliga eller specialfraser som idrottslagnamn och vetenskapliga termer, men detta löstes snabbt genom att aktivera alternativet för anpassad modellutdata. När vi väl hade aktiverat det här alternativet kunde Azure anpassa sig till den unika ordförråd och talstil vi använde.

Microsoft Azure-tal till text: support

För att lära dig hur du interagerar med Azure Speech Services SDK genom olika programmeringsspråk och integrerar Azure Speech to Text-funktionerna i din egen plattform behöver du definitivt lite hjälp. Lyckligtvis har Microsoft skapat en omfattande katalog med utbildningsmaterial för Azure-plattformen, där du hittar kodexempel och praktiska tips.

Utbildningsavsnittet på Azure-webbplatsen innehåller många användbara resurser.

Alla Azure-kunder får också gratis fakturering och support för hantering av prenumerationer som kan nås via ett biljettsystem. Mer djupgående support kan läggas till ditt konto mot en återkommande avgift, från 29 $ per månad.

Microsoft Azure-tal till text: slutlig dom

Azure Speech to Text-plattformen använder avancerad teknik för att tillhandahålla en nästan perfekt transkriptionstjänst. Det passar bäst för företag som redan har investerat i Microsoft Office 365-ekosystemet eftersom anpassade röst- och ordförrådsmodeller kan genereras säkert från ditt befintliga dokumentarkiv. Vissa småföretag kan kämpa med Azure eftersom det krävs uppmärksamhet från en kvalificerad Microsoft-molnutvecklare för att konfigurera den ordentligt.

Tävlingen

Amazon Transcribe, Google Cloud Speech-to-Text och Watson Speech to Text är direkta konkurrenter till Microsoft Azure. Dessa tre plattformar är också alla kapabla att utföra batch-transkriptioner med hög volym noggrant. Google Cloud är den enda nära konkurrenten som kan arbeta med fler språk än Azure, men det är dyrare, med en starthastighet på bara 0,006 dollar per 15 sekunder, jämfört med Azures 0,017 dollar per minut (0,00425 dollar per 15 sekunder).

För att hitta andra alternativ till Microsoft Azure Speech to Text, kolla in vår bästa programvara för tal-till-text-programvara.

Intressanta artiklar...