Trascrizione a confronto
Quanto è precisa scryp nella trascrizione in italiano – e quanto sono sicuri i tuoi dati rispetto ai grandi servizi cloud? Ecco i risultati dei nostri benchmark.
Precisione di trascrizione per l'italiano
Word Error Rate (WER) – più basso è, meglio è. Precisione = 100% − WER.
← Scorri la tabella lateralmente →
| Provider | Generale (precisione) | Dominio specialistico (precisione) | WER generale |
|---|---|---|---|
| scrypSX-3 | 97.2 % | 96.1 % | 2.8 % |
| OpenAIWhisper Large v3 | 91.8 % | 83.5 % | 8.2 % |
| Google STTCloud Speech-to-Text | 88.5 % | 80.2 % | 11.5 % |
| Azure SpeechMicrosoft Cognitive | 87.9 % | 78.7 % | 12.1 % |
| AWS TranscribeAmazon Standard | 85.7 % | 75.9 % | 14.3 % |
Set di dati di test e metodologia
- La base è il nostro set di test composto da registrazioni audio pubbliche in italiano nei domini Generale, Sanità e Legale.
- Tutti i provider sono stati testati con file audio identici e un metodo di valutazione uniforme (Word Error Rate dopo normalizzazione standard).
- La colonna Dominio specialistico mostra la media tra le registrazioni sanitarie e legali. I tassi di errore aumentano con il vocabolario specialistico per tutti i provider – ma molto di più per i modelli senza addestramento specifico di dominio.
- I risultati possono variare a seconda della qualità audio, del numero di parlanti, del dialetto e dello specifico caso d'uso.
Perché scryp è costruita in modo diverso per i contenuti sensibili
Questi punti descrivono l'architettura di scryp. Sono formulati in modo volutamente concreto e non intendono essere un giudizio generale su ogni altro provider.
Crittografia sul tuo dispositivo
I file vengono crittografati nel browser prima del caricamento. I contenuti memorizzati vengono mantenuti permanentemente solo in forma crittografata.
Chiara architettura UE
Trascrizione in Austria, archiviazione crittografata in Germania – entrambe all'interno dell'UE. Questo rende trasparente dove avviene ciascuna fase di elaborazione.
Infrastruttura di elaborazione propria
Nessuna IA esterna di terze parti è coinvolta nella trascrizione. Questo riduce flussi di dati e dipendenze aggiuntivi.
Flusso completo nel browser
Modifica, esportazione, condivisione e sincronizzazione audio sono integrate direttamente nel prodotto, non solo disponibili come componenti API separati.
Fonti e documentazione
Le funzionalità dei provider sono state verificate rispetto alla documentazione ufficiale. I dati sulla precisione si basano sul set di dati di test descritto sopra.
Modelli e precisione
- Radford et al. (2022): Robust Speech Recognition via Large-Scale Weak Supervision - OpenAI Whisper Paper
- OpenAI Whisper Repository - Modelle und Sprachen
- faster-whisper (SYSTRAN) - CTranslate2-basierte Whisper-Implementierung
- pyannote.audio 3.x - Speaker Diarization Pipeline
- Mozilla Common Voice - Offener Sprachdatensatz
Documentazione dei provider
- Google Cloud Speech-to-Text - Overview and speech recognition
- Google Cloud Speech-to-Text - Speaker Diarization
- Microsoft Azure Speech Service - Overview and documentation
- Azure Speech - Real-time diarization quickstart
- Amazon Transcribe - Developer Guide
- Amazon Transcribe - Speaker partitioning (Diarization)
Pronto per una trascrizione sicura?
Prova scryp gratis – crittografata fin dal primo secondo.