Mulțumiri
Ascolta este software proprietar, dar se sprijină pe lucrări open-source excelente. Modelele de transcriere rulează pe Mac-ul tău și sunt descărcate direct de la editorii lor la prima utilizare — nu le includem și nu le redistribuim. Iată tot ce stă la baza aplicației, cu mulțumiri.
Recunoaștere vocală pe dispozitiv
- WhisperKit de la Argmax — inferență Whisper pe dispozitiv. Folosit sub licența MIT. github.com/argmaxinc/WhisperKit
- FluidAudio de la FluidInference — inferență Parakeet pe dispozitiv și descărcarea modelelor. Folosit sub licența Apache-2.0. github.com/FluidInference/FluidAudio
Modele de vorbire
Modelele de transcriere sunt descărcate pe Mac-ul tău de pe Hugging Face la prima utilizare și rulează complet offline. Ascolta nu redistribuie greutățile modelelor.
- Parakeet TDT 0.6B (v2 și v3) de la NVIDIA, împachetat pentru Core ML de FluidInference — folosit sub CC-BY-4.0, cu atribuire către NVIDIA. FluidInference/parakeet-tdt-0.6b-v3-coreml
- Whisper și Distil-Whisper de la OpenAI și echipa Hugging Face — folosite sub licența MIT.
Framework-uri ale aplicației
- Sparkle — actualizări sigure ale aplicației. Folosit sub licența MIT. sparkle-project.org
- Pachete Swift de la Apple (swift-crypto, swift-collections, swift-argument-parser, swift-asn1) și Hugging Face (swift-transformers, swift-jinja) — folosite sub licențele MIT și Apache-2.0.
Transcriere în cloud opțională
Dacă alegi să conectezi un furnizor cloud cu propria cheie API, conținutul audio este trimis acelui furnizor pentru transcriere, conform termenilor săi. Această opțiune este dezactivată implicit. Furnizori: OpenAI (gpt-4o-mini-transcribe) și Groq (whisper-large-v3-turbo).
Mulțumiri
Tuturor celor care construiesc și întrețin software-ul de mai sus și celor care gândesc cu voce tare. Întrebări despre licențiere? Scrie la [email protected].