Mastodon
Zdjęcie okładkowe wpisu Nowe funkcje transkrypcji mowy na tekst w systemach Apple – szybciej niż Whisper

Nowe funkcje transkrypcji mowy na tekst w systemach Apple – szybciej niż Whisper

0
Dodane: 2 dni temu

W najnowszych wersjach deweloperskich iOS 26 i macOS Tahoe, Apple udostępniło nowe narzędzia do transkrypcji mowy – SpeechAnalyzer i SpeechTranscriber – które zaskakują szybkością i dokładnością.

Test przeprowadzony przez MacStories pokazał, że nowa technologia Apple dorównuje dokładnością znanemu modelowi Whisper od OpenAI (używanemu m.in. w MacWhisper i VidCap), ale działa ponad dwukrotnie szybciej. Przykład: 34-minutowy film został przetworzony w zaledwie 45 sekund przez autorskie narzędzie „Yap” oparte na frameworku Apple, podczas gdy MacWhisper potrzebował 1:41 min.

Aplikacja Czas przygotowania transkrypcji
Yap (framework Apple ) 0:45
MacWhisper (Large V3 Turbo) 1:41
VidCap 1:55
MacWhisper (Large V2) 3:55

Apple udostępnia te narzędzia deweloperom do integracji w aplikacjach — można je wykorzystać zarówno do dyktowania, jak i do rozpoznawania poleceń głosowych lub transkrypcji materiałów wideo/audio.

To istotna zmiana szczególnie dla osób regularnie pracujących z transkrypcjami, np. studentów, dziennikarzy czy twórców wideo.

Krzysztof Kołacz

🎙️ O technologii i nas samych w podcaście oraz newsletterze „Bo czemu nie?”. ☕️ O kawie w podcaście „Kawa. Bo czemu nie?”. 🏃🏻‍♂️ Po godzinach biegam z wdzięczności za życie.

Zapraszamy do dalszej dyskusji na Mastodonie lub Twitterze .