Description from extension meta
Komunikacja głosowa z ChatGPT i Cl*ude.ai w Chrome z transkrypcją mowy za pomocą Whisper (OpenAI) lub z użyciem transkrypcji Chrome.
Image from store
Description from store
Rozszerzenie umożliwia interakcję głosową z ChatGPT i Cl*ude.ai w przeglądarce Chrome oraz innych przeglądarkach opartych na Chromium (np. Edge). Pozwala na wykorzystanie modelu AI "Whisper" opracowanego przez OpenAI do transkrypcji mowy na tekst. Możesz również użyć metody transkrypcji wbudowanej w przeglądarkę (webkitSpeechRecognition). Rozszerzenie pojawia się i jest aktywne podczas odwiedzania chat.openai.com lub claude.ai.
Projekt jest darmowy i open source (opublikowany na github)
# Funkcje programu
- możesz rozmawiać z czatem, mówiąc do mikrofonu, a jego odpowiedzi będą odczytywane na głos
- możesz włączyć opcję, która odczyta całą rozmowę w czacie na głos, lub tylko ostatnią odpowiedź
- możesz zaznaczyć fragment tekstu w wątku czatu i włączyć funkcję odczytywania tego fragmentu na głos
- w konfiguracji rozszerzenia możesz ustawić parametry głosu, w tym język rozmowy z czatem, głos, ton i prędkość czytania, metodę transkrypcji głosu
# Transkrypcja głosu STT (speech-to-text)
Rozszerzenie oferuje dwie metody transkrypcji głosu:
1) webkitSpeechRecognition - domyślna metoda wykorzystująca API przeglądarki Chrome. Transkrypcja jest wykonywana lokalnie (offline). Uwaga: Ta metoda nie dodaje interpunkcji i jest obsługiwana tylko w przeglądarce Chrome.
2) Whisper - model AI opracowany przez OpenAI do transkrypcji mowy na tekst. Oferuje wysokiej jakości transkrypcję z właściwą interpunkcją. Wymaga klucza API OpenAI, co wiąże się z kosztami (cennik OpenAI). Transkrypcja jest wykonywana na serwerach OpenAI, co wymaga wysłania nagrania audio.
# Synteza mowy TTS (text-to-speech)
Rozszerzenie wykorzystuje speechSynthesis - API dostarczane przez przeglądarkę Chrome i inne przeglądarki oparte na Chromium (np. Edge, Opera, Brave). Pozwala to na syntezę mowy (TTS) w trybie offline, bez transmisji danych.
W ustawieniach możesz wybrać język i głos używane do syntezy mowy, jak również dostosować inne parametry, w tym ton i prędkość czytania.