„Common Voice” ”Mozilli - baza danych crowdsourcingowa służąca poprawie rozpoznawania głosu


Dostaję wiele komplementów na temat mojego głębokiego szkockiego akcentu, ale jeśli chodzi o aplikacje głosowe, takie jak Siri i Alexa, mój głos jest czymś więcej niż atutem. Kiedy Apple i Amazon robili swoich asystentów głosowych, nie mieli chyba szkockiego konsultanta ds. Akcentu w zakresie szybkiego wybierania.

Jeśli rozpoznawanie głosu ma być drogą przyszłości - i podobno tak jest dokąd zmierzamy - wyszukiwarki i asystenci głosowi muszą zacząć lepiej rozumieć trudne akcenty. Nie wszyscy mamy publiczne angielskie akcenty dla uczniów.

Mozilla (twórcy przeglądarki Firefox) próbują rozwiązać problem, prosząc ludzi o zgłaszanie swoich głosów do bazy danych o nazwie „Wspólny głos ”. Dopasowując głosy do ustawiania fraz, Mozilla ma nadzieję, że ich baza danych stanie się w przyszłości bezcennym narzędziem dla dowolnej aplikacji, w zależności od rozpoznawania głosu.

Rejestracja na „Common Voice”

Zanim przejdziemy dalej, usuńmy najpierw kwestie prywatności, ponieważ już je słyszę.

Chociaż możesz zarejestrować się za pomocą konta Firefox, konta Github lub konta Google, możesz zamiast tego zarejestrować się przez e-mail . Po prostu otwórz anonimowe konto e-mail z możliwością wyrzucenia, a nikt nie będzie mądrzejszy, niż mówisz.

Po utworzeniu konta i zalogowaniu się zobacz swój pulpit nawigacyjny.

Istnieją dwie sekcje - Mówi Słuchaj. Sekcja Mówto prośba o przekazanie własnego głosu. Słuchajto miejsce, w którym słuchasz głosów innych ludzi i porównujesz je z frazą, którą musieli wypowiedzieć. Następnie wskazałbyś, czy jest poprawny.

Mów

Aby wziąć udział w sekcji mówienia, potrzebujesz funkcjonującego mikrofonu, który wyraźnie odbierze Twój głos. Musisz także dać stronie Mozilli dostęp do tego mikrofonu.

Po kliknięciu sekcji Mówotrzymasz zestaw pięciu losowych fraz do wypowiedzenia. Instrukcje są bardzo wyraźnie widoczne na ekranie i łatwe do wykonania.

Wystarczy kliknąć ikonę mikrofonu poniżej, a następnie przeczytać zdanie normalnym tonem głosu. Nie nakładaj nienaturalnego akcentu ani nie mów bardzo wolno.

Istotą ćwiczenia jest to, że baza danych uczy się rozumieć akcenty ludzi w sposób, w jaki są one zwykle używane. Mówienie w inny sposób sprawia, że ​​cała sprawa jest bezcelowa.

Po zakończeniu pierwszej frazy zobaczysz w prawym górnym rogu opcje odtwarzania klipu i ponownego nagrania klipu, jeśli nie jesteś z tego zadowolony.

Jeśli jesteś z niego zadowolony, porusza się na następną i trwa aż do zakończenia wszystkich pięciu fraz. Następnie kliknij niebieski przycisk Prześlij, aby wysłać klipy do Mozilli w celu sprawdzenia.

Jeśli teraz wrócisz do deski rozdzielczej, zobaczysz, że przypisano ci te frazy.

To prosty przypadek płukania i powtarzania. Im więcej wkładów i różnych akcentów Mozilla może uzyskać w swojej bazie danych, tym bardziej udany będzie projekt.

Słuchaj

Gdy ludzie prześlą swoje wyrażenia do Mozilli, należy je sprawdzić aby upewnić się, że klip głosowy pasuje do frazy. Jest to coś, co jest również przekazywane społecznościom ochotników.

Wstecz na desce rozdzielczej, zobaczysz sekcję Słuchajpo prawej stronie. W sekcji Najlepsi współtwórcywidać, że niektóre poważne statystyki zostały zebrane.

Aby rozpocząć sprawdzanie poprawności fraz głosowych, przejdź do słuchać  Sekcja, a otrzymasz frazę i przycisk odtwarzania.

Kliknij przycisk odtwarzania (upewnij się, że głośniki są włączone!), a usłyszysz nagrany głos. Jeśli zdecydujesz, że wyrażenie zostało wypowiedziane poprawnie, kliknij Tak. Jeśli wystąpiło niepoprawne wypowiedzenie, coś jeszcze zostało powiedziane lub jakikolwiek inny błąd, kliknij NO.

Wniosek

To tylko jeden z wielu projektów, które Mozilla obecnie realizuje (przejdź do główna strona Mozilli i kliknij Projektyu góry - cały czas się zmienia). Crowdsourcing to świetny sposób na realizację godnych projektów i zawsze warto poświęcić swój czas, aby pomóc zbudować coś przydatnego na przyszłość.

Powiązane posty:


5.08.2019