Wydra - usługa transkrypcji dźwięku oparta na sztucznej inteligencji, która faktycznie działa


Tak jak w ostatniej dekadzie było wszystko o telefonach komórkowych, następna dekada Internetu będzie wszystko o dźwięku. Od wyszukiwanie głosowe po dyktando do Asystenci AI, klawiatura zostanie ostatecznie zastąpiona naszymi głosami. To dobra wiadomość dla naszych nadgarstków.

Rozpoznawanie głosu w przypadku dyktowania i transkrypcji jest jednak wciąż bardzo popularne. Lider w branży to smok, a Google i Apple mają dobrą funkcję dyktowania wbudowaną odpowiednio w Dokumenty Google i System operacyjny Mac. Ale ogólnie rozpoznawanie głosu może być znacznie bardziej złe niż właściwe, zwłaszcza jeśli masz nietypowy akcent.

Właśnie dlatego Wydra robi fale. To usługa transkrypcji dźwięku, która faktycznie działa - i ma się bardzo dobrze. Co więcej, nie wszystkie ich najlepsze oferty są zablokowane za profesjonalnymi planami.

Co to jest wydra?

Gdy masz plik audio jednej lub więcej osób rozmawiając, możesz chcieć mieć pisemną wersję tych rozmów. Może chcesz je do napisów w YouTube, a może chcesz przesłać je online w celach SEO? A może jesteś studentem z nagranym wykładem i chcesz wersję pisemną?

Niezależnie od okoliczności, istnieje wiele powodów, dla których możesz chcieć skorzystać z usługi transkrypcji audio. Ale do tej pory opcje sztucznej inteligencji były notorycznie złe, a firmy, które oferowały to za ciebie, pobierały nieprzyzwoite kwoty.

Ale teraz Otter jest po to, aby transkrypcja była przystępna i dostępna dla wszystkich. Jest to internetowa maszyna napędzana sztuczną inteligencją, która w mgnieniu oka pobierze plik audio i wypluje napisaną wersję. Dokładny czas zależy oczywiście od długości twojego pliku audio.

Zanim zaczniesz… ..Wskazania na temat wydry

Usługa transkrypcji dźwięku Wydra nie będzie w 100% idealna, ponieważ:

  1. Ludzie jąkają się i zmieniają kierunek w połowie zdania. To nie brzmi tak źle, kiedy słuchasz. Ale kiedy widzisz to na piśmie, wygląda chaotycznie.
  2. Wydra czasami ma problemy z interpunkcją, jeśli osoba mówi szybko, a jedno zdanie przechodzi w drugie. Wtedy kropka może zostać pominięta.
  3. Jeśli dana osoba ma pewien akcent, Wydra może nieco nie zrozumieć. Stąd korzyść z listy niestandardowych słowników w planie Pro.
  4. Niektóre słowa zostaną źle napisane. Na przykład firma Lyft może być błędnie napisana jako „Lift”.
  5. Rejestracja w usłudze transkrypcji audio wydry

    Bezpłatny abonament daje 600 minut bezpłatnej transkrypcji każdego miesiąca. Dla zwykłych użytkowników to więcej niż wystarczające. Jeśli jednak zdecydujesz się na uaktualnienie do planu Pro (9,99 USD miesięcznie lub 99,99 USD rocznie), korzyści są niesamowite.

    Te 600 minut nagrywa do 6000 minut miesięcznie, a także eksportuje transkrypcje do różnych formatów plików (takich jak PDF i DOCX), niestandardowe listy słownictwa (aby poprawić dokładność transkrypcji), synchronizację Dropbox i wiele innych więcej.

    Ale w celu przetestowania usługi transkrypcji audio 600 minut to więcej niż kiedykolwiek będziesz potrzebować. Przejdź do strona internetowa Wydry i zarejestruj się. Możesz założyć konto lub zarejestrować się przy użyciu konta Google lub konta Facebook.

    Następnie w ustawieniach konta możesz połączyć konto z Google lub Microsoft, aby wprowadzić swój kalendarz i kontakty. Integracja Powiększenie to miły akcent - po nawiązaniu połączenia Zoom dźwięk zostanie natychmiast przesłany do Otter w celu transkrypcji.

    Jak zdobyć pierwszą transkrypcję z wydrą

    W tym artykule użyję pliku MP3 pobranego podcastu. Ale możesz także nagrać osobę rozmawiającą bezpośrednio na stronie Otter, która zostanie w ten sposób przepisana.

    • Przejdź do strony głównej pulpitu nawigacyjnego i kliknij importuj audio / wideona po prawej stronie.
      • Pojawi się okno przesyłania, w którym możesz przejść do lokalizacji pliku na komputerze lub przeciągnij i upuść go za pomocą myszy lub gładzika. Gdy plik już tam będzie, rozpocznie się przesyłanie.
        • Gdy zobaczysz status Sukces, kliknij Gotowe, a zobaczysz, że jest „przetwarzany”.
          • Teraz jest kwestia oczekiwania. W przypadku tego jednogodzinnego pliku transkrypcja dźwięku trwała 30 minut. Zawsze otrzymasz powiadomienie e-mail, gdy transkrypcja jest gotowa. Możesz więc przesłać plik audio, rozpocząć proces, a następnie zamknąć wszystko i odejść. Wydra poinformuje Cię, kiedy zostanie ukończona.
          • Ukończony transkrypcja

            • Gdy zobaczysz, że transkrypcja jest gotowa, wróć do strony i kliknij ją na stronie deski rozdzielczej. Zobaczysz go wraz z przydatnymi słowami kluczowymi i tagami. Możesz również utworzyć link do udostępniania dla innych, aby go wyświetlić.
              • Jak już powiedziałem, nie będzie idealny, więc od razu zobaczysz błędy. Ale można to łatwo naprawić, klikając niebieski przycisk EDYCJA.
                • Teraz popraw literówki na stronie Otter i pamiętaj, aby wszystko zapisać.
                  • Teraz czas na eksport pliku. Kliknij trzy pionowe kropki i wybierz Eksportuj tekst.
                    • Darmowa wersja daje tylko wersje plików tekstowych lub kopiowanie do schowka, wraz z różnymi innymi opcjami, których nie należy zmieniać, chyba że jest to naprawdę konieczne.
                    • Zaletą Wydry jest jej szybkość, a także fakt, że jej sztuczna inteligencja jest wystarczająco inteligentna, aby oddzielić różne głośniki w dźwięku. Liczy się to, co małe.

                      Powiązane posty:


                      4.01.2020