
Harry James
0
7195
240
Szukasz najlepszych darmowy Oprogramowanie Windows do zamiany mowy na tekst? Najczęściej powtarzane płatny zaleceniem jest Dragon Naturally Speaking (DNS). Ale niektórzy mogą drwić z płacenia za oprogramowanie. Na szczęście istnieje kilka świetnych darmowych programów, takich jak Pisanie głosowe Dokumentów Google (GDVT) i Windows Speech Recognition (WSR).
Dragon NaturallySpeaking Basics 13 (nie produkowane) Dragon NaturallySpeaking Basics 13 (nie produkowane) Kup teraz na Amazon 29,99 USD
Możesz się zastanawiać, jak te dwa produkty wypadają w porównaniu z DNS - i czy DNS spełnia Twoje potrzeby. W tym artykule zidentyfikowałem trzy rodzaje użytkowników: tych, którzy potrzebują transkrypcji mowy na tekst pisanie powieści, ci, którzy potrzebują transkrypcja akademicka, i ci, którzy piszą dokumenty biznesowe, jak notatki. W tym celu przetestowałem trzy programy transkrypcji mowy (DNS, GDVT i WSR).
Konfiguracja transkrypcji mowy
Zanim przejdziemy do testu, spójrzmy najpierw na zalecaną konfigurację sprzętu i oprogramowania.
Wymagania dotyczące sprzętu i oprogramowania
Pisanie głosowe w Dokumentach Google wymaga przeglądarki Chrome i mikrofonu. Potrzebuje również stałego połączenia z Internetem (czego nie ma w wymaganiach). W przeciwnym razie jest to prawdopodobnie najłatwiejsza metoda na rozpoczęcie transkrypcji mowy.
DNS wymaga procesora wyprodukowanego w 2001 r. Lub nowszego, Windows 7 lub nowszego i około 4 GB bezpłatnej pamięci. Najostrzejszym wymaganiem jest 2 GB pamięci RAM. Oto pełna lista wymagań sprzętowych DNS.
Rozpoznawanie mowy w systemie Windows Włącz sterowanie mową na tekst i głosem przez skonfigurowanie rozpoznawania mowy w systemie Windows Włącz sterowanie mową na tekst i głosem przez skonfigurowanie rozpoznawania mowy w systemie Windows Rozpoznawanie mowy pozostaje silniejsze niż Cortana. Umożliwia sterowanie mową na tekst i sterowanie głosem. W tym artykule dowiesz się, co potrafi rozpoznawanie mowy, jak go skonfigurować, wyszkolić i używać. , znany również jako środowisko uruchomieniowe mowy (pobierz WSR), nic nie kosztuje i wymaga tylko systemu operacyjnego Windows 7 lub nowszego.
Uwagi dotyczące mikrofonu
Używam mikrofonu dynamicznego (najlepszy mikrofon do podcastów Najlepszy mikrofon podcastów za twoje pieniądze w 2017 roku Najlepszy mikrofon podcastu za twoje pieniądze w 2017 roku Mikrofony mają duże znaczenie przy tworzeniu podcastu. Początkowe koszty są dość niskie: oprogramowanie do nagrywania, pulpit lub laptop i oczywiście mikrofon. Więc jaki jest najlepszy mikrofon podcastowy?) i stosunkowo szybki procesor Intel Core i7. Chociaż pożądany jest mikrofon wysokiej jakości, nie jest on wymagany. Mimo to Twoje wyniki poprawią się dzięki lepszej jakości dźwięku i zmniejszeniu szumów tła.
Najtańszym mikrofonem, który poleciłbym do nagrywania wysokiej jakości, jest Audio-Technica ATR-2100. Jednak różnica dokładności między mikrofonem za 5 USD a urządzeniem o wartości 200 USD jest dość minimalna.
Audio-Technica ATR2100-USB dynamiczny mikrofon kardioidalny USB / XLR Audio-Technica ATR2100-USB dynamiczny mikrofon kardioidalny USB / XLR Kup teraz na Amazon 62,99 USD
Z drugiej strony, minimalne wymagania dla Microsoft Speech to praktycznie każdy zdalnie nowoczesny komputer (większość komputerów wyprodukowanych w ciągu ostatnich dziesięciu lat) i mikrofon. Jeśli posiadasz laptopa lub tablet wyprodukowany w ciągu ostatnich pięciu lat, powinien on mieć domyślnie to, czego potrzebujesz.
Konfigurowanie programów transkrypcji mowy
Oto jak korzystać z Pisania Google Voice:
Oto jak rozpocząć korzystanie z rozpoznawania mowy w systemie Windows:
I na koniec, oto jak zacząć z Dragon Naturally Speaking:
Metodologia testów
Chcę znaleźć to, co najlepsze darmowy Aplikacja zamiany tekstu na mowę w systemie Windows. Ponieważ różni konsumenci mogą potrzebować innego produktu, opracowałem prosty test. Czytam trzy różne fragmenty z tekstów bez praw autorskich: jeden od Charlesa Darwina O tendencji gatunków do tworzenia odmian. Jeden z H.P. Lovecraft's Call of Cthulu. Ostatnie wspomnienia z wystąpienia Jerry'ego Browna na temat stanu Unii w 2017 r. Moja metodologia nie jest bynajmniej idealna, ale daje wrażenie dokładności każdego zestawu do rozpoznawania głosu.
Próbka piśmiennictwa fikcyjnego (od H.P. Lovecrafta Call of Cthulu)
“Myślę, że najbardziej miłosierną rzeczą na świecie jest niezdolność ludzkiego umysłu do skorelowania całej jej zawartości. Żyjemy na spokojnej wyspie niewiedzy pośród czarnych mórz nieskończoności i nie oznaczało to, że powinniśmy podróżować daleko. Nauki, każda podążająca w swoim własnym kierunku, do tej pory niewiele nam zrobiły krzywdy; ale któregoś dnia połączenie oddzielonej wiedzy otworzy tak przerażające widoki rzeczywistości i naszej przerażającej pozycji w niej, że albo oszalejemy od objawienia, albo uciekniemy od śmiertelnego światła do pokoju i bezpieczeństwa nowej ciemnej ery.”
Próbka pisania biznesowego (przemówienie Jerry'ego Browna na temat stanu Unii w 2017 r.)
“Przy takiej okazji zwykle określa się konkretny program na nadchodzący rok. Sześć razy wcześniej z tej trybuny zrobiłem to i, bardziej szczegółowo. Kiedy ponownie przeczytałem te propozycje przedstawione w poprzednich wystąpieniach o stanie państwa, byłem zdumiony, widząc, jak wiele wspólnie osiągnęliśmy.”
Academic Writing Sample (Charles Darwin's O tendencji gatunków do formowania odmian)
“Teraz, gdy występuje różnorodność takiego zwierzęcia, mającego zwiększoną moc lub pojemność w jakimkolwiek narządzie lub sensie, taki wzrost jest całkowicie bezużyteczny, nigdy nie jest wzywany do działania, a nawet może istnieć bez zwierzęcia, który kiedykolwiek byłby tego świadomy. Przeciwnie, w dzikim zwierzęciu, wszystkie jego zdolności i moc są w pełni wykorzystywane dla potrzeb istnienia, każdy wzrost staje się natychmiast dostępny, jest wzmacniany przez ćwiczenia, i musi nawet nieznacznie modyfikować pożywienie, nawyki i całość ekonomia rasy.”
3 przetestowane pakiety transkrypcji głosu
Zaskakujące jest to, jak bezpłatne rozpoznawanie głosu Najlepsze aplikacje do tworzenia list poleceń głosowych Najlepsze aplikacje do tworzenia list poleceń głosowych Wiele bezpłatnych narzędzi zwiększających wydajność obsługuje listy głosowe. Pokażemy Ci najlepsze aplikacje do tworzenia list z rozpoznawaniem głosu i poleceniami, które musisz wypróbować. testy przeprowadzone na płatnym oprogramowaniu. Ale najdokładniejszą aplikacją jest Dragon Naturally Speaking. Jednak pisanie głosowe Google i rozpoznawanie mowy w systemie Windows nic nie kosztują i zapewniają ponad 90-procentową dokładność. Ale każda z nich ma swoje mocne i słabe strony i możesz preferować jedną od drugiej.
H.P. Lovecraft (test pisania fikcji)
Lovecraft uwielbiał pisać w długiej, nieprzerwanej, nawiasowo gęstej prozie. Podczas gdy wszystkie trzy apartamenty wykonują świetną robotę polegającą na dokładnej transkrypcji tekstu wokalnego Lovecrafta, DNS wyprzedza swoich konkurentów. Obejmuje to zarówno wielkie litery, jak i interpunkcję (co jest całkowicie szalone).
DNS: DNS usunął tylko jedno słowo z tekstu. Ogólnie rzecz biorąc, uzyskał 107 poprawnych ze 108 słów. Przybił także kilka długich, nieprzerwanych zdań.
WSR: Windows wykonał bardzo dobrą robotę - ale nie niesamowitą - transkrybowanie Lovecrafta. Poprawne było około 97 z około 108 słów. Chociaż nie ma to zarówno GDVT, jak i DNS, nadal jest dobry dla darmowego programu mowy na tekst, który nie wymaga dostępu online.
GDVT: Nie jestem pewien, co się stało, ponieważ Google przybił transkrypcję dla innych fragmentów. GDVT osiągnął tylko 103 spośród 108, upuszczając dwa słowa i błędnie przepisując trzy. Nawet raz się przeliterował “średnik” zamiast wstawiania poprawnej interpunkcji. Wielkie słowa pisały też wielką literą, zamieniając je we właściwe rzeczowniki (ale nie będę ich karać, ponieważ liczy się dokładność, a nie wielkie litery).
Jestem pewien, że jeśli ponownie przeczytam dokument po raz drugi, nie będzie żadnych błędów.
Charles Darwin (pisemny test naukowy lub akademicki)
Darwin pisze, podobnie jak Lovecraft, długie zdania pełne informacji w nawiasach. Jednak jego użycie języka jest bardzo jasne i nie używa prawie żadnego żargonu, co różni się od prawie niezrozumiałego pisania artykułów naukowych.
DNS: Tekst Darwina wychodzi prawie idealnie w Dragon Naturally Speaking. DNS błędnie napisał tylko jedno słowo (“w”), a poza tym całkowicie przybity test z 87 słowami prosto z 88.
WSR: Microsoft wykonał świetną robotę, dopasowując 82 z 88 słów. Popełnił jednak dość dziwne błędy, takie jak pisownia “sens” tak jak “centów”.
GDVT: Google świetnie sobie poradził z fragmentem Darwina. GDVT skazał tylko dwa słowa, spośród 88. Ogólnie rzecz biorąc, w przypadku bezpłatnej aplikacji nie można znaleźć dokładniejszej alternatywy.
Jerry Brown Państwo adresu państwa 2016 (test pisania biznesowego)
Mowa Browna nie korzysta z wielu skomplikowanych zdań ani słownictwa (oprócz tego słowa “rostrum”). Ogólnie rzecz biorąc, większość usług transkrypcyjnych działała niesamowicie. Mniej więcej, jeśli potrzebujesz usługi, która obsługuje proste zdania i ograniczone słownictwo, każde z nich działa świetnie.
DNS: DNS przybił Browna Państwo adresu państwa. Mimo że kropla kropla, w przeciwnym razie każde słowo doskonale. Należy jednak pamiętać, że często w wypowiedziach politycznych brakuje złożonego języka, który można spotkać w powieściach i akademiach. Notatka lub mowa jest bezpośrednia i na temat. Klient rozpoznawania mowy nie powinien mieć żadnych problemów z obsługą.
WSR: Rozpoznawanie mowy Windows wykonało świetną robotę - choć nie tak dobrą jak DNS czy Google - w transkrypcji mowy Browna. Zdobył 55 z 58 słów. Rozpoznało nawet to słowo “rostrum,” który nawet nie wiedziałem, że to słowo, ani nie umiałem go wymówić. Najwyraźniej albo dobrze to zrozumiałem, albo technologia rozpoznawania mowy może nawet złapać nieporozumienia.
GDVT: Oprogramowanie Google do transkrypcji całkowicie przykuło transkrypcję ze 100-procentową dokładnością. Udało się nawet poprawnie napisać wielką literą “Państwo”, bez potrzeby wprowadzania danych przez użytkownika. Dziwnie użył liczby, a nie pisowni słowa “sześć”. Co spowodowało błąd stylistyczny.
Czy warto skorzystać z bezpłatnych usług transkrypcji?
Istnieje różnica między Dragon Naturally Speaking, Google Voice Pisanie i Microsoft Windows Speech Recognition. Dragon jest dokładniejszy niż jego konkurenci. Jednak najlepszym darmowym programem pod względem dokładności jest - z wąskim marginesem - Pisanie głosowe Google. Chociaż usługi transkrypcyjne zarówno firmy Microsoft, jak i Google porównują mniej niż korzystnie z DNS, nie kosztują 30 USD.
W przeciwieństwie do dwóch darmowych usług, Google oferuje lepszą dokładność rozpoznawania głosu, interpunkcję i wielkość liter, wymaga połączenia z Internetem. Google rejestruje również wiele rzeczy, których nie zamierzasz, na przykład interpunkcję i wielkie litery.
Jeśli jednak chcesz mieć darmowy program do transkrypcji, do którego nie potrzebujesz połączenia z Internetem, Windows Speech Recognition pasuje do rachunku, który Windows może zrobić? 15 zaskakujących funkcji, o których nie miałeś pojęcia o systemie Windows. 15 Zaskakujące funkcje, których nie miałeś pojęcia O systemie Windows możesz zrobić znacznie więcej, niż myślisz. Nawet jeśli jesteś doświadczonym użytkownikiem systemu Windows, założę się, że odkryjesz na naszej liście funkcję, o której istnieniu nigdy nie wiedziałeś. . Nie jest wcale zły i oferuje 90 procent tego, co oferuje Dragon Naturally Speaking. Spróbuj, jeśli jeszcze tego nie zrobiłeś.
Aby to zrobić na telefonie z Androidem, sprawdź najlepsze aplikacje Android na mowę i tekst 7 Najlepsze aplikacje do dyktowania Androida na łatwą mowę na tekst 7 Najlepsze aplikacje do dyktowania na Androida na łatwą mowę na tekst Szukasz najlepszej mowy? aplikacje na tekst na Androida? Te aplikacje do dyktowania Androida pozwalają robić notatki i nie tylko. .
Jaka jest twoja ulubiona usługa transkrypcji? Daj nam znać w komentarzach!