Zapomnij o Siri 4 sposobach, w których Twój telefon ma być mądrzejszy

  • Gabriel Brooks
  • 0
  • 5116
  • 1316
Reklama

Wszystkie trzy główne platformy telefoniczne mają teraz własny głos. Apple ma Siri, Microsoft ma Cortanę, a Google ma nieco mniej pewny Google Now 6 Funkcje Google Now, które zmienią sposób wyszukiwania 6 Funkcje Google Now, które zmienią sposób wyszukiwania Możesz już używać Google Now na urządzeniu z Androidem, ale dostajesz z tego wszystko, co możesz? Wiedza o tych małych funkcjach może mieć duże znaczenie. .

Systemy te umożliwiają obsługę podstawowych zadań za pomocą sterowania głosowego. Każda z nich jest rodzajem wirtualnej sekretarki, która może odpowiadać na proste pytania, otwierać aplikacje, robić notatki i przekazywać wiadomości. Są przydatne, ale są również frustrująco ograniczone. Nie mogą zrobić niczego, do czego nie zostali wyraźnie zaprogramowani, a wiele zadań po prostu przekracza ich możliwości.

Jednak opracowywanych jest wiele technologii, które znacznie poprawią te systemy - i będą dostępne na rynku za kilka lat. Oto pięć najważniejszych sposobów, w jakie Twój telefon może stać się znacznie mądrzejszy.

Zobaczy to, co widzisz

Rozpoznawanie mowy poczyniło ogromne postępy w ciągu ostatnich pięciu lat dzięki rozwojowi potężnych sieci neuronowych. Nowoczesne smartfony potrafią rozpoznawać mowę z zaskakującą dokładnością (minęło sporo czasu, odkąd Google Now mnie źle zrozumiał), a nawet mogą robić takie rzeczy, jak identyfikacja utworów i programów telewizyjnych na podstawie ich dźwięku.

To świetnie - ale to dopiero początek. Ludzie nie wchodzą w interakcje ze światem przede wszystkim za pomocą dźwięku. Używamy wizji do praktycznie wszystkiego - i wkrótce nasze maszyny też. Zaczynamy widzieć debiut pierwszych wyświetlaczy do noszenia nausznych, takich jak Google Glass i Microsoft HoloLens Microsoft prezentuje nowe prezentacje HoloLens podczas konferencji Build Microsoft pokazuje nowe prezentacje HoloLens podczas konferencji Build nadchodzący zestaw słuchawkowy Microsoft HoloLens to pierwsza zaawansowana rzeczywistość rozszerzona urządzenie, które zostało pokazane publicznie. Czy wciąż jest to fantazyjne gadżet czy technologia, która jest bliska realizacji? , który może przesyłać strumieniowo informacje ze swoich kamer do smartfona, zapewniając bogatą i zawsze dostępną informację wizualną. Wielu obserwatorów, w tym ja, oczekuje, że staną się one powszechne w ciągu najbliższych pięciu lat.

Co może zrobić Twój telefon z tymi wszystkimi danymi??

Dużo. Google już zademonstrował za pomocą tabletu Tango, że Google chce umieścić kamerę 3D na smartfonie - oto dlaczego Google chce umieścić kamerę 3D na smartfonie - oto dlaczego Google Project Tango wprowadza czujniki 3D na urządzenia mobilne. Oto, co wiemy do tej pory. kamera głębokościowa może określić położenie przestrzenne obiektów fizycznych z niezwykle wysoką dokładnością. Podobnie dokonano niesamowitych postępów w dziedzinie widzenia maszynowego - takich jak sieć neuronowa Microsoftu, która może identyfikować poszczególne rasy psów, oraz sieć neuronowa Google, która może dokładnie opisywać zawartość zdjęć. Razem te technologie otwierają cały świat aplikacji:

Co to za śruba? Algorytm widzenia maszynowego wie i może zamówić zamiennik na Amazon w ciągu pięciu sekund. Jak nazywała się kobieta, którą spotkałeś wczoraj w barze? Być może zgubiłeś jej kartę, ale twoje okulary złapały jej twarz i możesz ją znaleźć na Facebooku. Masz dziwnego pieprzyk. Czy powinieneś zobaczyć się z lekarzem? Twój telefon może rzucić okiem i powiadomić Cię. Robisz zakupy spożywcze: czego potrzebujesz? Twoje szklanki pamiętają ostatni raz, kiedy patrzyłeś w lodówkę, i wiedzą, czego brakuje. Mogą nawet dać ci wskazówki od przejścia, aby znaleźć poszczególne przedmioty.

Wpływ tej technologii na prywatność jest przerażający, ale tego rodzaju rzeczy również wydają się niezwykle przydatne.

Będzie wiedział, co lubisz

Smak może być trudny do ustalenia. Jest to bardzo osobiste i może być bardzo arbitralne. Spotify i Netflix radzą sobie z tworzeniem rekomendacji w oparciu o wzorce użytkowania (technika, która całkowicie ignoruje treść) - ale istnieją realne ograniczenia tego podejścia.

Przyszłość tkwi w algorytmach, które potrafią zrozumieć sztukę na głębokim poziomie - złożone sieci neuronowe, które mogą nauczyć się wybierać złożone subtelności muzyki i filmów. To daje o wiele bogatsze zrozumienie tego, co ludzie robią, a czego nie lubią w mediach - konkretne zrozumienie ich smaku.

Pierwsze wczesne wskazówki na ten temat zaczynają się pojawiać. Jak Spotify “Odkryj tygodnik” lista odtwarzania, która korzysta z tego rodzaju narzędzi do analizy treści, aby polecać utwory - w tym utwory, których normalnie nie słyszysz, ponieważ są zbyt niejasne, aby dobrze oceniać w oparciu o wzorce użytkowania. Te techniki staną się jeszcze bardziej wydajne w przyszłości, a smartfon jest świetną platformą do wykorzystania tych informacji.

Szukasz czegoś wspólnego z przyjaciółmi? Co zrobić, jeśli aplikacje na telefonie mogą współpracować, gromadzić informacje o swoich upodobaniach i wybierać film lub koncert, który według nich wszystkim się spodoba? A co z witrynami randkowymi, które oceniają Cię na podstawie głębokich cech Twoich upodobań? Co z aplikacjami, które mogą polecać Ci książki, ponieważ je przeczytały?

Możliwości są nieograniczone, a ktoś zarobi na tym dużo pieniędzy.

Będzie gadatliwy

Człowiek: gdzie teraz jesteś?
Maszyna: jestem w szczerym polu.
Człowiek: jaki jest cel umierania?
Maszyna: mieć życie.
Człowiek: jaki jest cel bycia inteligentnym?
Maszyna: aby dowiedzieć się, co to jest.
Człowiek: jaki jest cel emocji?
Maszyna: nie wiem.

Jest to rozmowa z siecią neuronową opracowaną przez Google, która uczy się z dużych baz danych tekstów bez nadzoru człowieka. Ta wersja została wyszkolona na wielu starych skryptach filmowych i nauczyła się przewidywać następne zdanie w każdej napotkanej rozmowie. Jak się okazuje, jeśli trenujesz sztuczną inteligencję w zakresie skryptów filmowych, wszystkie jego konwersacje są super dramatyczny.

Jeśli nie jesteś pod wrażeniem, jest to zrozumiałe. Chatboty istnieją od dłuższego czasu Jak zrobić bota czatu dla swojej witryny lub firmy Jak zrobić bota czatu dla swojej witryny lub firmy Trudność w nawiązywaniu kontaktu z tyloma ludźmi na całym świecie to strefy czasowe. Być może chcesz mieć możliwość interakcji z czytelnikami lub prowadzenia interesów z potencjalnymi klientami, ale w niektórych… .

Ale przyjrzyj się bliżej. System Google jest wyjątkowy na dwa kluczowe sposoby.

Po pierwsze, jest bardzo prosta pod względem architektury: jest to pojedyncza ogromna sieć neuronowa i sama musiała nauczyć się dynamiki ludzkiego języka. Zwykłe chatboty działają przy użyciu tysięcy ręcznie kodowanych reguł reagowania na różne sytuacje. Kiedy recytują odpowiedź, dzieje się tak dlatego, że została ręcznie zakodowana lub zapamiętana na podstawie konkretnego przykładu. Sieć Google jest inna. Nauczył się swojego zachowania w sposób organiczny, starając się zrozumieć głęboką strukturę ludzkiego pisania.

Po drugie, rejestruje zaskakująco subtelną dynamikę, której nie robią inne boty czatu. Może odpowiedzieć na pytania zdrowego rozsądku na temat świata, mimo że nie jest do tego wyraźnie zaprogramowany.

Człowiek: kto jest skywalker ?
Maszyna: on jest bohaterem .
Człowiek: kto jest Bill Clinton ?
Maszyna: on jest miliarderem .
Człowiek: jest błękitny lub czarny ?
Maszyna: niebieski .
Człowiek: czy kot ma ogon? ?
Maszyna: tak .
Człowiek: czy kot ma skrzydło ?
Maszyna: Nie
Człowiek: czy kot może latać ?
Maszyna: Nie .
Człowiek: ile nóg ma kot ?
Maszyna: cztery, tak myślę .

Inna wersja bota czatu, wyszkolona w dziennikach pomocy technicznej, może zaskakująco dobrze wprowadzać prawdziwe wsparcie techniczne. Występują potknięcia (wydaje się, że mają trudności z zapamiętaniem używanego systemu operacyjnego) - ale z pewnością otrzymałem gorsze wsparcie techniczne od rzeczywistych ludzi.

Wszystko to dobrze wskazuje, że zaczynamy dochodzić do punktu, w którym sztuczna inteligencja może być naprawdę konwersacyjna. Sieć powyżej może prowadzić znośną rozmowę, mimo że jej cele szkoleniowe wymagają jedynie przestrzegania powierzchownej struktury dialogu „w przód i w tył”.

Biorąc pod uwagę lepsze dane treningowe i funkcję nagrody, która kładzie nacisk na wymianę informacji, możliwości są nieograniczone. Wyobraź sobie wersję Siri, która może angażować Cię w prawdziwą rozmowę, udzielać odpowiedzi i porad w odpowiedzi na pytania oraz wykonywać zadania bez potrzeby specjalnego programowania. To nie jest daleko.

Będzie dobrze przeczytany

Inna technologia, nad którą Google pracuje, dotyczy czytania ze zrozumieniem. To jest nazwane “Wektory myślowe,” a koncepcja jest zaskakująco prosta. Możesz wyodrębnić “wektory myślowe” z działalności sieci neuronowej, która zawiera informacje, takie jak zdanie lub artykuł. Otrzymujesz nieprzejrzystą informację, która dla nikogo nie znaczy nic oprócz sieci, która ją wygenerowała. Ta informacja w pewnym sensie przechowuje “znaczenie” tekstu, niezależnie od tego, jak został pierwotnie sformułowany.

Ma to pewne przydatne właściwości. Na początek wektory te przypominają się dla zdań o podobnych znaczeniach. Jeśli trawisz dwa zdania w ten sposób, możesz ustalić, czy oznaczają to samo, czy nie. Możesz także nimi manipulować. Za pomocą dwóch sieci neuronowych do generowania “wektory myślowe” z tekstu w różnych językach, a następnie szkoląc trzecią sieć, aby nauczyć się mapować między nimi, możesz stworzyć niezwykle wydajną metodę tłumaczenia maszynowego, która przechwytuje znaczenie tekstu, a nie tylko zawarte w nim słowa.

Innym potencjalnym zastosowaniem tego jest wykorzystanie tej technologii do gromadzenia dużych ilości informacji i trawienia ich w zwartą reprezentację, a następnie generowania podsumowania na podstawie wyników. Może to być niezwykle wydajne w aplikacjach mobilnych.

Wyobraź sobie, że możesz poprosić swój telefon o przeczytanie wszystkiego dostępnego w Google na dany temat. Następnie wróć do Ciebie i zwięźle przedstaw swoje odkrycia w języku naturalnym i odpowiedz na pytania dotyczące wyników. To stanie się naprawdę bardzo, bardzo szybko, i będzie niezwykle przydatne.

Telefon przyszłości

Telefony w przyszłości będą prawdopodobnie wyglądać zupełnie inaczej niż telefony. Mogą być zakrzywione. Mogą być modułowe. Możesz z nimi wchodzić w interakcje za pomocą okularów rzeczywistości rozszerzonej. Jednak najważniejszą różnicą będzie inteligencja. Opisane tutaj funkcje zmienią nasze urządzenia w potężnych nauczycieli i pomocników.

Obecnie trwa gorący wyścig zbrojeń Microsoft vs Google - Kto prowadzi wyścig sztucznej inteligencji? Microsoft vs Google - Kto prowadzi wyścig sztucznej inteligencji? Badacze sztucznej inteligencji robią namacalne postępy, a ludzie znów zaczynają poważnie mówić o sztucznej inteligencji. Dwaj tytani prowadzący wyścig sztucznej inteligencji to Google i Microsoft. w technologii głębokiego uczenia się. Efektem ubocznym jest to, że techniki te rozwijają się niezwykle szybko i będą dostępne na rynku wcześniej, niż mogłoby się wydawać.

Czy ekscytują Cię inteligentniejsze smartfony? Martwisz się o wpływ na prywatność? Daj nam znać w komentarzach!

Kredyty obrazkowe: Ludzki mózg Mopic przez Shutterstock




Jeszcze bez komentarzy

O nowoczesnej technologii, prostej i niedrogiej.
Twój przewodnik w świecie nowoczesnych technologii. Dowiedz się, jak korzystać z technologii i gadżetów, które nas otaczają każdego dnia i dowiedz się, jak odkrywać ciekawe rzeczy w Internecie.