ChatGPT wprowadza funkcje głosowe, rzucając wyzwanie Siri i Alexie

OpenAI, pionier w dziedzinie sztucznej inteligencji, zaprezentował nową funkcję dla swojej aplikacji ChatGPT, umożliwiając chatbotowi werbalne odpowiadanie na zapytania użytkowników.

Ulepszenie to prawdopodobnie zmieni interakcje użytkowników z chatbotem, czyniąc je bardziej wciągającymi i przypominającymi ludzkie.

Aktualizacja, której wdrożenie zaplanowano na najbliższe tygodnie, pozwoli użytkownikom wybierać spośród pięciu różnych głosów, w tym "Juniper", "Breeze" i "Ember".

Gdy użytkownik wybierze głos, ChatGPT będzie dźwiękowo prezentować wygenerowany przez siebie tekst, na przykład opowiadając stworzoną przez sztuczną inteligencję bajkę na dobranoc.

Ta funkcja dźwiękowa będzie dostępna dla subskrybentów wspieranej przez Microsoft Corp (NASDAQ: MSFT) usługi OpenAI ChatGPT Plus, w cenie 20 USD miesięcznie, oraz dla klientów korporacyjnych, jak informuje Bloomberg.

Od czasu majowej premiery, aplikacja ChatGPT zawiera funkcję zamiany głosu na tekst, umożliwiając użytkownikom werbalną komunikację z botem. Wprowadzenie funkcji odpowiedzi audio ma na celu symulację bardziej autentycznej interakcji międzyludzkiej.

OpenAI przewiduje, że ta aktualizacja będzie promować korzystanie z aplikacji mobilnych podczas dojazdów do pracy, pozycjonując ChatGPT jako rywala dla uznanych platform osobistych asystentów, takich jak Asystent Google (NASDAQ: GOOGL), Siri firmy Apple Inc (NASDAQ: AAPL) i Alexa firmy Amazon.com Inc (NASDAQ: AMZN).

Użytkownicy mogą poprosić chatbota o omówienie historii Disneylandu w drodze do atrakcji lub o przepis na koktajl podczas pobytu w kuchni.

Wstępne testy wykazały, że narzędzie sprawnie opowiada historie. ChatGPT potrafi tworzyć teksty piosenek, jednak ich nie wykonuje.

Głosy, opracowane we współpracy z aktorami głosowymi, wykazują jakość podobną do ludzkiej, choć z nieco robotycznym zabarwieniem.

OpenAI zasugerowało również przyszłe ulepszenia dla użytkowników premium i korporacyjnych.

Wkrótce będą oni mogli przesyłać obrazy wraz z powiązanymi pytaniami do GPT-4, jednego z modeli sztucznej inteligencji zasilających ChatGPT, począwszy od szukania sugestii dotyczących stroju na podstawie zdjęcia różowych okularów przeciwsłonecznych po prośbę o pomoc w rozwiązaniu zadania matematycznego przedstawionego na obrazie.

Funkcja ta, zapowiedziana wcześniej podczas prezentacji GPT-4, będzie dostępna za pośrednictwem aplikacji ChatGPT i jej oficjalnej strony internetowej.

Kurs akcji: cena akcji MSFT wzrosła w poniedziałek o 0,14% do 317,46 USD.