Strona główna » Ai e-book o sztucznej inteligencji » xAI Elona Muska nadal pozostaje w tyle

xAI Elona Muska nadal pozostaje w tyle

by kapdes
xai

Startup xAI należący do Elona Muska ogłosił wydanie swojego najnowszego modelu, Grok-1.5.

Nowy model będzie wkrótce dostępny dla obecnych użytkowników i wczesnych testerów na platformie X. Nowe funkcje obejmują ulepszone możliwości rozumowania i długość kontekstu 128 000 tokenów, według xAI.

Długość kontekstu odnosi się do liczby słów lub stron, które model może przetworzyć za jednym razem. 128 000 tokenów odpowiada około 100 000 słów lub 300 stronom książki. Oznacza to, że Grok 1.5 może obsługiwać bardziej złożone podpowiedzi z większą liczbą przykładów.
W testach Grok 1.5 uzyskał 50,6% w benchmarku MATH i 90% w benchmarku GSM8K. Oba benchmarki obejmują szeroki zakres problemów matematycznych, od szkoły podstawowej do poziomu konkursowego w szkole średniej. W przypadku generowania kodu i rozwiązywania problemów, Grok-1.5 osiągnął wynik 74,1% w benchmarku HumanEval.

Jak Wykorzystać Sztuczną Inteligencję W Życiu Codziennym?

W teście porównawczym rozumienia języka MMLU, Grok 1.5 uzyskał wynik około 81%.

Jest to duży skok w porównaniu z 73% w Grok-1, ale daleko za obecnymi liderami GPT-4 i Claude 3 Opus, z których każdy uzyskał około 86%. OpenAI może mieć kolejny model w przygotowaniu na lato tego roku.

W teście „igły w stogu siana”, który sprawdza, czy model sztucznej inteligencji może niezawodnie znaleźć określone informacje w oknie kontekstowym, Grok 1.5 osiągnął doskonały wynik. Test ten nie jest jednak zbyt miarodajny, ponieważ wykorzystuje model językowy jak kosztowną funkcję wyszukiwania.
Bardziej istotne, ale znacznie trudniejsze do przetestowania, byłyby takie rzeczy, jak liczba błędów lub pominięć podczas podsumowywania bardzo dużych dokumentów. Inne firmy zajmujące się sztuczną inteligencją, takie jak Google czy Anthropic, również wykorzystują ten ostatecznie mylący punkt odniesienia, aby pochwalić się wydajnością okna kontekstowego swojego modelu.

xAI pracuje nad zwiększeniem wydajności szkolenia AI

xAI podkreśla swój nacisk na innowacje, szczególnie w ramach szkolenia. Grok-1.5 opiera się na wyspecjalizowanej rozproszonej platformie szkoleniowej zbudowanej na JAX, Rust i Kubernetes. Ten stos szkoleniowy umożliwia zespołowi prototypowanie pomysłów i szkolenie nowych architektur na dużą skalę przy minimalnym wysiłku.
Jednym z największych wyzwań w szkoleniu dużych modeli językowych (LLM) na dużych klastrach obliczeniowych jest optymalizacja niezawodności i dostępności zadania szkoleniowego.

Pozostałe artykuły