Strona główna » Ai e-book o sztucznej inteligencji » Reddit podpisał umowę o wartości 60 mln dolarów na dane szkoleniowe

Reddit podpisał umowę o wartości 60 mln dolarów na dane szkoleniowe

by kapdes
reddit

Reddit podpisał roczną umowę o wartości 60 milionów dolarów z firmą zajmującą się sztuczną inteligencją

Aby wykorzystać zawartość platformy do szkolenia modeli sztucznej inteligencji.

Według Bloomberga, Reddit ujawnił to z wyprzedzeniem potencjalnym inwestorom, którzy mają wesprzeć planowane IPO z wyceną co najmniej pięciu miliardów dolarów. Umowa pokazuje, w jaki sposób Reddit może wykorzystać obecne zainteresowanie danymi szkoleniowymi AI.

Inne platformy mediów społecznościowych mogłyby również sprzedawać w ten sposób treści swoich użytkowników i generować dodatkowe przychody. Meta i X wykorzystują swoje dane z mediów społecznościowych do trenowania własnych modeli sztucznej inteligencji.

Wiele osób zakłada, że Reddit odgrywa kluczową rolę w szkoleniu dużych modeli językowych, takich jak GPT-3.5 lub GPT-4 OpenAI, LLaMa firmy Meta lub modele Google.

ebook

Jak Wykorzystać Sztuczną Inteligencję W Życiu Codziennym?

Wynika to z faktu, że wiele postów na Reddicie ma już ocenę ludzką dzięki funkcji głosowania w górę i w dół platformy, co ułatwia wstępne sortowanie. Posty zawierają również dodatkowe linki kontekstowe. Oba te czynniki sprawiają, że dane są cenne dla firm zajmujących się sztuczną inteligencją.

„Korpus danych Reddit jest naprawdę cenny. Ale nie musimy oddawać całej tej wartości niektórym z największych firm na świecie za darmo” – powiedział współzałożyciel Reddit Steve Huffman wiosną 2023 roku.

W tym czasie Reddit ogłosił, że zacznie pobierać opłaty od firm, które chcą uzyskać dostęp do danych użytkowników za pośrednictwem swojego interfejsu API.

Poprzednie modele były szkolone na danych Reddit za darmo. Te rosnące koszty licencji na szkolenie przyszłych modeli sztucznej inteligencji wpływają nie tylko na Reddit, ale także na inne źródła tekstu.

Firmy zajmujące się sztuczną inteligencją coraz częściej współpracują z wydawcami, aby uzyskać dane do trenowania swoich modeli. OpenAI, na przykład, potwierdziło umowę z Axel Springer, która obejmuje udostępnianie wiadomości Springer na ChatGPT. Firma zapowiedziała, że pojawi się więcej umów. Mówi się również, że Apple i Google oferują umowy licencyjne wydawcom.

Meta wyjaśniła w oświadczeniu złożonym w amerykańskim urzędzie ds. praw autorskich, że szkolenie sztucznej inteligencji na czysto licencjonowanych materiałach byłoby zbyt kosztowne na wymaganą skalę. OpenAI powiedział również rządowi Wielkiej Brytanii, że rozwój wiodących modeli sztucznej inteligencji nie jest możliwy bez szkolenia na licencjonowanych materiałach.

Źródło: https://www.bloomberg.com/news/articles/2024-02-16/reddit-is-said-to-sign-ai-content-licensing-deal-ahead-of-ipo

Pozostałe artykuły