Засегнати са милиони интернет потребители, твърдят ищците
Адвокатската кантора Clarkson заведе колективен иск във федералния съд на Северния окръг на Калифорния срещу OpenAI, разработчика на популярния бот с изкуствен интелект ChatGPT, ише TechNews.bg. Жалбоподателят смята, че разработчикът на чатбота е нарушил правата на милиони интернет потребители, като е използвал техните публично
достъпни данни за обучение на големи езикови модели, които са в основата на AI алгоритмите, отбелязва Вашингтон Пост. Според управляващия партньор на Clarkson – Райън Кларксън, компанията представя
в съда интересите на "реални хора, чиито данни са били откраднати и с тях е злоупотребено, за да се създаде тази много мощна технология”. Става дума за публично достъпни потребителски данни, като
коментари в социалните мрежи, публикации в блогове, статии в Wikipedia и др. Официалните представители на OpenAI засега се въздържат от коментари по заведения съдебен иск.
Делото на Clarkson засяга наболял проблем в областта на генеративните невронни мрежи, като AI ботове и генератори на изображения. Такива инструменти се обучават на огромно количество данни, налични
в интернет. След завършване на обучението, големите езикови модели могат да формират отговори при общуване с човек, да композират стихотворения или истории, да водят сложни разговори и т.н.
Проблемът е, че хората, на чиито данни стъпва обучението на невронните мрежи, не са дали съгласие за използване на тази информация на разработчици като OpenAI.
"Цялата тази информация се използва в мащаб, въпреки че никога не е била предназначена за обучение на големи езикови модели”, казва Кларксън. Той очаква съдът да постави определени граници за това
как могат да се обучават AI алгоритми и как хората могат да бъдат компенсирани за използването на техните данни. Компанията вече има група ищци и активно търси нови клиенти.
Делото на Clarkson срещу OpenAI не е първото, в което разработчиците на AI са обвинени в злоупотреба с данни. През ноември миналата година беше заведено дело срещу OpenAI и Microsoft във връзка с
това, че компаниите са използвали програмния код на платформата GitHub за обучение на AI инструменти.
През февруари т.г. платформата Getty Images съди стартъпа Stability AI, обвинявайки го в незаконно използване на изображения, за да обучи своята генеративна невронна мрежа, която стои зад
иновативната услуга за генериране на изображения.