Meta открадна книгите ми с благословията на Марк Зукърбърг
Отношението ми към LibGen – или Library Genesis е сложно. По същество това е дигитален склад, с грижливо подредена и открадната интелектуална собственост – пиратски книги, научни статии и различни произведения, които “висят” на виртуални лавици без позволението на своите автори. И както много писатели, така и аз, тихо стискам зъби и се примирявам. Сега обаче чашата преля. Meta на Марк Зукърбърг умишлено и експлицитно е разрешила на LibGen да извършва набези в Anna’s Archive – друго огромно по размер убежище на дигитални пирати. Целта – да обучи най-новия си модел с изкуствен интелект – Llama 3.

Обирът
Съдебни документи, появили се съвсем наскоро от разследване на Алекс Райзнер от The Atlantic, разкриват грозното лице на така наречената “иновация” на Meta. По същество – висшето ръководство на Meta признава, че книгите всъщност са много по-важен ресурс от уеб данните и спешно се нуждае от висококачествено съдържание за обогатяване на най-новия си голям езиков модел (LLM). И така, за да запълнят тази празнина, служителите на Meta се обръщат към LibGen – пиратска библиотека с над 7.5 млн. откраднати книги и 81 млн. откраднати научни статии. Същото се случва и с Anna’s Archive. Зелената светлина за тази безскрупулна кражба идва не от кого да е, а от самия Марк Зукърбърг. Да, правилно прочетохте – основателят на Facebook лично е одобрил пиратстване.
Съдбата на автора
Действията на Meta не са просто повод за раздразнение у авторите. Случващото се по същество е криза на морала и заслужава вниманието на всеки един човек, най-вече на Националния координационен център за правата върху интелектуалната собственост към правителството на САЩ.
Писателите вече печелят много по-малко пари за книгите си. За повечето от тях, включително и за мен, финансовото възнаграждение за написването на книга е в най-добрия случай скромно. Тази сума покрива няколко вноски по ипотека или при по-голям късмет – малко повече от това. И това при все че много от писателите инвестират години в проучване, писане и преработка на своя труд и месеци в рекламни ангажименти. Въпросът никога не е за бърза печалба и дори не опира до пари. Става дума за идеите, опитът и приноса към обществото. За един автор писането е смисъл.
Закон за достъпната книга
Решението на Марк Зукърбърг да краде интелектуална собственост на практика обезсмисля законопроекта за достъпната книга (Affordable Book Act). Въпросът отива много по-отвъд от въпроса с използването на книги без позволение, в нарушение на авторското право. Meta – със своите 164.5 млрд. долара приходи през 2024 г. и почти 62.4 млрд. долара печалба – по принцип би могла много лесно да договори споразумения с издатели и автори и всичко щеше да се случи съвсем законно. Компанията дори можеше да се превърне в лидер в обучението на големи езикови модели и да създаде лицензионни споразумения, които да зачитат правата на автора. Тук обаче липсва каквато и да е етика и претенции за законност.
Умишлено пренебрегване
Както посочва в разследването си за The Atlantic Райзнер, когато инженерите на Meta осъзнали, че се нуждаят от висококачествено съдържание, за да направят Llama 3 конкурентноспособна, екипът не се поколебал да открадне интелектуална собственост – решението било взето за секунди. Напълно логично – защо да се плаща честно на авторите и издателите, когато инженерите на Meta могат да използват интелектуалната им собственост безплатно?
Реших да проверя удобния инструмент на Алекс Райзнер, който разкрива дали нечии книги са станали част от грабежа на LibGen. Резултатът – и петте ми книги са били откраднато и включени в набора от данни на Meta. Същото може да се каже и за Anna’s Archive.
В съдебната зала компанията на Марк Зукърбърг съвсем удобно се крие зад “честната употреба”. Аргументът е, че тъй като Llama 3 уж трансформира тези откраднати текстове в нови продукти, този колосален акт на кражба става оправдан. Аргументите за честна употреба обаче са предназначени за образование, коментари и критика, а не за корпоративна експлоатация с цел търговска печалба в спиращи дъха мащаби – Meta се нарежда сред 10-те най-ценни компании в света, като към момента на написване на тази статия пазарната капитализация на Meta е около 1.56 трилиона долара.
Следващите стъпки
Някои автори вече са подали голям колективен иск срещу Meta за нарушаване на авторските права и нелоялна конкуренция. Изходът от този съдебен спор може да определи начина, по който компаниите могат да захранват с данни своите езикови модели в бъдеще. Тези бизнеси ще продължат да са мишена на проверки за практиките си при обучението на моделите с изкуствен интелект, тъй като неудържимият глад за данни на индустрията често засенчва етичните съображения.
Случаят с Meta всъщност е показателен за повсеместното безразсъдство в цялата екосистема на ИИ. И макар че компанията на Зукърбърг в момента е главен герой в историята, други бизнеси (някои от които все още непознати) почти сигурно имат същите тези грехове. Има спешна нужда от прозрачност и строги етични насоки за обучението на големите езикови модели. Фирмите трябва да развиват устойчиви, законни партньорства със създатели на съдържание, автори, издатели. Технологичните компании трябва да бъдат заставени да зачитат авторските права, интелектуалната собственост и простото човешко достойнство, което стои зад всяко творческо усилие. Иновациите не могат да оправдават експлоатацията. Начинът, по който се отнасяме към творците днес, определя бъдещето на нашето знание, изкуство и идеи. Бъдещето не трябва да се гради върху откраднати идеи.
Автор: Дан Понтефракт – награждаван писател с над две десетилетия опит в подобряването на организационното представяне и култура.