Pewien lingwista zauważył, że islandzkie książki kucharskie sprzedawane na Amazonie są prawdopodobnie tłumaczone lub generowane od zera przez sztuczną inteligencję. Dziwi się, że ich oferta jest tak bogata.
Na stronie Amazona reklamowane są islandzkie „książki o robakach” (isl. maðkabók) różnych rodzajów. Nie dotyczą one jednak robaków, lecz gotowania. Bjarki Ármannsson, doktorant językoznawstwa na Uniwersytecie Islandzkim, zwrócił na nie uwagę w swoim wpisie na blogu Bjarkamál. Uważa on, że niefortunne i niezrozumiałe tytuły są dziełem sztucznej inteligencji.
Wśród oferowanych tytułów znajduje się np. „Książka o robakach dla zakochanych smakoszy”, „Niesamowita maleńka książka o robakach”, „Książka o robakach w kryzysie bekonowym” czy „Prawdziwa książka o robakach i chaffles”.
Wyszukanie na Amazonie hasła „książka kucharska” (isl. matreiðslubók) daje więcej wyników, ale nie są one lepsze pod względem językowym. Przykładowo, można znaleźć „Książkę kucharską dla miłośników piwa” oraz „Włoską książkę kucharską: smak, flavour, historyczne kroki”.
Autorzy książek na pierwszy rzut oka wydają się Islandczykami, ale po dokładniejszym przyjrzeniu się okazuje się, że Njála Kristjánsdóttir, Kaðlín Ólafsdóttir i Ástríður Málvina Jónsdóttir to najprawdopodobniej halucynacje AI.
Bjarki twierdzi, że dowiedział się o istnieniu tych książek od przyjaciela ponad rok temu. Zaczął wtedy badać ich ofertę w serwisie Amazon. Jest niemal pewien, że większość, jeśli nie wszystkie, są całkowicie wygenerowane przez sztuczną inteligencję i nie stanowią tłumaczeń prawdziwych książek.
Przyznaje jednak, że trudno powiedzieć, skąd sztuczna inteligencja wzięła słowo „maðkabók” (książka o robakach). Współczesne modele językowe są ogólnie lepsze niż starsze pogramy do tłumaczenia, ale nie są wolne od błędów – po prostu popełniają błędy są innego rodzaju.
„Omawiałem to zagadnienie w pracy z ludźmi, spośród których wielu zajmuje się przetwarzaniem języka i modelami językowymi. Doszliśmy do wniosku, że raczej nie istnieje jedna konkretna odpowiedź” – stwiedził Bjarki.
Wyjaśnił, że duże modele językowe pracują na podstawie jednostek tekstu zwanych tokenami, które są często mniejsze niż słowa – czasem to zaledwie jedna lub dwie litery. W programach takich jak ChatGPT model generuje poszczególne fragmenty słów, a każdy kolejny token jest wybierany na podstawie prawdopodobieństwa w kontekście już wygenerowanego tekstu. To może tłumaczyć, jak powstało słowo „maðkabók”.
Nie jest nowością, że książki pisane przez AI są sprzedawane na Amazonie, a firma próbowała do pewnego stopnia ograniczyć tę praktykę. Wprowadzono m.in. zasadę, że należy wyraźnie zaznaczać, że dane dzieło jest stworzone przez AI, oraz że można publikować „tylko” trzy takie książki dziennie.
Od dawna trwa dyskusja, czy firmy zajmujące się sztuczną inteligencją powinny lepiej oznaczać powstające treści, aby zawsze było wiadomo, czy zostały one wygenerowane. Bjarki uważa jednak, że egzekwowanie takich przepisów byłoby raczej trudne.
Na szczęście na razie łatwo jest wychwycić takie „bełkoty” w języku islandzkim. Może to być trudniejsze w językach takich jak angielski, w których AI radzi sobie lepiej.
Mówi, że choć książki te mogą wydawać się zabawne, to świadczą o niepokojącym trendzie. Ważne jest, aby ludzie byli świadomi istnienia generowanych treści, ponieważ informacje pochodzące od AI nie zawsze są wiarygodne. W przypadku wygenerowanych książek kucharskich w najlepszym wypadku można skończyć z niesmacznym posiłkiem, a w najgorszym – poważnie się rozchorować.




