Ett verkligt experiment belyser framtiden för böcker och läsning

Föreställ dig oändliga läsningar av de böcker vi redan har. Kredit:Unsplash, CC BY

Böcker förändras alltid. Boken vi håller i idag har anlänt genom ett antal material (lera, papyrus, pergament, papper, pixlar) och formulär (surfplatta, skrolla, kodex, tända).

Boken kan vara ett verktyg för kommunikation, läsning, underhållning, eller lärande; ett objekt och en statussymbol.

Det senaste skiftet, från tryckta medier till digital teknik, började runt mitten av 1900-talet. Det kulminerade i två av de mest ambitiösa projekten i bokens historia (åtminstone om vi tror på företagshypen):massdigitaliseringen av böcker av Google och massdistributionen av elektroniska böcker av Amazon.

Bokhandelns överlevnad och bibliotekens blomstrande (i verkliga livet) trotsar förutsägelser om att "bokens slut" är nära. Men även den mest militanta bibliofilen kommer att erkänna hur digital teknik har ifrågasatt "idén" med boken, ännu en gång.

Att utforska potentialen för samarbete mellan människa och maskin inom läsning och skrivning, vi byggde en maskin som gör poesi från sidorna i vilken tryckt bok som helst. I sista hand, detta projekt försöker föreställa sig framtiden för själva boken.

En maskin för att läsa böcker

Vår specialkodade läsmaskin läser och tolkar riktiga boksidor, att skapa en ny "upplyst" diktbok.

Läsmaskinen använder datorseende och optisk teckenigenkänning för att identifiera texten på en öppen bok placerad under dess dubbla kameror. Den använder sedan Machine Learning och Natural Language Processing-teknik för att "läsa" texten för att få mening, för att välja en kort poetisk kombination av ord på sidan som den sparar genom att digitalt radera alla andra ord på sidan.

Beväpnad med denna genererade vers, läsmaskinen söker på internet efter en bild - ofta en doodle eller meme, som någon har delat och som har lagrats i Google Bilder — för att illustrera dikten.

När varje sida i boken har lästs, tolkad, och illustrerad, systemet publicerar resultaten med hjälp av en onlineutskriftstjänst. Den resulterande volymen läggs sedan till ett växande arkiv som vi kallar The Library of Nonhuman Books.

Från det ögonblick som vår maskin har läst klart tills boken levereras, vårt automatiserade konstsystem fortsätter algoritmiskt - från att tolka och belysa dikterna, att paginera, omslagsdesign och slutligen lägga till slutmaterialet. Allt detta görs utan mänsklig inblandning. Algoritmen kan generera ett till synes oändligt antal läsningar av vilken bok som helst.

Poesin

Följande dikter producerades av läsmaskinen från populära texter:

"innerst inne försöker män där
han är stor naken hon är jämn
medan du står inför vad som helst."

från E.L. James "Fifty Shades of Grey"

"hur festar popcorn
jukebox badrum deprimerad
rycka på axlarna, ja? Allt."

från Bret Easton Ellis "The Rules of Attraction"

"Åh och hennes sovrum
badrumsborstning skickar den
strumpeband också ansikte helvetet."

från Truman Capote's <"a href="https://www.goodreads.com/book/show/251688.Breakfast_at_Tiffany_s"> Frukost på Tiffany's"

Min algoritm, min musa

Så vad har allt detta att göra med massdigitaliseringen av böcker?

Inför ett växande motstånd från författare och utgivare som är intresserade av Googles hantering av upphovsrätt, infoglomeratet svängde bort från sitt primära mål att tillhandahålla en gratis samling böcker (ett slags modernt bibliotek i Alexandria) och mot ett mer blygsamt indexsystem som används för att söka i böckerna som Google skannat. Google skulle nu bara visa korta "snuttar" av ord markerade på den ursprungliga sidan.

Bakom kulisserna, Google hade identifierat en annan användning för texterna. Miljontals skannade böcker skulle kunna användas inom ett område som kallas Natural Language Processing. NLP tillåter datorer att kommunicera med människor med vardagsspråk snarare än kod. Böckerna som ursprungligen skannades för människor gjordes tillgängliga för maskiner för inlärning, och senare imitera, mänskligt språk.

Algoritmiska processer som NLP och Machine Learning har löftet (eller hotet) att skjuta upp mycket av vår vardagliga läsning till maskiner. Historien har visat att när maskiner vet hur man gör något, vi överlåter dem i allmänhet åt det. I vilken utsträckning vi gör detta beror på hur mycket vi värdesätter läsning.

Om vi fortsätter att skjuta upp vår läsning (och skrivning) till maskiner, vi kanske gör litteratur med våra artificiellt intelligenta motsvarigheter. Vad blir poesin, med en algoritm som vår musa?

Vi har redan ledtrådar till detta:från den nästan obligatoriska användningen av emojis eller japanska Kaomoji (顔文字) som visuell stenografi för den känslomässiga avsikten med vår digitala kommunikation, till de skiktade betydelserna av internetmemes, till automatisk generering av "falska nyheter"-berättelser. Det är de bild-ord-hybrider vi hittar i post-litterate sociala medier.

För att gömma ett löv

Ta boken, min vän, och läs dina ögon ut, du kommer aldrig att hitta det jag hittar där.

Ralph Waldo Emersons andliga lagar

Emersons utmaning lyfter fram den subjektivitet vi tillför läsning. When we started working on the reading-machine we focused on discovering patterns of words within larger bodies of texts that have always been there, but have remained "hidden in plain sight." Every attempt by the reading-machine generated new poems, all of them made from words that remained in their original positions on the pages of books.

The notion of a single book consisting of infinite readings is not new. We originally conceived our reading-machine as a way of making a mythical Book of Sand, described by Jorge Luis Borges in his 1975 parable.

Borges' story is about the narrator's encounter with an endless book which continuously recombines its words and images. Many have compared this impossible book to the internet of today. Our reading-machine, with the turn of each page of any physical book, calculates combinations of words on that page which, until that moment, have been seen, but not consciously perceived by the reader.

The title of our early version of the work was To Hide a Leaf. It was generated by chance when a prototype of the reading-machine was presented with a page from a book of Borges' stories. The complete sentence from which the words were taken is:

"Somewhere I recalled reading that the best place to hide a leaf is in a forest."

The latent verse our machine attempts to reveal in books also hides in plain sight, like a leaf in a forest; and the idea is also a play on a page being generally referred to as a "leaf of a book."

Like the Book of Sand, perhaps all books can be seen as combinatorial machines. We believed we could write an algorithm that could unlock new meanings in existing books, using only the text within that book as the key.

Philosopher Boris Groys described the result of the mass-digitization of the book as Words Without Grammar, suggesting clouds of disconnected words.

Our reading-machine, and the Library of Nonhuman Books it is generating, is an attempt to imagine the book to come after these clouds of "words without grammar." We have found the results are sometimes comical, often nonsensical, occasionally infuriating and, every now and then, even poetic.

Den här artikeln är återpublicerad från The Conversation under en Creative Commons-licens. Läs originalartikeln.

Studie:Oroliga förskolebarn har sämre relationer med lärare

Varför filosofi är en idealisk resesällskap för äventyrliga sinnen

Andra

Insikter om den enorma inverkan säsonger har i jordbruksekonomier

Slösar du på dina besparingar? Kognitiv bias kan vara skyldig

Must Farms korta liv

Vetenskap

Introduktion till Febot

En mjuk robotinsekt som överlever att bli plattad av en flugsvepare

Den stora lågkonjunkturen plågar fortfarande arbetare med lägre livstidslöner