Program na hit

Komputery potrafią już identyfikować ludzi na podstawie wytworów ich pracy intelektualnej, np. charakterystycznych cech stylu pisarstwa czy malarstwa. Co więcej, są dziś w stanie przewidzieć, czy skomponowany właśnie utwór muzyczny ma szanse stać się światowym przebojem.

8 listopada 2006, 10:40

Pierwsze próby określania unikatowych cech stylu pisarskiego sięgają jeszcze XIX w. Polegały one na pracochłonnym obliczaniu częstotliwości występowania w tekście wszystkich par liter (ab, ac, ba, bc... itd.), które miały stanowić wzorzec stylu pisarskiego autora. Owe wzorce obliczano na podstawie dzieł konkretnych twórców. Następnie brano utwory o wątpliwym autorstwie i wykonywano analogiczne obliczenia. Kolejnym krokiem było porównanie wyliczonych wzorców obu tekstów. Gdy różnica była dostatecznie mała, przyjmowano, że autorem analizowanych materiałów jest ta sama osoba.

Inne sposoby znajdowania „DNA stylu pisarskiego” zostały opracowane w drugiej dekadzie ubiegłego wieku przez dwóch Rosjan: Nikołaja Morozowa oraz Andrieja Markowa. Dzięki stworzonej przez nich metodzie statystycznej analizy języka udało się potwierdzić autorstwo jednego z największych dzieł romantyzmu – „Eugeniusza Oniegina” Aleksandra Puszkina.

Przełom w stosowaniu żmudnych metod analizy statystycznej tekstów przyniosły komputery. Dzięki ich ogromnej mocy obliczeniowej i szybkości działania zaczęto stosować jeszcze bardziej wyrafinowane metody – m.in. oceniać gramatykę, długość zdań i wyrazów oraz częstotliwość występowania charakterystycznych słów i zwrotów. Użyto je z powodzeniem do porównań twórczości dwóch dziewiętnastowiecznych pisarzy – Charlesa Dickensa i Lewisa Carrolla. Identyfikując dzieła tych autorów komputer nie pomylił się ani razu!

Komputerowa analiza tekstu to nie tylko szansa na wskazanie jego autora, to także wiarygodne narzędzie do oceny jakości, np. czytelności i zrozumiałości. Maszyny robią to badając cztery najistotniejsze czynniki: średnią liczbę wyrazów w zdaniu, liczbę zdań w tekście, średnią długość zdania oraz liczbę słów znajdujących się wśród tysiąca najbardziej powszechnych w danym języku. Działający na tej zasadzie program komputerowy Oc_Fo wykorzystano w Polsce w warszawskiej Akademii Pedagogiki Specjalnej do oceny zrozumiałości tekstów w materiałach dydaktycznych. Okazało się, że średnia ocen klarowności tekstów wystawionych przez ludzi i komputer była identyczna do drugiego miejsca po przecinku! Co więcej, autorzy tekstów nanieśli nawet sugerowane przez maszynę poprawki.

Narzędzia komputerowej identyfikacji autorstwa stosuje się także do dzieł malarskich. Takie prace prowadzono m.in. w holenderskim University of Maastricht, analizując postacie z obrazów Vincenta van Gogha – komputer badał m.in. kontrast kolorów, strukturę nakładania farb oraz ślady pędzla. Dzięki temu potrafił nie tylko zweryfikować autentyczność dzieła, ale także uzasadnić swoją decyzję. Podobny program opracował kilka lat temu zespół z University of Bremen’s Center for Computing Technologies, który nauczył komputer rozpoznawać dzieła Eugene’a Delacroix. Sukcesy komputerowej analizy tekstów i malowideł zachęciły badaczy do prób powierzenia maszynom samodzielnej twórczości. W ten sposób fantazje George’a Orwella, który w powieści „Rok 1984” opisał maszynę produkującą muzykę dla mas, powoli się ziszczają. Prace nad komputerową muzyczną inteligencją są bardzo zaawansowane, o czym świadczy komercyjne wykorzystanie ich do poszukiwania potencjalnych przebojów.

Stosowane do tego celu programy analizują ok. 30 parametrów: m.in. barwę dźwięku, akordy czy zakres częstotliwości. Firma Platinium Blue w ten właśnie sposób przebadała 3 mln utworów, sprawdzając także ich popularność na różnych rynkach świata. Tę pokaźną bazę danych z powodzeniem wykorzystuje program Music Science. Efektem jego pracy było wskazanie pewnych podobieństw między dziełami Beethovena i przebojami zespołu U2!

Tego typu programy spowodowały ogromny wzrost popularności komputerowych usług, polegających na ocenianiu, czy nowy utwór będzie hitem, czy wręcz sugerowaniu zmian, jakie powinny być dokonane przez kompozytora, by zwiększyć atrakcyjność melodii. W tej dziedzinie przodują takie programy jak wspomniany Music Science oraz Hit Song Science. Roczna opłata za tego rodzaju ekspertyzy, świadczone m.in. przez Platinium Blue oraz Polyphonic HMI, wynosi obecnie ok. 100 tys. dol. A że nie są to pieniądze wyrzucone w błoto, świadczy fakt, że komputery przepowiedziały sukcesy hitów muzyki popularnej: „Candy Shop” (John Feat 50Cent), „Be the Girl” (Aslyn), „Unwritten” (Natasha Bedingfield), „She says” (A.I.), „You’re Beautiful” (James Blunt).

Programy do typowania przebojów stosują już tacy giganci przemysłu muzycznego jak: Capitol Records, Universal Music Group, EMI i Casablanca Records, a nawet Disney, dobierający komputerowo muzykę do swoich filmów. Automatyczna analiza dzieł muzycznych ma przed sobą również wiele innych zastosowań. Rozważa się m.in. komputerowe wspomaganie pracy prawników w ocenie, czy dana kompozycja nie stanowi plagiatu.

Poczyniono też pierwsze kroki w wykorzystaniu twórczych możliwości maszyn – komputery potrafią tworzyć prozę. Przykładem tego jest program Brutus.1, opracowany przez Selmera Bringsjorda, naukowca z Rensselaer Polytechnic Institute, i Davida A. Ferruci z IBM. Brutus.1 stworzył m.in. całkiem zgrabne opowiadanie, zaczynające się od słów: „Dave Striver lubił uniwersytet – jego porośniętą bluszczem wieżę zegarową z mocnej starej cegły, jego zalaną promieniami słonecznymi zieleń i pełną entuzjazmu młodzież...”. Nie jest więc wykluczone, że komputery wkroczą niedługo na listy książkowych bestsellerów.

Włodzimierz Gogołek

Autor jest profesorem UW, pracuje w Instytucie Dziennikarstwa, specjalizuje się m.in. w zastosowaniu technologii informacyjnych w dziennikarstwie i dydaktyce.