badania e booków
Co mają wspólnego e-booki z genomem?
Przez ostatnie cztery lata naukowcy przejrzeli ponad pięć milionów książek i doszli do ciekawego wniosku: są one tym dla nauk humanistycznych, czym badania genomu dla biologii i medycyny. O co im chodzi? Już wyjaśniam.
Asus Lamborghini VX6 – gdzie najtaniej?
W najnowszym numerze tygodnika „Science” naukowcy zaprezentowali wyniki badań oparte na analizie słów zawartych w części książek opublikowanych dotąd w Internecie. Obliczono częstotliwość występowania pewnych słów na przestrzeni wieków, aby zobaczyć, jak wyglądały trendy kulturowe.
Naukowcy wzięli pod uwagę korpus tekstów zgromadzony w zbiorach Uniwersytetu Harwardzkiego, Google Books, Encyclopaedia Britannica i American Heritage Dictionary. W sumie około 5,2 mln książek z 500 mld słów. Około 72 proc. tekstów korpusu jest w języku angielskim, reszta to francuski, hiszpański, niemiecki, chiński, rosyjski i hebrajski.
13 najpiękniejszych słuchawek na świecie
Okazało się, że co roku język angielski wzbogaca się o 8,5 tys. słów. Oznacza to, że pomiędzy rokiem 1950 a 2000 zasób słownictwa zwiększył się o 70 proc. Co ciekawe, wielu z tych słów nie ma w słownikach. 52 proc. angielskiego zasobu słów to rodzaj leksykalnej „ciemnej materii+”.
Z każdym rokiem maleje w korpusie tekstów liczba odniesień do przeszłości. Współcześni celebryci są młodsi i sławniejsi niż ich XIX-wieczni poprzednicy, ale ich sława za to trwa krócej. Celebryci urodzeni w 1950 r. osiągnęli sławę średnio w wieku 29 lat, natomiast urodzeni w 1900 r. – dopiero w wieku 43 lat. Za to innowacje z roku na rok rozprzestrzeniają się szybciej.
Kluczowe dla zrozumienia danej epoki może być nie tylko występowanie pewnych słów, ale też ich przemilczanie, jak w przypadku totalitarnej propagandy. Dla przykładu – żydowski malarz Marc Chagall wymieniany był w korpusie niemieckich tekstów z lat 1936-1944 tylko raz, mimo że w tym czasie dużo częściej pojawia się w publikacjach angielskojęzycznych.
Podobnie było w tym czasie z nazwiskiem Lwa Trockiego w Rosji, a obecnie w Chinach z nazwą Tiananmen. Z uczonych najpopularniejszy w naszej kulturze pod względem częstotliwości występowania w tekstach jest Freud. Przebija Galileusza, Darwina i Einsteina.
Pięć pluszaków z zaburzeniami psychicznymi
Czteroletni projekt prowadzony był przez naukowców z Harvard University przy udziale technologicznym i finansowym Google’a. Google ma zamiar wypuścić nową aplikację, która w sposób nieskomplikowany pomoże użytkownikowi zrobić to samo, co uczynili naukowcy: po wpisaniu słowa lub frazy będzie można śledzić, jak zmieniała się częstotliwość ich użycia przez ostatnie stulecia.
To tylko niektóre z uzyskanych wyników. Naukowcy postulują utworzenie nowej dziedziny badań – kulturonomiki, na wzór genomiki, w której „kodem genetycznym” będą teksty stworzone przez ludzkość.



![Niezwykłe konstrukcje [cz. 3.]. Kalinin K-7 – radziecka latająca forteca](http://s1.blomedia.pl/gadzetomania.pl/t/135x84/2012/05/kalinin-k7-282369.jpg)




![Nissan X-Trail 2,0 dCi LE Platinum vs. Suzuki Grand Vitara 2,4 VVT Premium [wideotest autokult.pl]](http://s2.blomedia.pl/autokult.pl/t/135x84/2012/05/DSC04873-219912.jpg)





