Monthly Archives: Listopad 2013

Musím něco, jsem jedi, mistře Anakine!

starwarsDalší digital humanities s eRkem naprosto jasně věští katastrofu, tím spíš po minulém debaklu s wordcloudy, protože se mi pořád ještě nedaří úplně bez problému generovat cloud svého facebooku, natož cloud čehokoliv jiného.  Tentokrát mě ovšem nezrazuje ani internet, ani počítač, nelze se tedy vymlouvat na nic jiného než na vlastní neschopnost. Inu s chutí do toho.

1

Nejdřív si text mining zkoušíme na Havlových a Klausových projevech,  je asi vhodné zmínit, že pomalou učící křivku eRka se mi stále nepodařilo překousnout a většinu času jen tak matně tuším, co že to vlastně po tom programu chci. Nicméně daří se, krom posledního kroku, jako na potvoru se zase nedaří dostat z eRka wordcloud. Na zkoušku dávám dohromady kompletního Pána prstenů a zkouším si text mining na něčem příjemnějším, než jsou politické projevy. Přes lítý boj s diakritikou se nakonec daří a slavný dlouho očekávaný wordcloud je na světě. Z cloudu jsem tak nadšená, že si zapomínám nechat spočítat nejčastější shluky slov…

frekvencelotrPřes voyant-tools se dá k podobným výsledkům dostat podstatně snáz a rychleji (pokud ovšem máte připravené seznamy českých stop-words, což jsem neměla, takže jsem si je musela nakonec napsat sama). Obzvlášť milé jsou grafy frekvence výskytu určitých slov v importovaném dokumentu, k LOTRovi vypadají frekvence výskytu postav asi nějak takhle, vlevo svislá osa četnost výskytu a spodní vodorovná osa vyznačuje tři jednotlivé knihy trilogie – průsečík pak četnost výskytu jména dané postavy v konkrétní knize.

sw2gram

Začíná mě to bavit, takže odněkud z hlubin disku vyhrabávám titulky ke Star Wars, nechávám eRko vyhodit nejčastější shluky slov a samozřejmě taky wordcloud. Ten může posloužit jako podklad pro další StarWarsMaraton, až se budou vymýšlet slova pro „společenské“ hry. Trochu zklamáním je fakt, že „Ať vás provází síla“ je ve všech šesti dílech jen čtyřikrát.

hg5ngramPodobně zkouším analyzovat i Hunger Games, když je teď ta dvojka v kinech (mimochodem od prvního dílu je to obrovský rozdíl, a pozitivní!). Shluky slov typu „I don’t know“, „but I don’t know“, „I don’t know how“, „I don’t know why“ mi vnukají nápad tímhle pro jistotu projíždět každou svojí budoucí práci a likvidovat tak slovní parazity. Minimálně autorům, kteří jsou schopní do jedné knihy nacpat osmnáctkrát „I don’t know what“ by zrovna tahle funkce eRka mohla být celkem ku prospěchu.

hungergamescloudhungergamesfrekvencePřes voyant-tools ještě pro Hunger Games zkouším wordcloud a taky jak často se která postava v knize vyskytuje. Svislá osa opět značí četnost výskytu jména postavy v textu (vybrala jsem jen ty, které se vyskytují nejčastěji), na vodorovné ose jsou vyznačené jednotlivé kapitoly a průsečíky pak udávají četnost výskytu jména v dané kapitole. 

Edit: Nakonec ze zvědavosti ještě třetí díl Hunger Games, pro porovnání jak se změní výskyt postav. 
hgcloud3

hg3freq

Katniss by sice logicky jako hlavní postava, která příběh vypráví, měla být v grafu nejvýš, protože se jí v celé knize ani na minutu nezbavíme, takže v tomhle graf trochu zkresluje. A pro slečny, které si stěžovaly, že někteří pánové neměli v druhém dílu dost prostoru – nebojte, ve trojce budou víc – viz. wordcloud pro třetí díl.

bakalarkafreqČistě ze zvědavosti (a značně inspirována více než šedesáti „i don’t know“ v jedné knize) vykutávám ze starých školních složek svojí bakalářku a s tichým přáním, ať to není o moc horší než Catching fire si nechávám vygenerovat ještě wordcloud a četnost výskytu slov ve svojí bakalářce.  Na grafu je hezky vidět jak se v určitých kapitolách drží hlavní pojmy hezky pohromadě, což byla hlavně teoretická část, v úvodu jsem se evidentně hodně věnovala médiím a praktická část je rozpadlá v nejrůznějších tématech – podle konkrétní části výzkumu.bakalrka

A příště zase něco o televizních zprávách.

Heslo: Přežít!

V pátek přežít filmový maraton se svými studenty, v sobotu a v noci na neděli přežít #SNM Star Wars maraton, v neděli vytasit pravítko, sadu zvýrazňovačů a s chutí do práce! Díky úkolu na Srovnávací mediální studia si sice celý týden můžu připadat hrozně cool, že čtu papírový noviny (hipster!), ale když mám po celém pokoji po podlaze rozložené pražské deníky, lezu tu po čtyřech s pravítkem a zuřivě přeměřuju reklamy, počítám četku a vypisuju si zahraniční zprávy, připadám si spíš poněkud hloupě. Tím spíš, že každý, kdo se náhodou vyskytne poblíž, si ťuká na čelo a kouká na mě značně nechápavě.

tabulka

 Na pondělní hodině se pak utvrdím v tom, že Pražský deník je prapodivný plátek. V tabulce vlevo  najdete změřenou plochu četky, plochu Babiše a plochu reklamy. Ceník reklamy pro jistotu  dodávám také, ať je obraz úplný. S plochou reklamy se ze všech sledovaných plátků – Práva, Lidovek, Blesku, MF Dnes a Hospodářek stal Pražský deník smutným rekordmanem (na čemž má velký podíl Penny market, zdravíme)

mapa

Po téhle hodině jsme se skupinově rovnou vrhli ještě na úkol na následující hodinu, zatím je to pouze #inprogress, ale aspoň nástin toho, jak si vede zahraniční rubrika Pražského deníku. Hezky přehledně, s pomocí krásné mapy – čím tmavší barva, tím víc zpráv z konkrétní země jsme za ty dva týdny zachytili. Mapa sice ještě není kompletní, nemáme hotové všechny dny, ale rýsuje se to přinejmenším zajímavě.

383

Na Digital humanities začíná další epická bitva s eRkem, kterou část třídy prohrává už na začátku, část odpadá v průběhu bitvy a já odpadám pět minut před koncem hodiny, protože se mi nechce nainstalovat RColorBrewer a nějaká další důležitá záležitost, takže k vygenerování wordcloudu se nakonec do hodinové dřině vůbec nedostanu. I sednu nad to doma znovu, pustím si Youtube tutorial, vyzbrojím se vším možným i nemožným (krom historie z hodiny, která se neuložila, že #gratulki). Nakonec s eRkem bojuju celkem úspěšně, dobojujeme se až k poslednímu kroku – a ve chvíli, kdy zbývá poslední řádek, mi vypíše eRko chybu a wordcloud se už podruhé nekoná. Takže jako náplast si generuju dva jiné v nezměrně primitivnějších a uživatelsky přátelštějších nástrojích.

wordcloud

Ten kruhový je vygenerovaný přes facebookovou aplikaci (která hned po tom, co jsem si wordcloud uložila, přestala fungovat a už třetí den hlásí fatální chybu, pročež se začínám bát, abych za to se svým štěstím ještě nemohla já) a druhý wordcloud je vygenerovaný přes Wolfram alpha, který se od našeho posledního setkání naučil analyzovat facebook a během minuty vám vyhodí veškerá data, která se týkají vaší  FB stránky, včetně krásných grafů, se kterými jsme se mořili minulou hodinu. Nutno dodat, že naše grafy jsou podstatně hezčí než ty, které generuje Wolfram.

Oba wordcloudy by měly shrnovat nejčastěji používaná slova na mém FB profilu (takže data, respektive slova, která do cloudu šla, by měla být stejná), přičemž čím větší slovo v cloudu je, tím častěji bych ho měla používat a tím větší by mělo mít důležitost. Tak tolik k tomu, jak moc jsou wordcloudy spolehlivé. Teď ještě nějak vybojovat bitvu s eRkem, abych k těmhle cloudům mohla přidat ještě třetí, svůj vlastní, který předpokládám, bude zase vypadat úplně jinak.

Máte Facebook? A můžu ho vidět?

Ještě před pár roky by mě za to, že o víkendech od rána prohlašuju cosi o tom, že už by konečně mohlo bejt pondělí, abych mohla do školy, zavřeli někam do sklepa, abych neohrožovala společnost takovou jistě prudce nakažlivou a velmi nebezpečnou, ne-li dokonce smrtelnou chorobou. Když na SNM je těžký se do školy netěšit. Jednak se tu vyskytuje správná krevní skupina, která je ochotná místo dopoledního spánku vyrazit do muzea Lega a spolu s pětiletými dětmi tam jásat nad obří lego Hvězdou smrti a Millenium Falconem (odkud se vzala ta kostička lega, na kterou jsem pak doma šlápla, je mi dosud záhadou), jednak je tu jistota, že se na přednáškách bude vždycky rozebírat něco zajímavýho. 

Po úvodních Digital Humanities, které se pak rovnaly stále nekončícímu boji s mediány, průměry a především s eRkem, které vůbec není user-friendly a tu jeho údajnou pomalou učící křivku můžu jen potvrdit,  konečně tvoříme ty krásný barevný zamotaný grafy, co se mi tak líbily ještě než jsem se na Stunome vůbec dostala. A z facebookových grafů jsem nadšená natolik, že si ráno o hodinu přivstanu, abych si mohla ještě předtím, než vyrazím do práce, pohrát s grafy a zjistit, kteří z přátel jsou ústředními body celé mojí sítě na Facebooku, kdo se s kým zná, jaké stránky kdo lajkuje a tak dál a tak dál a do práce jsem nakonec stejně přišla pozdě. Kdo by rád zjistil, kde se v síti mých přátel nachází, jste vítáni, prosím jen dále tudy.

Graf_fb

Jste-li spolužáci z GJK, najdete se vpravo nahoře ve velké červené skupině. Nalevo od gymnázia jsou spolužáci z druhého stupně základky, nalevo od nich světlejší modrou jsou kolegové z AIESEC. Pod nimi se nachází růžová skupina spolužáků z prvního stupně základky. Pod nimi se najdou kolegové ze ZOO ve fialové skupině. Zelená skupina nahoře uprostřed obsahuje spolužáky z FHS, která směrem dolů přechází do skupiny kolegů z UniPrepu. Světle zelenou úplně dole jsou vyznačeni kolegové z redakce. V tmavě modré skupině napravo se najde Stunome crowd, ve vedlejší fialové kolegové horolezci. Ve světle modré úplně napravo sídlí rodina. Velký žlutý chumel nalevo dole jsou spolužáci z Itálie a Camerina. Pár osamělých barevných teček jsou pak moji „unikáti“, tedy přátelé, které s nikým nesdílím.stranky_graf

Další graf jsem vyzkoušela pro vizualizaci propojení facebookových stránek Film Aréna, Comingsoon.net, Červený koberec, filmový festival Karlovy Vary a stránku Morgana Freemana. Tenhle pavouk jednoduše zobrazuje, jaké stránky se navzájem lajkují.

twitter_graf

Třetí tentokrát twitterový graf se pak řídí heslem „čím tučnější, tím jsme si blíž“.

Inspirováni aférou Putna, Zeman a profesura (respektive spíš aférou kolem plakátu o katolických buznách), která byla mimo jiné hlavní příčinou toho, že se studenti z FHS během května a června báli zkoušek z historie ještě více než obvykle,  jsme byli na hodině Srovnávacích mediálních studií pověřeni sledováním dění kolem Haška, Sobotky a Babiše v tištěných médiích, od úterý do pátku. Naší skupině byl přidělen Pražský deník (děkuji Pražskému deníku, že díky němu znám téměř všechny trafiky v Praze).

Minulé úterý jsem tedy vyrazila do školy o chvíli dřív, abych stihla ještě zaběhnout do trafiky a noviny koupit. „Jóó, slečno, to my ale nevedem!“ Pomyslím si cosi o nedostatečném sortimentu zvolené trafiky, který mne donutí přejít přes nástupiště metra a vylézt schody na druhé straně, kde je další trafika. „Jóó, slečno…“  Trvá to ještě tři trafiky, než na Pražský deník v jednom zastrčeném a dost pochybném stánku narazím. Slečna za pultem se super otráveným výrazem vyhrabe z nějaké bedny jediný výtisk. Slavné vítězství (to ještě netuším, co mě čeká ve středu). Obdobným způsobem trávím následující dva dny hodinku denně, až v pátek už jdu coby znalec distribuční sítě Pražského deníku na jistotu, a  k zlosti pána za mnou (čímž se mu omlouvám) kupuji jediný výtisk. Jakou pak mám ve škole radost, když zjišťuju, že tohle kolečko obíhání trafik budu muset absolvovat ještě celý tenhle týden.

Expect the unexpected

Poprvé jsem se o Studiích nových médií dozvěděla víceméně náhodou ve druháku na bakaláři. V tu dobu to byla, vzhledem ke značně nejisté studentské existenci na FHS (tímto zdravím Evropské dějiny v kontextech), ještě velmi vzdálená budoucnost. Fajn, zajímavý obor, a stunome putovalo mezi záložky s oblíbenými stránkami a tím byla záležitost dalšího potenciálního studia vyřešena.

V prvním semestru třeťáku se, spolu se zlikvidováním posledních zkoušek (zdravím Společenské vědy v interdisciplinární perspektivě), černý mrak vykřičníků ohledně navazujícího studia nebezpečně přiblížil, což bylo hlavní příčinou několika večerů a nespočtu hrnků kafe strávených nad stránkami fakult a oborů, které by asi tak připadaly v úvahu. Tou dobou se stunome z kolonky „tohle by asi šlo“ přehouplo do kategorie „vysněná škola„. Přihlášky byly odeslány a úspěšně zaplaceny a mohla jsem se vrhnout na vysněnou novomediální bakalářku.

Přijímačky trochu naruší povodeň, nicméně spolu s kamarádem dorážíme včas a připravení se vrháme na test. Na druhé kolo dorážím po několika dnech s novomediálně zaměřenou literaturou už bez kamaráda, ale absolvuji pohovor a cestou domů už jen doufám, že to klapne. Dopisuju bakalářku, když dorazí dva úředně a tím pádem i trochu vyhlížející dopisy s razítky škol. Dvě rozhodnutí o přijetí, čímž stunome ztrácí dodatek „tak trochu nedosažitelná škola„, definitivně rozhodují, že se žádné prodlužování bakaláře „kdyby náhodou“ konat nebude a bakalářku ještě s mírným předstihem dokončuju a odevzdávám.

S úspěšným absolvováním bakaláře (zdravím všechny neplánovaně povinné státnice) a absolvováním zápisu, kdy poprvé vlastním vysokoškolský index se stunome z kategorie „vysněná škola“ přesouvá do kategorie „moje škola„. Zábava může začít.