tisdag 19 februari 2013

Brage Pressarkivs databas

Man kan gör allt möjligt kul med data. I dag satte jag en liten stund på att ta fram lite siffror ur Pressarkivets databas. Det är ganska snabbt och enkelt att göra sökningar och knappa in resultaten på ett kalkylblad. Att beakta är att det är olika människor som indexerar olika tidningar, vilket kan göra små skillnader, men just vad gäller artikeltyp, klassificering och nivå torde normaliseringen vara god och skillnader i tolkning inte finnas. Vad gäller enskilda ämnesord skulle jag inte rekommendera dylika metoder, eftersom det finns för mycket alternativ och datan är inte lika entydig och klar. Ämnesorden fungerar närmast som hjälp vid sökning.

Men det är just på denna nivå som jag tycker skillnaderna är intressanta och kan vara relevanta. Det roliga är att åtminstone jag själv tycker de ganska väl motsvarar (eller bevisar) den fingertoppskänsla jag haft. Just ledare är förstås också en särskilt signifikant artikeltyp.

Lite mera exempel finns här (pdf).  Man kunde göra mycket mera. Öppen data är kul. Vi hoppas också få fram intressanta grejer på Pondus Open Data HackFest i början av mars, då det finns flera datakällor från olika finlandssvenska håll att använda.

Inga kommentarer:

Skicka en kommentar