sourze.se

Datamining - framtidens hetaste yrke

Vi lever i ett informationssamhälle, med vad ska vi med all information till? Hur kan vi dra nytta av den, istället för att stressas och drunkna i bruset från informationsfloden som forsar fram?

Filosofen Theodore Zeldin lär ha sagt "What to do with too much information is the great riddle of our time.". Det ligger väldigt mycket i den utsagan. I dagens samhälle kan vi få nästan hur mycket information som helst, om vad som helst, när som helst. Det är inte bara mängden information som har ökat något oerhört de senaste 15 åren, även tillgängligheten har överträffat alla förväntningar. So far, so good. Men vad har vi för nytta av informationen? Har den berikat våra liv? Har informationen omvandlats till kunskap som kunnat användas till att förbättra samhället på något sätt? Det finns nog inget enkelt svar på dessa frågor, men något vi kan vara säkra på, är att vårt samhälle fortfarande är ganska dåligt på att utnyttja de enorma guldgruvor av information som omger oss. Man skulle kunna säga att det finns ett överflöd av guldgruvor i vårt samhälle, men vi saknar ordentliga verktyg för att kunna utvinna guldet.

Det tycks dock finnas en räddning, som har potential att revolutionera samhället och politiken, till det bättre. Det kallas datamining även på svenska och är ett relativt okänt begrepp hos allmänheten. Begreppet och området är relativt nytt och har vuxit i samma takt som databasteknologin har utvecklats. För den som inte vet vad den tekniska definitionen på en databas är, så kan man säga att det är en digital struktur att lagra information i, ungefär som tabeller med olika kolumner som innehåller olika typer av information. Ett excel-ark kan sägas vara en enkel typ av databas. Idag lagras exempelvis nästan all information på internet i databaser, så även denna text som du just nu läser. I princip alla myndigheter lagrar sin information i databaser, även om registrerarna själva många gånger är omedvetna om det. Låt oss återgå till datamining. Datamining handlar om strategier och metoder för att utvinna och sammanställa information ur databaser. Främst är det till för att kunna hitta samband och dra slutsatser, som är alltför svåröverskådliga att se och upptäcka med ett mänskligt öga.

Datamining är ett område som vuxit sig allt starkare, men har begränsat sig främst till naturvetenskapliga områden och till ekonomi och matematik. Linköpings universitet och Uppsala universitet är två exempel som har haft datamining som separata kurser, vilket skvallrar om nyttan med det. Det är desto mer sorgligt att det nästan är helt obefintligt inom politiken, samhällsvetenskapen och inom den offentliga sektorn. På våra svenska myndigheter och arkiv har vi ofantliga mängder offentlig information som är fri att använda på vilket sätt vi vill. Sedan flera år tillbaka lagras mycket av denna information i just databaser. Här finns oerhörda möjligheter att faktiskt använda oss av denna information och lära oss något av den.

Vad olika politiska och ekonomiska insatser ger för effekter i samhället har alltid var svårt och komplext att överblicka och debatten om vilka åtgärder som är mest effektiva dryftas decennie efter decennie, trots att informationen finns om vem som faktiskt har rätt. Genom att koppla ihop en mängd olicka nyckeltal så skulle man kunna hitta intressanta samband mellan exempelvis arbetslöshet och skattenivåer. Leder verkligen lägre skatter och ökade inkomstklyftor till att fler kommer i arbete? Vi har sannolikt redan svaret, men vi har inte kollat upp det än. Det räcker inte med att använda korttidsminnet och se hur det såg ut för nåt decennie sen, utan kanske hur det har sett ut de senaste hundra åren i olika kommuner, olika länder, etc.

Andra exempel på vad vi skulle kunna få reda på är hur väl alla ekonomers prognoser verkligen stämt överrens med verkligheten. Vi skulle kunna få reda på sambandet mellan skolmatsbudgeten och elevers prestationer i skolan. Hur tele och el-priserna utvecklats under offentlig sektor jämfört med privat sektor. Finns det något samband mellan segregation och marknadshyror? Kan man se något samband mellan totalsumman av de bidrag som betalas ut och köpkraften i landet? Kan man hitta nån oväntad, men betydande faktor som påverkar konjunkturväxlingarna. Vilken politisk insats genom tiderna har lett till kortast vårdköer? Allt detta och väldigt mycket mer, finns svar på i våra databaser, svart på vitt, och de eviga debatterna som folk börjar tröttna på skulle kunna redas ut en gång för alla.

Att datamining inte slagit igenom inom samhällsvetenskapen och politiken har sin förklaring. Det är dessvärre ingen bisyssla som vilken tjänsteman som helst kan ta till för att undersöka något förhållande. I regel krävs det både tekniska och matematiskt-statistiska kunskaper för att kunna ta fram dessa samband. Många ekonomer och naturvetare har den matematiska kunskapen med sig, och kan med hjälp av avancerade program använda sig av datamining i sin forskning, men sannolikt förekommer det ytterst sällan i det dagliga arbetet. Det är tyvärr ett område och en kunskap som är alltför tidskrävande och komplext för att bli en bisyssla. Ska vi kunna utvinna den information som vi sitter på, så måste det skapas heltidstjänster som jobbar med datamining. Jag ser framför mig både privata företag som utför olika uppdrag åt andra företag och myndigheter, och offentligt tillsatta tjänster som utreder samband, dels på uppdrag av myndigheter, men dels också som ett oberoende kritiskt organ som kan granska och utvärdera de politiska insatser som görs.

Oavsett vad som händer i framtiden så är datamining ett ord att lägga på minnet, och något som kommer att växa sig betydligt större än det är idag. Det är en naturlig fortsättning på informationssamhället, eller kanske början på en ny informations-era.

Sist men inte minst så kan man ju ibland tröttna på alla engelska låneord som kanske inte alltid säger så mycket, så ett svenskt ord vore därför önskvärt. Mining betyder ungefär "gruvdrift" på engelska, och datagruvdrift eller informationsgruvdrift låter ju lite krystat. Mitt förslag är "informationsanalys", för det är just vad det handlar om.


Om författaren

Författare:
Tobias Jeppsson

Om artikeln

Publicerad: 19 sep 2008 10:17

Fakta

Ingen faktatext angiven föreslå

Plats

Artikeln är inte placerad. föreslå

Dela artikeln

Länk till artikeln: