Nu går det ännu lättare att hitta mönster i stora datamängder och skapa snygg grafik.
Har du sett någon snygg grafik på sistone? Den kan vara gjord med R. Mikael Forsberg kan berätta mer om succén för detta open-source-språk.
Mikael, du är konsult hos oss och gillar R. Varför då?
– För det första är det ett open-source-språk, vilket aldrig är fel. Sen är det skapat enbart för dataanalys vilket också känns helt rätt.
Vad kan R användas till?
– R kan användas överallt där man kan formulera en fråga som man tror kan besvaras med ett statistiskt underlag. Man kan till exempel ta reda på hur besökare beter sig på webbplatser genom att analysera loggar, eller hur ett nytt varumärke tas emot i sociala medier eller så vill en journalist processa offentlig data för att kanske hitta ett scoop.
Mikael Forsberg gillar att använda R för att hitta mönster i stora datamängder och sen enkelt visualisera dem..
Varför ökar intresset för R?
– Embryot till R föddes redan 1997 men det är de sista tre åren som intresset exploderat. R har idag det man letar efter när man växt ur till exempel Excel. Man vill ha en enkel och kraftfull open source-miljö att göra analyser i och hitta mönster i sin data. Dessutom har R en stor och levande community med allt från statistiker från universitetsvärlden till programmerare från industrin. Communityn levererar “R-paket” som kan användas för att göra analyser av allt från naturligt språk till att skapa fantastiska diagram och grafer. När man väl sett dessa informativa visuella lösningar så vill man gärna göra samma sak själv.
Finns det andra verktyg för just dataanalys?
– Javisst, några exempel är SAS, Stata och SPSS – inget av dem är dock open source. Det går också att använda programmeringsspråk som exempelvis Java och Python även om de inte är gjorda specifikt för dataanalys.
Har du några bra exempel?
– Här är en länk till en snygg och smart Visualisering över London som är gjord med R och paketet ggplot2. Alla från Google till Microsoft använder R idag. Här är en länk till en artikel i New York Times från 2009 som kan sägas vara starten för intresset kring R – både mitt och många andras. Här är den kända Facebook-vän-världskartan och här är en fin lösning som gjordes inför presidentvalet i USA. Andra mer konventionella grafer kan man hitta om man bildgooglar på just ggplot2 som är ett av de mest populära paketen för att visualisera data med R.